【数据编解码】字符集和字符编解码
🏭【数据编解码】字符集和字符编解码
2021-7-2
| 2023-12-16
0  |  0 分钟
type
status
date
slug
summary
tags
category
icon
password
Sub-item
Last edited time
Dec 16, 2023 08:01 AM
Parent item
领域

基本概念

  • 二进制数据。计算机能够识别的数据,以字节为单位,一个字节有8位。例如:01101110 10110001 …
  • 字符。人类能够识别的符号。例如:符号”1“表示数字1, 符号A表示英文大写字母,符号”笔记“表示中文字。
  • 字符集。由一组字符组成的字符集合。字符集中的字符一般具有相同的属性,比如中文字符集里面全是中文字符,ASCII字符集中包含字母数字及符号等。
  • 位模式(内存编码)码点在内存中编码值。因此,编码也就是将字符对应的码点转换为内存编码二进制数据的过程。用于内存中存储处理和网络传输
  • ASCII字符集。美国标准信息交换代码,包括字母、数字、常用符号和不可见的操作符号等128个符号,用一个字节表示码点,并且码点和位模式是同一个二进制数据。由于ASCII字符集定义的较早,后来定义的规范都会与他兼容。
    • notion image
  • GB18030字符集。全称《 信息技术中文编码字符集》,是中文字符集标准。最新版本是GB18030-2022。GB18030有自己的码点和位模式(内存编码)。
    • notion image
  • Unicode字符集。全称通用多字节编码字符集,把全世界所有语言的字符进行统一编码。Unicode的前128个字符和ASCII兼容。Unicode的位模式(内存编码)方案是UTF-8。
    • notion image
  • UTF-8编码。UTF-8编码是可变长的,码点小的字符编码后字节少,码点大的字符编码后字节大。

编码转换

notion image
 
计算机基础
  • 数据编解码
  • 【流控和削峰】漏桶算法和令牌桶算法 【Linux常用命令】网络相关命令
    目录