type
status
date
slug
summary
tags
category
icon
password
Sub-item
Last edited time
Dec 16, 2023 08:01 AM
Parent item
领域
基本概念
- 二进制数据。计算机能够识别的数据,以字节为单位,一个字节有8位。例如:
01101110 10110001 …
。
- 字符。人类能够识别的符号。例如:符号”1“表示数字1, 符号A表示英文大写字母,符号”笔记“表示中文字。
- 字符集。由一组字符组成的字符集合。字符集中的字符一般具有相同的属性,比如中文字符集里面全是中文字符,ASCII字符集中包含字母数字及符号等。
- ASCII字符集。美国标准信息交换代码,包括字母、数字、常用符号和不可见的操作符号等128个符号,用一个字节表示码点,并且码点和位模式是同一个二进制数据。由于ASCII字符集定义的较早,后来定义的规范都会与他兼容。
- GB18030字符集。全称《 信息技术中文编码字符集》,是中文字符集标准。最新版本是GB18030-2022。GB18030有自己的码点和位模式(内存编码)。
- Unicode字符集。全称通用多字节编码字符集,把全世界所有语言的字符进行统一编码。Unicode的前128个字符和ASCII兼容。Unicode的位模式(内存编码)方案是UTF-8。
- UTF-8编码。UTF-8编码是可变长的,码点小的字符编码后字节少,码点大的字符编码后字节大。