在计算机程序设计中,字符编码是一种方法或算法,用于寻找字符、字形或符号的通常数字表示形式。在计算机中使用字符编码是必要的,因为计算机内存中和计算机可读媒体上的信息是以位或数字序列的形式存储的。这就要求使用一...
在计算机程序设计中,字符编码是一种方法或算法,用于寻找字符、字形或符号的通常数字表示形式。在计算机中使用字符编码是必要的,因为计算机内存中和计算机可读媒体上的信息是以位或数字序列的形式存储的。这就要求使用一种编码方法,将用于显示或人类可读输出的非数字字符转换成计算机可以操作的形式。在更具体的应用程序中,由web浏览器读取的超文本标记语言(HTML)文档可以定义它们使用的字符编码类型,以便让浏览器知道哪些特定的字符在文档中显示信息时要使用的字符集。有几种编码方案正在使用中,尽管其中许多专有和传统集正在慢慢被Unicode®编码标准所取代。在计算机出现的早期,当内存空间有限时,英语字母表的基本字符(包括标点符号和数字)存储在7位序列中,可以容纳128个不同的字符。在最初的方案中,每个7位字节代表英语字母表中的一个字符,按顺序编号。这种字符编码是高效的,最终被标准化和用于生产的大多数计算机中。虽然编码系统演变成Unicode®编码标准,但概念保持不变。即语言中的每一个字符都与一个大的标准字符集中的一个数字直接相关,而这个数字是计算机用来存储、处理和索引的其他类型的字符编码是基于不同的原因而开发的有些是专门针对英文字母表设计的,只用于文本的,只将字符映射到7位序列上,然后将它们分散到8位字节(或八位字节)上。这样可以使每个八位字节节省1位,有效地将字符编码用作一种压缩类型。其他编码方案试图提供有关字符的基本信息,然后提供附加字符来表示在用不同语言编写时可以使用的特殊重音符号,尽管这些字符在很大程度上被更简单的一对一编码方法所抛弃HTML文档中,字符编码与更广泛的概念大致相同,只是定义的编码包含了整个字符集。这不仅对外语很重要,而且对于使用科学或数学的特定符号(并非所有字符集都存在)的文档都很重要。它也很有用用于使用标点符号和其他符号,这些符号可能不存在或在不同的编码方案中映射。未正确定义非标准字符编码的文档可能显示不正确,或填充了无意义的字符和占位符,而不是可读信息
-
发表于 2020-08-07 01:53
- 阅读 ( 1322 )
- 分类:电脑网络