编程与编码：信息世界的文字转换

UTF8

GB18030

需积分: 9 104 浏览量更新于2024-07-20 收藏 720KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"《编程与编码》byJimbowhy 是一篇关于编码问题的文章，作者讨论了从计算机硬件逻辑到文字信息存储的各种编码形式，包括点阵文字和现代的矢量图形字体技术，如TrueType和FreeType。文章还提到了显示器的分辨率（DPI）及其对文字显示的影响。" 在计算机科学领域，编码是至关重要的，因为计算机本身只能理解和处理二进制数据。在《编程与编码》中，作者Jimbowhy深入探讨了如何将文字信息转化为计算机能识别的数值形式。早期的文字表示方法是点阵文字，通过在屏幕上定义矩形区域并标记不同点位的颜色来创建字形。例如，字母"A"和汉字"中"可以用点阵表示，用0和1代表不同的颜色状态。点阵文字虽然直观，但随着技术的发展，更高效的表示方式被引入，如TrueType和FreeType等矢量字体。这些字体使用数学公式定义字符形状，可以无损地放大或缩小，解决了点阵文字在不同大小下清晰度下降的问题。在计算机内部，每个字符都由一个特定的数值标识，称为字符编码。文章也提到了显示器的DPI（每英寸点数）概念，它是衡量显示器精度的重要指标。更高的DPI意味着在相同面积内可以显示更多的细节，文字也会更清晰。例如，在96DPI的系统上，特定字号的字体会有相应的像素尺寸。了解DPI对于理解和优化文本在屏幕上的显示非常重要。作者通过举例解释了字符大小与DPI之间的关系，比如在96DPI的系统上，特定大小的字体可以显示多少个字符，以及不同DPI下字体的相对尺寸。这有助于开发者理解如何在不同分辨率的设备上适当地呈现文本。此外，文章还提及了字符占用内存的问题，这也是编码发展的一个驱动力。通过数值对应字符的方式，可以有效地管理和使用内存，使得在需要显示字符时只需查找对应的数值即可。《编程与编码》涵盖了从基本的字符编码原理到现代字体技术的广泛内容，对理解计算机如何处理和显示文本信息提供了深入的见解。无论对于初学者还是经验丰富的开发者，这篇文章都是理解编码问题的宝贵资源。

资源详情

资源推荐

细说Unicode

历史上,有两个独立的,创立单一字符集的尝试。一个是国际标准化组织(ISO)的ISO10646项目，于

1993年发布，简称UCS，全称UniversalMultipleOctetCodedCharacterSet。另一个是由(一开始大

多是美国的)多语言软件制造商组成的协会组织的Unicode项目。幸运的是,1991年前后,两个项目的参

与者都认识到,世界不需要两个不同的单一字符集.它们合并双方的工作成果,并为创立一个单一编码表

而协同工作。两个项目仍都存在并独立地公布各自的标准,但Unicode协会和ISO/IECJTC1/SC2都同

意保持Unicode和ISO10646标准的码表兼容,并紧密地共同调整任何未来的扩展。参考Olle

Järnefors这篇文章《ShortoverviewofISO/IEC10646andUnicode》。

在Unicode系统内，每一个符号都有一个名字，以全大写字母表示，如基本拉丁字母A的Unicode名

字就是LATINCAPITALLETTERA，连字符就叫做HYPHENMINUS，码值U+002D。Unicode的出

现，使得世界上大多数语言符号都实现电子化，当然作为最多文字符号的中国自然是最值得高兴的事，

你看来☯这样国粹都可以当作字符来编码，这还得感谢那批在为标准化工作的专业人员。这些多功能字

符定义在U+2600U+26FF，通过码表可以查看到。

开始UCS方案使用2字节编码，如U+0032表示空格，U+0041表示字母A，U+0061表示字母a，这

种U+形式的值就是码值USV(UnicodeScalarValues)。为了保证今后编码空间不被填满，又定义了一

个4字节的新标准UCS4，前者就相应称作UCS2。UCS2使用高8位作为行编码，低8位为列编码，

形成一个256行256列的逻辑数据结构。这样0行中的256个列空间就用来存储标准的ISO/IEC88591

编码，这时ANSII字符是以两个字节进行存储的，内存消耗原来的2倍。对于UCS4方案，指定第一

字节的最高位设置为0，用第一字节剩余的7位表示2^7=128分组，第二个字节表示2^8=256平面。余

下两字节保持UCS2相同的逻辑结构，因此可以兼容。这样0组0平面上就存放有UCS2的完整编

码，它又称为基本多语言平面BMP(basicmultilingualplane)。收录有21204个在中、日、韩使用的象

形字(ideographiccharacters)，有6656个韩国象形象声字(morphogramsandsyllabograms)，总字符

接近极限容量34203个。第二个平面就称为增补平面SMPSupplementaryPlanes，第三个平面就是象

形字增补平面SIP(SupplementaryIdeographicPlane)。

剩余14页未读，继续阅读

Jimbo

粉丝: 66
资源: 78

编程与编码：信息世界的文字转换

JAVA高质量编程之编码篇 - 编码基本规范及实例讲解.ppt

java串口通讯 短信测试 comm编程 PDU编码 进制转换 AT命令

STM32PID算法编程驱动编码器电机

stm32f103 编码器 编程

编程实现赫夫曼编码的流程

学成在线的编程部分的编码怎么写

根据信息论与编码的知识，用matlab编程实现127的算数编码与算数译码

matlab编程实现Shannon编码

python编程实现Shannon编码、Huffman编码。 输入：信源概率分布。 输出：Shannon码、Huffman码，平均码长，编码效率。

c++编程实现哈夫曼编码算法

信息论与编码课程设计matlab

设计并编程实现霍夫曼算法，计算编码效率，以右图所示的输入图像为例进行霍夫曼编码测试，给出实验结果

用python编程实现Shannon编码,Huffman编码 输入为某信源概率分布按概率输入,输出为Shannon码和Huffman码,平均码长和编码效率

python编程实现Shannon编码、Huffman编码。 手动输入信源概率分布。 输出：Shannon码、Huffman码，平均码长，编码效率。

写一篇信息论与编码课程设计

网络编程计算器mfc编码

编程实现Shannon编码、Huffman编码。 输入：信源概率分布。 输出：Shannon码、Huffman码，平均码长，编码效率。

用python编程实现Shannon编码,Huffman编码 输入为按概率输入的信源矩阵,输出为Shannon码和Huffman码,平均码长和编码效率

AVAGO H9701编码器 编程代码

最新资源

java串口通讯短信测试 comm编程 PDU编码进制转换 AT命令

stm32f103 编码器编程

python编程实现Shannon编码、Huffman编码。输入：信源概率分布。输出：Shannon码、Huffman码，平均码长，编码效率。

用python编程实现Shannon编码,Huffman编码输入为某信源概率分布按概率输入,输出为Shannon码和Huffman码,平均码长和编码效率

python编程实现Shannon编码、Huffman编码。手动输入信源概率分布。输出：Shannon码、Huffman码，平均码长，编码效率。

编程实现Shannon编码、Huffman编码。输入：信源概率分布。输出：Shannon码、Huffman码，平均码长，编码效率。

用python编程实现Shannon编码,Huffman编码输入为按概率输入的信源矩阵,输出为Shannon码和Huffman码,平均码长和编码效率

AVAGO H9701编码器编程代码