美国信息交换标准码(ASCII)是一个7位的编码标准,包括26个小写字母、26个大写字母、10个数字、32个符号、33个控制代码及空格,总共128个代码。由于计算机通常用“字节”(byte)这个8位的存储单位来进行信息交换,因此不同的计算机厂商对ASCII进行了扩充,增加了128个附加字符,它们的值在127以上的部分是不统一的。例如ANSI、Symbol、OEM等字符集,其中ANSI是系统预设的标准文字存储格式。表1-1列出了用十六进制数(Hex)与十进制数(Dec)表示的部分常用字符的ASCII值。

Unicode是ASCII字符编码的一个扩展,只不过在Windows中用2个字节对其进行编码,也称为“宽字符集”(Widechars)。Unicode是一种双字节编码机制的字符集,使用0~65535之间的双字节无符号整数对每个字符进行编码。在Unicode中,所有的字符都是16位,包括所有的7位ASCII码都被扩充为16位(注意,高位扩充的是零)。例如,字符串“pediy”的ASCII码是:
70h 65h 64h 69h 79h
其Unicode码的十六进制是:
0070h 0065h 0064h 0069h 0079h
Intel处理器在内存中,一个字存入存储器要占有相继的2个字节,这个字存放时就按Little-Endian方式存入,即低位字节存入低地址,高位字节存入高地址,如图所示。
