Windows文本文件编码(ANSI和Unicode)
Unicode 和 字节序
Unicode有UCS-2和UCS-4两种,分别使用2个字节、4个字节编码一个字符。通常说的Unicode都是指UCS-2。由于一个字符有多个字节,所以Unicode在传输和存储时就存在高位字节和低位字节的顺序问题,即字节序问题,由此分为小端模式(little endia[……]
Unicode有UCS-2和UCS-4两种,分别使用2个字节、4个字节编码一个字符。通常说的Unicode都是指UCS-2。由于一个字符有多个字节,所以Unicode在传输和存储时就存在高位字节和低位字节的顺序问题,即字节序问题,由此分为小端模式(little endia[……]
声明:转载自“简单生活——Kevin Yang的博客”
以诙谐幽默的笔法将字符编码的发展历史娓娓道道,内容详尽,囊括了ASCII码、ASCII码扩展、全角半角、GB2312、GBK、UNICODE、UTF-8等要点。
—————————————[……]