• 摘要视图
  • 目录视图

Python Unicode

Python源代码的编码

当在源码中使用了任何中文字符,包括变量中或注释中存在的中文字符,需要指定源码的字符集,如果不指定默认为ascii编码。如:

[python]var = ‘abc’ #这是注释
print var[/python]

执行时会报错

SyntaxError: N[……]

>> 阅读全文…

Windows文本文件编码(ANSI和Unicode)

Unicode 和 字节序

Unicode有UCS-2和UCS-4两种,分别使用2个字节、4个字节编码一个字符。通常说的Unicode都是指UCS-2。由于一个字符有多个字节,所以Unicode在传输和存储时就存在高位字节和低位字节的顺序问题,即字节序问题,由此分为小端模式(little endia[……]

>> 阅读全文…

(转载)字符编解码的故事(ASCII,ANSI,Unicode,Utf-8区别)

声明:转载自“简单生活——Kevin Yang的博客

以诙谐幽默的笔法将字符编码的发展历史娓娓道道,内容详尽,囊括了ASCII码、ASCII码扩展、全角半角、GB2312、GBK、UNICODE、UTF-8等要点。

—————————————[……]

>> 阅读全文…