• 摘要视图
  • 目录视图

Python Unicode

Python源代码的编码

当在源码中使用了任何中文字符,包括变量中或注释中存在的中文字符,需要指定源码的字符集,如果不指定默认为ascii编码。如:

[python]var = ‘abc’ #这是注释
print var[/python]

执行时会报错

SyntaxError: N[……]

>> 阅读全文…

Windows文本文件编码(ANSI和Unicode)

Unicode 和 字节序

Unicode有UCS-2和UCS-4两种,分别使用2个字节、4个字节编码一个字符。通常说的Unicode都是指UCS-2。由于一个字符有多个字节,所以Unicode在传输和存储时就存在高位字节和低位字节的顺序问题,即字节序问题,由此分为小端模式(little endia[……]

>> 阅读全文…