python开头不可见字符的处理

　　今天要处理一个由程序生成的文本文件，但是开头总有乱码。通过查看文件使用utf-8编码。直接用二进制打印。

for i in open("file.txt","rb"):
    print i

　　得到的乱码是“\xef\xbb\xbf”，处理方法很简单，直接截掉就可以了。

#### \xef\xbb\xbf
if i[:3] == "\xEF\xBB\xBF" :
      i = i[3:]

　　但是为什么会出现这个问题,到网上查了一下，是utf-8编码的BOM（Byte Order Mark）。UTF-8 BOM又叫UTF-8 签名,BOM对UFT-8没有用,主要为了支持UTF-16,UTF-32才加上。BOM就是方便编辑器识别。所以直接删掉也没有问题。

参考：
http://www.cnblogs.com/DDark/archive/2011/11/28/2266085.html

simonzhang的家