2015 七月 18

要抓取的网页是gb2312的编码，但是脚本是在Linux下运行，使用utf-8，需要转码。
后来直接用转python的打印方法转换
import urllib
_str = urllib.urlopen(“http://www.xxxxx.com”).read()
get_data = u”%s” % _str.decode(‘gb2312’, ‘ignore’)

get_data就是utf-8格式。

一	二	三	四	五	六	日
« 6月				8月 »
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

simonzhang的家

有朋自远方来。。。。。

Daily Archives: 2015 年 7 月 18 日

网络抓取后转utf-8格式