为了搬家,打算用Python写一个解释LOFTER XML的程序,出现如下错误
这说明XML有问题。因为如果XML有错,解释器就会不工作 W3C如是说 :
果不其然,放到chrome解释,就报错
This page contains the following errors:
error on line 840 at column 23: Input is not proper UTF-8, indicate encoding !Bytes: 0x0B 0xE5 0x8C 0x85
Below is a rendering of the page up to the first error.
查了下XML文件,840行23位置是CDATA区段,CDATA语法也没有问题呀。
网上搜下相关资料。一个帖子引起了我的注意: Invalid Character inside CDATA ,该帖子好像是说CDATA里面的文本并不是任何字符都可以的。如果超出UTF-8的字符集就会出错。英文太烂了,看不太懂。。。
而且有意思的是,这个帖子是14年前的。真有历史感
//////////////////////////////////////////////////////////////////////////
这说明不是语法问题,而是CDATA里面的内容有问题。
果真,在CDATA段里面,发现了2个不知道是什么的符号
把他们删了。现在就没有问题了。
python可以愉快的进行了。
这是搬家的一个小插曲。解决了小问题,却很开心。还有今天论文自己查重过了。paperpass浪费了4次,后知后觉的发现其实它根本就不准。直接交给学校去知网查吧。
没有评论:
发表评论
谢谢您的留言^_^