在python中写xml出现错误?格式不匹配?

机器学习之禅 2014-05-06 01:41:02
if os.path.exists(result_filename+'.xml'):
xml_dom=xml.dom.minidom.parse(result_filename+'.xml')
其中,91,92行就是上面两行
错误提示到这句出现问题
Traceback (most recent call last):
File "<iostream>", line 365, in <module>
File "<iostream>", line 92, in saveData
File "/data/icrawler/webCrawler/jython/Lib/xml/dom/minidom.py", line 1924, in parse
return _do_pulldom_parse(pulldom.parse, (file,),
File "/data/icrawler/webCrawler/jython/Lib/xml/dom/minidom.py", line 1908, in _do_pulldom_parse
toktype, rootNode = events.getEvent()
File "/data/icrawler/webCrawler/jython/Lib/xml/dom/pulldom.py", line 275, in _slurp
self.parser.parse(self.stream)
File "/data/icrawler/webCrawler/jython/Lib/xml/sax/drivers2/drv_javasax.py", line 146, in parse
self._parser.parse(JyInputSourceWrapper(source))
File "/data/icrawler/webCrawler/jython/Lib/xml/sax/drivers2/drv_javasax.py", line 59, in fatalError
self._err_handler.fatalError(_wrap_sax_exception(exc))
File "/data/icrawler/webCrawler/jython/Lib/xml/sax/handler.py", line 38, in fatalError
raise exception
xml.sax._exceptions.SAXParseException: file:///data/icrawler/webCrawler/jinshan_hot.xml:4754:22: XML document structures must start and end within the same entity.


我查看了xml文档,如下,没有发现问题。请问这是怎么回事 ?
<?xml version="1.0" encoding="utf-8"?>
<document>
<item>
<title><![CDATA[奥朗德访美 奥巴马拿爱女喻英法称绝不二选一]]></title>
<link><![CDATA[http://news.ifeng.com/world/detail_2014_02/13/33769637_0.shtml#_jinshan]]></link>
<description><![CDATA[法国总统奥朗德10日开始对美国进行国事访问,整个日程为期三天。这是法国国家元首18年来对美国的首次国事访问。2007年11月6日,法国时任总统萨科齐对美国进行正式访问,是2001年以来法国总统对美国的首次正式访问。
法新社报道,奥巴马高规格欢迎奥朗德,以“颂扬与美国最古老的同盟关系”。专题综合新华、王裳10日访杰斐逊故居同坐空军一号待遇不一般美国总统奥巴马10日下午陪同奥朗德访问美国第三任总统托马斯]]></description>
<category><![CDATA[热门]]></category>
<time><![CDATA[1392256980]]></time>
<referer><![CDATA[信息时报]]></referer>
<image><![CDATA[]]></image>
<itemid><![CDATA[33769637]]></itemid>
</item>
<item>
<title><![CDATA[安徽男子做裁缝近30年不改行 供女儿读完大学买两套房]]></title>
<link><![CDATA[http://news.ifeng.com/society/2/detail_2014_02/13/33769616_0.shtml#_jinshan]]></link>
<description><![CDATA[还靠手艺供女儿读完大学,店铺小“名声大”,很多老顾客开车来光顾周勇晨报讯 你见过持有缝纫证的裁缝吗?在霍山路安农大附近,一间不足5平米的平房里,有一位持有颁发于1985年缝纫证的老裁缝。近30年来,这位老裁缝>凭着手艺买了两套住房,还供女儿读完了大学。老人的技术有网友用“天衣无缝”来形容。缝纫证颁发于1985年说起裁缝,恐怕很多年轻人都已经很陌生了。在霍山路安农大北门附近,一间不足5平米的平房里,今]]></description>
<category><![CDATA[热门]]></category>
<time><![CDATA[1392256980]]></time>
<referer><![CDATA[江淮晨报]]></referer>
<image><![CDATA[]]></image>
<itemid><![CDATA[33769616]]></itemid>
</item>
...全文
153 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
ForestDB 2014-05-07
  • 打赏
  • 举报
回复
XML document structures must start and end within the same entity.
mwd小苗 2014-05-07
  • 打赏
  • 举报
回复
应该有结束的吧。。</document>
iasky 2014-05-07
  • 打赏
  • 举报
回复
<document>有结束的么?</document>
angel_su 2014-05-07
  • 打赏
  • 举报
回复
xml.sax._exceptions.SAXParseException: file:///data/icrawler/webCrawler/jinshan_hot.xml:4754:22:... 红色部分应该是标出错误在文件当中的位置,自己查看是啥问题
机器学习之禅 2014-05-07
  • 打赏
  • 举报
回复
引用 2 楼 iasky 的回复:
<document>有结束的么?</document>
引用 1 楼 snmr_com 的回复:
</document> ?
引用 4 楼 ForestDB 的回复:
XML document structures must start and end within the same entity.
都有的 因为文档太长了 我没全贴上 就截了一段
ImN1 2014-05-06
  • 打赏
  • 举报
回复
</document> ?

37,719

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧