python 3 用xpath解析html

tianke0711 2016-06-07 03:00:29

你好！我想用python 3 xpath解析一段html ，比如如下：
<html><body>
<div class ＝“[size=12px]item”>
<ul>
<li class="item-0"><a href="link1.html">first item</a></li>
<li class="item-1"><a href="link2.html">second item</a></li>
<li class="item-inactive"><a href="link3.html">third item</a></li>
<li class="item-1"><a href="link4.html">fourth item</a></li>
<li class="item-0"><a href="link5.html">fifth item</a></li>
</ul>
</div>
<div class = "movie">
<div class = "name" >
<ul>[url=http://]
<li class="item-0"><a href="link1.html">movie a</a></li>
<li class="item-1"><a href="link2.html">movie b</a></li>
<li class="item-inactive"><a href="link3.html">movie c</a></li>
<li class="item-1"><a href="link4.html">movie d</a></li>
</ul>
</div>
</div>
</body>
</html>

我个人只想要这一段html：
<div class = "movie">
<div class = "name" >
<ul>
<li class="item-0"><a href="link1.html">movie a</a></li>
<li class="item-1"><a href="link2.html">movie b</a></li>
<li class="item-inactive"><a href="link3.html">movie c</a></li>
<li class="item-1"><a href="link4.html">movie d</a></li>
</ul>
</div>
</div>

我用的是以下方法：
import requests
page = requests.get('........html')
tree = html.fromstring(page.content)
body = tree.xpath('//div[contains(@class, "movie")]')
print('body:', body)

但是我的返回值是［］

请高手的你帮忙替我解决一下（必须用xpath, 不能用其他方法），在此表示感谢。

...全文