python 正则表达式匹配网页内容

howema 2014-05-05 01:31:00
以下代码,从一个网页上匹配信息,为什么匹配不到联系人?其他的可以获取到
# -*- coding: cp936 -*-
import re
import time
import urllib2


def getInfoFromPage(pattern,page):
p = re.compile(pattern,re.M)
result = p.findall(page)
print result
return result


def getCompanyName():
url = 'http://china.machine365.com/Product/SDetails/9535604.html'
page = urllib2.urlopen(url)
data = page.read()
p1 = """(?<=<font style='color:White;font-size:14px'>).*(?=</font>)"""
companyName = getInfoFromPage(p1,data)

p2 = """(?<=<font>联系人: </font>).*(?=</div>

)"""
person = getInfoFromPage(p2,data)


p3 = """(?<=<li><span>电 话:</span>).*(?=</li>)"""
phone = getInfoFromPage(p3,data)

line = companyName[0] + ';' + person[0] + ';' + phone[0]
fd = open('info.txt','a')
fd.write(line)
fd.close()


getCompanyName()

...全文
185 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
ImN1 2014-05-05
  • 打赏
  • 举报
回复
这个应该写正则的时候看仔细了
howema 2014-05-05
  • 打赏
  • 举报
回复
粘贴了代码发现问题了 </div>后面还有隐形字符

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧