python正则表达式匹配问题

sqsowen 2014-10-21 08:30:38
用python写了个提取网页的小程序,代码如下:
# encoding:UTF-8
import sys
import re
from urllib2 import Request, urlopen, URLError, HTTPError

def get_packet(url):
packet = urlopen(url)
content = packet.read()
return content
def get_data(packet):
xiangmu = '~'
tmp = re.search(r'<a href=.*',packet)
if tmp is not None:
xiangmu = tmp.group().strip()
print xiangmu
if __name__=='__main__':
url = 'http://stock.finance.qq.com/corp1/cbsheet.php?zqdm=600787&type=2014'
packet = get_packet(url)
if packet =='~':
sys.exit(0)
get_data(packet)

运行后只打印了一部分含有“<a href=.*”的文本,有些含有同样字符的文本没有打印,是什么原因呢?
...全文
103 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
sqsowen 2014-10-22
  • 打赏
  • 举报
回复
引用 1 楼 angel_su 的回复:
search只能找出一个匹配,试试findall...
现在另一个问题出来了,打印出来的是\xb8\xba这些字符,显示不了中文啊
sqsowen 2014-10-22
  • 打赏
  • 举报
回复
用search打印出来的,也不止一个的,不过用了findall打印出来了好多。多谢指点
angel_su 2014-10-21
  • 打赏
  • 举报
回复
search只能找出一个匹配,试试findall...

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧