python,关于re.findall的正则表达式的问题,总是报错

大黄别着急 2014-07-20 01:23:09
我在做爬虫的时候,总是卡在这个地方:
p=re.compile(r'<td class="td-title"><a target=_blank href=/post-funinfo-5633147-1.shtml>[(.*?)](.*?)</a></td>')
括号里的正则表达式有什么问题吗?总是报错,每次报错的地方还都不一样,但错误总是:eof when scanning string literal,不知道为什么会在这里报这个错啊啊啊
...全文
383 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
ImN1 2014-07-21
  • 打赏
  • 举报
回复
看花了~ 把其中一个*换成+试试 findall使用的正则里面全部是*,就算不出错,结果也不是想象中那样的,至少要有可确定的部分+或{1,}
ImN1 2014-07-21
  • 打赏
  • 举报
回复
有[,但没有]
angel_su 2014-07-20
  • 打赏
  • 举报
回复
eof when scanning string literal是语法错误吧,可能那里的字符串结尾少了引号,照理说带词法分析的编辑器里应该会发现有不正常反亮的区块...
panghuhu250 2014-07-20
  • 打赏
  • 举报
回复
引用 楼主 moremorn 的回复:
我在做爬虫的时候,总是卡在这个地方:...... ......每次报错的地方还都不一样
???啊啊啊
大黄别着急 2014-07-20
  • 打赏
  • 举报
回复
准备学beautiful soup了。。。听说比正则表达式好用些。。。。
大黄别着急 2014-07-20
  • 打赏
  • 举报
回复
引用 2 楼 panghuhu250 的回复:
[quote=引用 楼主 moremorn 的回复:] 我在做爬虫的时候,总是卡在这个地方:...... ......每次报错的地方还都不一样
???啊啊啊[/quote] 不是出错的地方不一样,总是在target= 后面那个_bla这里高亮。。。。
lsjfdjoijvtghu 2014-07-20
  • 打赏
  • 举报
回复
这句没有问题 可能是字符串里没有匹配到这个正则的内容,报错了
大黄别着急 2014-07-20
  • 打赏
  • 举报
回复
不好意思,代码没贴好。。。
p=re.compile(r'<td class="td-title"><a target=_blank href=/post-funinfo-5633147-1.shtml>[(.*?)](.*?)</a></td>')

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧