Python爬虫在用string匹配时含有 该如何弄

武易文 2018-01-11 09:20:58

如图,且发生换行,该如何做,跪求大神
...全文
5013 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
sanGuo_uu 2018-01-12
  • 打赏
  • 举报
回复
import re
 
txt="""
<tr>
<td colspan=10 class="td-left" nowrap><b>品牌:苹果-AP
    日期:2018-01-10
</b></td>
</tr>
"""

patt=re.compile(r'<b>(.*?)</b>',re.S)
res=patt.findall(txt)
resTxt=''
if len(res)>0:
	resTxt=res[0].replace('\n','').replace(' ','')

print(resTxt)
武易文 2018-01-12
  • 打赏
  • 举报
回复
而且,图里面的tr应该是td的子节点吧
武易文 2018-01-12
  • 打赏
  • 举报
回复
就是按照图片b中的string,使用find_all()函数匹配找到该tag
AlbertS 2018-01-12
  • 打赏
  • 举报
回复
你想提取什么信息,给个具体的例子?
sanGuo_uu 2018-01-12
  • 打赏
  • 举报
回复
看不懂你在纠结什么
武易文 2018-01-12
  • 打赏
  • 举报
回复
问题用replace不能只改string的一部分,如果要改的话只能改源文件,而re.sub改的只是输出结果,好头疼
oyljerry 2018-01-11
  • 打赏
  • 举报
回复
string用replace等替换干扰字符

37,741

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧