求助!python爬虫

long_me 2020-10-15 05:05:51



def get_url(html):
url_list = []
pattern = re.compile("this.id,'(.*?)'", re.S)
ids = pattern.findall(html)
for id in ids:
url_list.append('http://www.wanfangdata.com.cn/details/detail.do?_type=conference&id=' + id)
return url_list



个人感觉是这一部分问题,但是不太懂,小白刚开始学习
...全文
144 6 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
long_me 2020-10-16
  • 打赏
  • 举报
回复
麻烦你了,谢谢了
long_me 2020-10-16
  • 打赏
  • 举报
回复
链接: https://pan.baidu.com/s/12sMGp7JkWT-WZ5hr97xk2A 提取码: befp
猿来是小贝壳 2020-10-16
  • 打赏
  • 举报
回复
给我源码,我给你改改,发你
long_me 2020-10-15
  • 打赏
  • 举报
回复
麻烦指导一下如何修改.我是刚开始学习.
猿来是小贝壳 2020-10-15
  • 打赏
  • 举报
回复
是soup获取文本时的错误,所以直接取[0],肯定会报错呀。。。
long_me 2020-10-15
  • 打赏
  • 举报
回复
https://blog.csdn.net/weixin_42565135/article/details/104266743 这是源码

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧