求教,关于python正则表达式的问题

xzjy789 2019-07-10 09:21:13
我在使用爬虫爬取网页源代码后,希望利用正则表达式提取出指定内容,具体情况如下:
网页源代码,其中红框内的文字是我要的内容

爬取网页的代码如下:
weburl="http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2019&issue=03&pykm=NNXB"

req=urllib.request.Request(url=weburl)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)


求教各位大神,如何爬取我要的内容?如果可以,请写出完整的代码,不要只写正则表达式,小白一个,谢谢各位
...全文
52 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
xzjy789 2019-07-10
  • 打赏
  • 举报
回复
引用 2 楼 weixin_45280381 的回复:
[quote=引用 楼主 xzjy789的回复:]我在使用爬虫爬取网页源代码后,希望利用正则表达式提取出指定内容,具体情况如下: 网页源代码,其中红框内的文字是我要的内容 爬取网页的代码如下:
weburl="http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2019&issue=03&pykm=NNXB"

req=urllib.request.Request(url=weburl)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)
求教各位大神,如何爬取我要的内容?如果可以,请写出完整的代码,不要只写正则表达式,小白一个,谢谢各位
现在没时间写哈哈[/quote] 大神我的意思没有表述清楚,能不能写成re.compile("")之类的格式?我只需要这个就可以,如果只有正则表达式我用的不太熟练
睿哥n 2019-07-10
  • 打赏
  • 举报
回复
引用 楼主 xzjy789的回复:
我在使用爬虫爬取网页源代码后,希望利用正则表达式提取出指定内容,具体情况如下:
网页源代码,其中红框内的文字是我要的内容

爬取网页的代码如下:
weburl="http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2019&issue=03&pykm=NNXB"

req=urllib.request.Request(url=weburl)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)


求教各位大神,如何爬取我要的内容?如果可以,请写出完整的代码,不要只写正则表达式,小白一个,谢谢各位
现在没时间写哈哈
睿哥n 2019-07-10
  • 打赏
  • 举报
回复
引用 楼主 xzjy789的回复:
我在使用爬虫爬取网页源代码后,希望利用正则表达式提取出指定内容,具体情况如下:
网页源代码,其中红框内的文字是我要的内容

爬取网页的代码如下:
weburl="http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2019&issue=03&pykm=NNXB"

req=urllib.request.Request(url=weburl)
response=urllib.request.urlopen(req)
content = response.read()
#获得系统的编码
type = sys.getfilesystemencoding()
#设置爬出内容的编码
content = content.decode(type)


求教各位大神,如何爬取我要的内容?如果可以,请写出完整的代码,不要只写正则表达式,小白一个,谢谢各位
建议:用bs4会好写点 第三方库 soup.find_all("a")

37,721

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧