社区
脚本语言
帖子详情
python 抓取动态网页的问题
sunman1982
2009-04-17 11:35:11
hello 大家好, 小弟是python新手, 最近遇到一个问题,查了很多地方不知道怎么解决,
上来请教下大家, 例如下面这个网页:
http://stockhtm.finance.qq.com/hcenter/index.htm#
我想取得上面的股票信息,可是网页是动态的,上面的数据用 urllib 抓不回来,
不知道这种情况该怎么解决呢? 按理说, 数据已经在本地了。
...全文
1187
13
打赏
收藏
python 抓取动态网页的问题
hello 大家好, 小弟是python新手, 最近遇到一个问题,查了很多地方不知道怎么解决, 上来请教下大家, 例如下面这个网页: http://stockhtm.finance.qq.com/hcenter/index.htm# 我想取得上面的股票信息,可是网页是动态的,上面的数据用 urllib 抓不回来, 不知道这种情况该怎么解决呢? 按理说, 数据已经在本地了。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
13 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
sharp_future
2009-06-26
打赏
举报
回复
用正则表达式吧
xueshi
2009-06-22
打赏
举报
回复
用python的cPAMIE模块写
它获取网页的源代码是 动态生成后的代码
mrshelly
2009-06-20
打赏
举报
回复
http://stockqt.gtimg.cn/cgi-bin/hcenter/q?v=1&id=0&t=003&r=3791554520
http://stockqt.gtimg.cn/cgi-bin/hcenter/q?v=1&id=1&r=4866310788
梦无痕123
2009-06-19
打赏
举报
回复
gz
kingsonchen
2009-04-22
打赏
举报
回复
抓下来后还需要用正则把数据分离出来的。
到http://www.lamp9.cn/python.html 找下,也许有你想要东西。
sharp_future
2009-04-21
打赏
举报
回复
楼主需要在python上加点东西,做起来就简单了。
jquery在做html内容提取,分析的时候很方便。而python做类似的工作就麻烦一点,原来我都是用正则表达式或者HtmlParser的。
两者用着都不是太爽,今天发现了一个好东西 pyquery ,一个类似jquery的python库。
摘抄一段使用说明
>>> from pyquery import PyQuery as pq
>>> from lxml import etree
>>> d = pq("<html></html>")
>>> d = pq(etree.fromstring("<html></html>"))
>>> d = pq(url='http://google.com/')
>>> d = pq(filename=path_to_html_file)
Now d is like the $ in jquery:
>>> d("#hello")
[<p#hello.hello>]
>>> p = d("#hello")
>>> p.html()
'Hello world !'
>>> p.html("you know <a href='http://python.org/'>Python</a> rocks")
[<p#hello.hello>]
>>> p.html()
'you know <a href="http://python.org/">Python</a> rocks'
>>> p.text()
'you know Python rocks'
简单吧,安装也很简单
下载
http://pypi.python.org/packages/source/p/pyquery/pyquery-0.3.tar.gz
解压缩
python setup.py install
就可以了,可能要安装ezsetup
现在的版本是0.3,还有一些jquery的东西没有实现,比如:radio,:password,以及一些ajax的功能,但是已经够用了,强烈推荐。
赶紧试试吧。
wwwljc
2009-04-20
打赏
举报
回复
我也用过python抓取动态网页内容的程序。
实现起来还是很简单的。
主要是通过urllib.urlopen()函数来实现。
你可以试试这种方式
chg_lele
2009-04-20
打赏
举报
回复
来学习的!
tony_413
2009-04-20
打赏
举报
回复
mark 接分
duzif
2009-04-18
打赏
举报
回复
DIVE INTO PYTHON中有一章专门讲解对html的处理,相信对你会有帮助
首先你要分析网页中的股票信息放在什么标签中
然后重载unknown_endtag(self, tag),unknown_starttag(self, tag, attrs)等方法提取数据
lixq2000
2009-04-18
打赏
举报
回复
路过学习
zhanglongnihao
2009-04-18
打赏
举报
回复
利用HTMLParser。 现用urlopen打开,在利用自己编写的tag解析函数来解析某一固定块
我也不知道这个方法可不可行,以前在某一本书上看到利用这种方法获得网页的天气信息。
king6o60
2009-04-17
打赏
举报
回复
看它js脚本,分析需要哪些参数,将该js架设在自己的服务器上,利用分析所得的参数来获取。
总的来说是比较麻烦的事情。
python
抓取
天气并分析 实例源码
Python
代码
抓取
获取天气预报信息源码讲解。这是一个用
Python
编写
抓取
天气预报的代码示例,用
python
写天气查询软件程序很简单。这段代码可以获取当地的天气和、任意城市的天气预报,原理是根据url找到网站截取相应的数据展现。
python
抓取
广州天气并分析 实例源码
python
简单爬虫
抓取
网页
内容实例
一个简单的
python
示例,实现
抓取
嗅事百科 首页内容 ,大家可以自行运行测试
Python
抓取
动态
网页
数据基础知识
抓取
动态
网页
数据与
抓取
静态
网页
数据有所不同,因为
动态
网页
的内容通常是通过JavaScript
动态
加载的,而不是直接嵌入在HTML中。因此,传统的HTTP请求(如requests库)可能无法直接获取到完整的数据。
Linux下
python
抓取
动态
网页
内容
Python
抓取
动态
网页
内容
实操指南 - 使用
Python
抓取
动态
网站数据
代码块还从名为meta_data_elements的WebElement 对象中采集标签名称为span的所有HTML 元素,并创建一个包含此span数据的列表。Bright Data除了是爬取网络公开数据的专家,同时还提供现成的数据集,内容含盖全球各大电商、社交媒体、商业信息平台等网站,现在就可以点击亮数据主页的。最后,它将
抓取
的数据保存到pandas DataFrame中,并将数据导出到名为youtube_comments_data.csv的 CSV文件中。所有这些都可以在您首选的网络浏览器中执行。
脚本语言
37,741
社区成员
34,213
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章