如何抓取jS动态生成的网页数据

qq_36244016 2017-09-05 11:13:15

如何抓取jS动态生成的网页数据

...全文

1088 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

以专业开发人员为伍 2017-09-09

打赏
举报

回复

所以给偷数据的人提高点难度，在正规论坛上少讨论。

橘子皮... 2017-09-09

打赏
举报

回复

分析js,自己模拟生成啊

gagadun 2017-09-09

打赏
举报

回复

调试js 模拟执行js脚本获取返回值

lovingkiss 2017-09-09

打赏
举报

回复

引用 3 楼 sp1234 的回复:

“抓取”失业，互联网的道德水平可以提高一点啊。

假设用户需要数据，国家机关官网存在此数据表，你是抓取还是不抓取呢？ 1、官网是免费的数据，但是没提供批量下载，没提供查询接口，时不时的还不保证速度 2、客户需要的是本地快速反应的情况下凡事没有一定之规~~ 别“偷”不该“偷”的就好，每个人的道德底线是不一样的。。。天气预报本来是公众资源，但是官网非要让我花钱买 ——以你的道德标准会认为不该抓取，但是以我的道德标准我会认为无所谓。

webdiyer 2017-09-09

打赏
举报

回复

你可以了解下Selenium Webdriver，可能有点大材小用：http://www.seleniumhq.org/projects/webdriver/

通过上述方法，结合Jsoup和HttpClient，开发者可以构建出一个能够抓取动态网页内容的爬虫程序。这不仅适用于商品价格的抓取，也适用于其他需要抓取动态数据的场景。但需要注意的是，爬取数据时应遵守网站的robots....

而"动态页面抓取"则强调了我们需要关注那些使用JavaScript进行数据加载的网页。总的来说，这个主题涵盖了网络爬虫的基础知识，以及处理现代网页技术的方法，对初学者非常有帮助，同时也提醒我们，随着网页技术的发展...

接下来，我们转向**抓取网页JS返回数据**。许多现代网页使用Ajax技术动态加载数据，这些数据通常不会出现在原始HTML中，而是通过JavaScript执行后生成。为了抓取这类数据，我们需要模拟浏览器的行为。Java中有一款...

在Web应用中，可以使用ASP.NET的Chart控件，或者结合JavaScript库如Chart.js或D3.js，将C#后端生成的数据转化为丰富的可视化图形。总的来说，C#网页抓取分析涉及了网络编程、HTML解析、数据处理、表格生成和图形化...

对于JavaScript驱动的动态网页，可能需要使用如Selenium等工具来模拟浏览器行为，以便执行JS并获取最终渲染的页面内容。二、图片抓取图片抓取是爬虫的一个重要部分，主要是找到HTML中的`<img>`标签，提取其`src`...

111,124

社区成员

642,539

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章