抓取网页，但是里面内容是js填充的。

张海霖 2016-05-03 04:53:31

这个网站可以查询某个淘宝账号的信誉

http://www.kehuda.com/g/x/#username=%E6%97%A0%E6%95%8C
我想抓取他的查询结果，但是发现内容由js填充，而且js是做了一些加密处理。

个人能力有限，不能分析出什么。

现在想要拜求怎么能抓取到信誉，主要是几钻这里的信息。

...全文

192 2 打赏收藏转发到动态举报

写回复

2 条回复

切换为时间正序

请发表友善的回复…

发表回复

张海霖 2016-05-03

打赏
举报

回复

引用 1 楼 hch126163 的回复:

开发人员工具，查看所有网络请求，找到自己需要的数据来源

不会

hch126163 2016-05-03

打赏
举报

回复

开发人员工具，查看所有网络请求，找到自己需要的数据来源

本文详细介绍了Puppeteer在动态网页抓取、表单自动填充及JavaScript渲染页面数据处理方面的高级应用。涵盖内容等待策略、DOM元素提取、性能优化、错误处理等关键技术点，并提供实用代码示例，帮助开发者构建高效可靠的网页抓取系统。

本文介绍HtmlUnit，一款用Java编写的无头浏览器，能高效解析网页内容，包括表单填充、链接点击及JavaScript执行。文章展示了如何配置并使用HtmlUnit进行网页抓取，特别适合需要解析网页脚本的场景。

本文介绍了如何通过分析网页源码和利用Chrome开发者工具来抓取动态生成的内容。当遇到HTML仅包含文字模板而实际内容由JavaScript填充的情况，需要找出真正提供信息的文件。通过分析网络请求，发现企业信息存在于'indexinvestment.action'文件中，并通过POST方式传递id参数。在处理编码问题后，可以获取所需内容。文章强调了解网页逻辑和选择合适工具在爬虫编程中的重要性。

本文探讨了一位开发者在使用Scrapy-Splash抓取含有JS动态填充的网页表格时遇到的问题，详细分析了如何在 Splash 中配置渲染并解决表格内容未更新的问题，适合前端与爬虫技术结合的实践者参考。

本文深入解析OpenClaw Browser-Wing——一套面向JavaScript渲染网页的高性能浏览器自动化技术栈。重点涵盖无头/有头浏览器控制（Playwright、Puppeteer、Selenium）、动态元素定位（CSS选择器、XPath）、显式等待机制、JS渲染内容抓取、表单自动填充、弹窗处理、Cookie与会话管理、反爬绕过策略及分布式执行架构。强调其在数据采集、压力测试、RPA集成等AI-native场景中的工程实践与技术边界。

87,990

社区成员

224,684

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章