社区
Java EE
帖子详情
关于JAVA抓取网页信息
shashou_1234
2013-11-13 02:51:59
小弟今天遇到一个问题,关于用JAVA抓取网页信息,我想抓取指定的网页信息,比如说标题,正文,我想把目标地址HTML网页抓取到然后解析XML,但是XML的节点也太多了,不知道该怎样截取到我想要的信息,求各位大神帮帮忙,告诉我下该怎么截取到我想要的信息,小弟在此谢谢了,可以的话叫我Q356142739.
...全文
173
5
打赏
收藏
关于JAVA抓取网页信息
小弟今天遇到一个问题,关于用JAVA抓取网页信息,我想抓取指定的网页信息,比如说标题,正文,我想把目标地址HTML网页抓取到然后解析XML,但是XML的节点也太多了,不知道该怎样截取到我想要的信息,求各位大神帮帮忙,告诉我下该怎么截取到我想要的信息,小弟在此谢谢了,可以的话叫我Q356142739.
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
fineTu
2013-11-15
打赏
举报
回复
解析html方法很多,我用的是Jsoup,值域找到你想要的内容,这个就比较麻烦了,要用些正文提取的手段,这种手段没有公认的有效成果,一般都是通过正文内容特征等等来搞
爱跳舞的铅笔头
2013-11-14
打赏
举报
回复
建议获取到html之后,用dom4j去解析xml,可以参考
http://www.ibm.com/developerworks/cn/xml/x-dom4j.html
a_jian
2013-11-13
打赏
举报
回复
这个应该网络上有一大把现成的DEMO吧
异常异长
2013-11-13
打赏
举报
回复
一般把源码抓下来后 勇正则表达式筛选
tony4geek
2013-11-13
打赏
举报
回复
你想要那些重要信息就抓取那些。
java
抓取
网页
数据实现
java
抓取
网页
数据实现
Java
抓取
https
网页
数据
Java
抓取
https
网页
数据,解决peer not authenticated异常。导入eclipse就能运行,带有所用的jar包(commons-httpclient-3.1.jar,commons-logging.jar,httpclient-4.2.5.jar,httpcore-4.2.4.jar)
微信公众平台深度开发v2.0第5季——
网页
授权获取用户基本
信息
、个性化菜单接口、mysql+myba
使用
JAVA
语言,系统讲解微信公众平台订阅号、服务号官方列出的全部功能接口,包括:自定义菜单、个性化菜单(按需定制菜单)、群发消息、客服消息(有限次消息推送)、模板消息接(无限次消息推送)、微信
网页
开发...
Java
抓取
网页
内容三种方式
Java
抓取
网页
内容三种方式
java
获取json
网页
数据
这是一个获取json
网页
数据的
java
实例
Java EE
67,512
社区成员
225,880
社区内容
发帖
与我相关
我的任务
Java EE
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
复制链接
扫一扫
分享
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章