Jsoup解析遇到问题

cuiyang_0227 2013-09-12 02:31:51
在解析URL地址时 有时会遇到解析出来的doc对象的text内容在结尾是...
是显示不全吧?
解析部分的代码我是这么写的。

doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0").timeout(20000).get();

但是获取到的内容 的doc.text() 值就是一部分 最后的结尾是 ...
请高手指点。
回帖即给分!
...全文
188 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
liuxingfy 2013-12-26
  • 打赏
  • 举报
回复
能说下怎么解决的吗。。。楼主好人
cuiyang_0227 2013-09-12
  • 打赏
  • 举报
回复
引用 6 楼 rui888 的回复:
会不会是那个url网页上处理过了 多出来的就 省略号代替了。
这个不太可能吧?
cuiyang_0227 2013-09-12
  • 打赏
  • 举报
回复
引用 5 楼 fangmingshijie 的回复:
text

public Element text(String text)
Set the text of the body of this document. Any existing nodes within the body will be cleared.
Overrides:
text in class Element
Parameters:
text - unencoded text
Returns:
this document
这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的
我引用的是 import org.jsoup.nodes.Document;
tony4geek 2013-09-12
  • 打赏
  • 举报
回复
会不会是那个url网页上处理过了 多出来的就 省略号代替了。
  • 打赏
  • 举报
回复
text

public Element text(String text)
Set the text of the body of this document. Any existing nodes within the body will be cleared.
Overrides:
text in class Element
Parameters:
text - unencoded text
Returns:
this document
这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的
cuiyang_0227 2013-09-12
  • 打赏
  • 举报
回复
引用 2 楼 fangmingshijie 的回复:
看看真实的数据是不是也是...
真实的数据是有内容的。这个我非常的确定,只是解析之后,由于内容太多,后边的内容是省略号了,不知道是不是这个原因。 我非常确定的是 内容解析出来之后没有这个省略号
cuiyang_0227 2013-09-12
  • 打赏
  • 举报
回复
引用 1 楼 rui888 的回复:
为什么呢,你得解析获取Elements 然后text 吧。
比如说 我想获得这个页面上一个div对象 但是解析出来之后,内容里边竟然没有。但是我根据URL 在浏览器里 是可以看到的。 我在debug时 看到doc.text所获得的内容,由于脚本内容太多,后边的内容竟然是省略号…… 不知道有没有大神遇到过
  • 打赏
  • 举报
回复
看看真实的数据是不是也是...
tony4geek 2013-09-12
  • 打赏
  • 举报
回复
为什么呢,你得解析获取Elements 然后text 吧。

67,513

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧