如何趴取网页的jsp变量?

fifaoresp 2018-04-19 01:47:18
各位大大,刚想用httpClient爬一个网站的数据,发现重要的数据都是经过jsp变量遍历出来的,请问这种数据java如何获取?
部分代码如下

<ul class="page_notice_list_content"> <% for(var i = 0; i < list.length; i++) { %> <li>
<a href="/zh-cn/notice_detail/?id=<%= list[i].id %>">
<h2 class="page_notice_title"> <% if( list[i].topNotice){ %> <i class="is-top">重要</i> <% } %> <%= list[i].title %></h2>
<span class="page_notice_time"><%= time2Date(list[i].created) %></span>
</a>
</li> <% } %> </ul>
...全文
924 4 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
maradona1984 2018-04-19
  • 打赏
  • 举报
回复
你爬虫还能爬到人家jsp代码?除非人家jsp出现异常了,把错误的那段jsp给打印出来了,你才能看到这个 java定义变量用var?JDK10才出多久,就有人拿来用,我是不信的
fifaoresp 2018-04-19
  • 打赏
  • 举报
回复
引用 3 楼 maradona1984 的回复:
[quote=引用 2 楼 fifaoresp 的回复:] [quote=引用 1 楼 maradona1984 的回复:] 你爬虫还能爬到人家jsp代码?除非人家jsp出现异常了,把错误的那段jsp给打印出来了,你才能看到这个 java定义变量用var?JDK10才出多久,就有人拿来用,我是不信的
他这个操作可能是为了防爬虫,有什么方案可以解决吗?就是他的重要内容是通过jsp变量遍历的,这种情况的话,其他人爬虫的时候是通过什么方案解决的,或者有什么方案可以绕过这个问题,比如抓包可不可以抓到?[/quote] 感觉你不太懂web开发啊... jsp只是服务端语言,在服务端执行完成,输出到浏览器(你这里就是你的httpclient)都是html了,根本不存在jsp代码的 如果你觉得他防爬虫,那你得伪装成看起来不像爬虫才是你的方向啊,抓包那也得你访问了对方页面才有的抓啊 或许你得需要补下相关基础知识,至少要清楚整个流程吧...[/quote]好的,谢谢你的耐心解答
maradona1984 2018-04-19
  • 打赏
  • 举报
回复
引用 2 楼 fifaoresp 的回复:
[quote=引用 1 楼 maradona1984 的回复:] 你爬虫还能爬到人家jsp代码?除非人家jsp出现异常了,把错误的那段jsp给打印出来了,你才能看到这个 java定义变量用var?JDK10才出多久,就有人拿来用,我是不信的
他这个操作可能是为了防爬虫,有什么方案可以解决吗?就是他的重要内容是通过jsp变量遍历的,这种情况的话,其他人爬虫的时候是通过什么方案解决的,或者有什么方案可以绕过这个问题,比如抓包可不可以抓到?[/quote] 感觉你不太懂web开发啊... jsp只是服务端语言,在服务端执行完成,输出到浏览器(你这里就是你的httpclient)都是html了,根本不存在jsp代码的 如果你觉得他防爬虫,那你得伪装成看起来不像爬虫才是你的方向啊,抓包那也得你访问了对方页面才有的抓啊 或许你得需要补下相关基础知识,至少要清楚整个流程吧...
fifaoresp 2018-04-19
  • 打赏
  • 举报
回复
引用 1 楼 maradona1984 的回复:
你爬虫还能爬到人家jsp代码?除非人家jsp出现异常了,把错误的那段jsp给打印出来了,你才能看到这个 java定义变量用var?JDK10才出多久,就有人拿来用,我是不信的
他这个操作可能是为了防爬虫,有什么方案可以解决吗?就是他的重要内容是通过jsp变量遍历的,这种情况的话,其他人爬虫的时候是通过什么方案解决的,或者有什么方案可以绕过这个问题,比如抓包可不可以抓到?

81,122

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧