vb.net获取网页的源码问题

牛记图文 2018-02-09 03:45:20
请问http://kj.13322.com/lhc_history_d2018_0.html网页,不管是是采用WebBrowser1.Document.Body.InnerHtml、还是采用XmlHttp.ResponseText.ToString,为什么返回的源码中<body></body>之间,均为 ERROR !!! <br>?如何解决这个问题,请高手指点一下,最好有详细代码
...全文
1279 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
wq1282 2018-02-28
  • 打赏
  • 举报
回复
 Dim w As New WebClient'要Imports System.Net
        w.Proxy = Nothing'设置为无代理模式,否则首次运行会慢4秒左右。
        w.CachePolicy = New Cache.RequestCachePolicy(Cache.RequestCacheLevel.NoCacheNoStore)'不要缓存数据,每次都重新拉取最新源码
        w.Encoding = System.Text.Encoding.UTF8'网站编码,否则乱码
        w.Headers.Add(HttpRequestHeader.UserAgent, "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36")'模拟浏览器请求头
        w.Headers.Add(HttpRequestHeader.Accept, "text/html, application/xhtml+xml, application/xml; q=0.9, image/webp, */*; q=0.8")'请求的格式
        w.Headers.Add(HttpRequestHeader.AcceptLanguage, "zh-CN, zh; q=0.8")‘注意这一个请求头是必须的。

        Dim strHtml As String = w.DownloadString("http://kj.13322.com/lhc_history_d2018_0.html")
        Debug.Print(strHtml)
        MsgBox(strHtml)
’这样子就没有出现Error了
牛记图文 2018-02-11
  • 打赏
  • 举报
回复
引用 3 楼 xyxcc177109的回复:
代码是全的,是你读取的方式不正确
应该怎么读呢,请指点一下
大鱼> 2018-02-09
  • 打赏
  • 举报
回复
是不是人家有反爬机制啊
xyxcc177109 2018-02-09
  • 打赏
  • 举报
回复
代码是全的,是你读取的方式不正确
牛记图文 2018-02-09
  • 打赏
  • 举报
回复
引用 1 楼 道潯常的回复:
是不是人家有反爬机制啊
不知道啊,但是网页在浏览器打开后点右键可以查看完整源码

16,554

社区成员

发帖
与我相关
我的任务
社区描述
VB技术相关讨论,主要为经典vb,即VB6.0
社区管理员
  • VB.NET
  • 水哥阿乐
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧