C# 抓取网页源码不全

lvle007 2018-03-04 07:42:11
请教各位大神,我用下面这段代码来获取整个这个登陆页面https://pacas.pa18.com/cas/PA003/ICORE_PTS/login的整个源码,其实我是想获取验证码的图片URL,但是抓取出来的源码却不包含该图片的URL。请问有什么方法可以提取出来。
WebClient、WebBrowser或者HttpWebRequest/HttpWebResponse这三种我都试过了,一样的效果。
1.这个是我抓取出来的内容


2.这个是实际的源码,其中我是向提取src,但是用程序抓出来的就是没有这个信息

        
private string webPageContent(string url)
{
string tempWebText = null;

WebRequest request = WebRequest.Create(url);
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("utf-8"));

tempWebText = reader.ReadToEnd();

reader.Close();
reader.Dispose();
response.Close();
File.WriteAllText("E:\\web.txt", tempWebText);
return tempWebText;
}
]
...全文
580 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
lvle007 2018-03-08
  • 打赏
  • 举报
回复
非常感谢各位给的方向,完全不懂网页,目前已经有了方向,我自己在研究下吧。
  • 打赏
  • 举报
回复
F12看是不是通过js把这些东西取出来的,确认到底是哪里取出了这部分数据
JimCarter 2018-03-07
  • 打赏
  • 举报
回复
先看下changeRandCode这个js代码是怎么实现,如果你只想获取验证码,只需要把这段代码用C#实现就好了,没必要解析html。 再不行就用浏览器控件,用GeckoWebBrowser、ChromeWebBrowser都可以,等页面加载完成,再去解析html
Dogfish 2018-03-07
  • 打赏
  • 举报
回复
那就用浏览器控件来捉,等javascript完成后再拿页面的资料。
zj_zwl 2018-03-05
  • 打赏
  • 举报
回复

这才是获取图片的请求和结果
threenewbee 2018-03-04
  • 打赏
  • 举报
回复
fiddler看下,是不是有ajax加载的内容
  • 打赏
  • 举报
回复
你还是先自己研究什么时候才会设置 src 属性吧。
lvle007 2018-03-04
  • 打赏
  • 举报
回复
那有什么办法可以抓取到那段信息吗?用C# code
  • 打赏
  • 举报
回复
那个是浏览器编译并且执行 js 代码之后的结果,不是 html 上的静态内容。

110,499

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧