C#截取網頁內容 卻出現亂碼

jason36900 2014-07-23 10:05:55
如題
用C# 寫了一個程式想要抓取標題跟內容(其他連結或是選單都不要)
有些網址沒有問題抓得出來
但這個網址就無法
想請求大神幫忙看看

public partial class _Default : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
WebClient url = new WebClient();
MemoryStream ms = new MemoryStream(url.DownloadData("http://www.tp.blood.org.tw/Internet/taipei/docDetail.aspx?uid=6405&pid=6404&docid=35299"));
HtmlDocument doc = new HtmlDocument();
doc.Load(ms, Encoding.Default);
Response.Write("現在時間:" + DateTime.Now + "<br />");

for (int x = 1; x <= 1; x++)
{
string txt1 = (doc.DocumentNode.SelectSingleNode("/html[1]/body[1]/div[1]/div[2]/div[2]/div[4]/div[2]/div[3]").InnerText);
string txt2 = (doc.DocumentNode.SelectSingleNode("/html[1]/body[1]/div[1]/div[2]/div[2]/div[4]/div[2]/div[4]/div[1]").InnerText);

string totle = string.Format("建檔單位:{0} ,文章內文:{1}", txt1,txt2);
Response.Write(totle + "<br />");
}
doc = null;
url = null;
ms.Close();
}
}


有檢查過
不是網頁壓縮問題
所以應該是編碼問題
那請問要怎麼把編碼問題解決
還是說 我抓的路徑有錯?

請求支援
...全文
37 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
jason36900 2014-07-23
  • 打赏
  • 举报
回复
感謝大哥 解決我的困擾了 謝謝!
save4me 2014-07-23
  • 打赏
  • 举报
回复
把doc.Load(ms, Encoding.Default);改成doc.Load(ms, Encoding.UTF8); 、 因为网页返回的页面头部信息指明了是UTF8编码的。

110,571

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧