如何将读入的HTML流转换为TXT文件

jiaxunzaixian 2004-07-31 03:57:48
类似于去掉各种HTML标记,如同抓页般只显示文本。
...全文
153 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
孟子E章 2004-07-31
  • 打赏
  • 举报
回复
wc.Credentials = CredentialCache.DefaultCredentials;
Byte[] pageData = wc.DownloadData("http://news.sina.com.cn");
ContentHtml.Text = Regex.Replace(Encoding.Default.GetString(pageData),"<[^>]*>", "");
//替换空格
ContentHtml.Text = Regex.Replace(ContentHtml.Text,"\\s+", " ");
孟子E章 2004-07-31
  • 打赏
  • 举报
回复
PageUrl = UrlText.Text;
WebClient wc = new WebClient();
wc.Credentials = CredentialCache.DefaultCredentials;

///方法一:
Byte[] pageData = wc.DownloadData(PageUrl);
ContentHtml.Text = Regex.Replace(Encoding.Default.GetString(pageData),"<[^>]*>", "");

62,051

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧