如何将一个页面上的有效文字提取出来?

smartyyp 2004-05-09 08:31:14
通过streamreader可以读取文件 ***.htm
但页面中的html标记无法舍去,如何只将html中有用的文字读出?
...全文
107 4 打赏 收藏 举报
写回复
4 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
boystones 2004-05-09
学习
  • 打赏
  • 举报
回复
yangzixp 2004-05-09
Regex.Replace(str,@"<.+?>","").Replace(" ","")
  • 打赏
  • 举报
回复
DB牛牛 2004-05-09
server.htmlencode()
  • 打赏
  • 举报
回复
kanshangren 2004-05-09
这个只能通过判断,把HTML字会全部过滤掉了,不过也不一定能很准确。
  • 打赏
  • 举报
回复
相关推荐
发帖
.NET社区

6.0w+

社区成员

.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • R小R
  • 喵叔哟
加入社区
帖子事件
创建了帖子
2004-05-09 08:31
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。