.net里如何过滤html的换行

inly1986 2010-03-06 08:45:14
我在做采集抓取的时候,抓取过来的内容是html的格式, 有换行,在导成csv格式文件的时候也有换行 所有数据就出错了,有什么方法或者正则过滤呢??

我用了这个没用


conStr = conStr.Replace(" ", "");
conStr = conStr.Replace("\r", "");
conStr = conStr.Replace("\n", "");
conStr = conStr.Replace("\t", "");
conStr = conStr.Replace("\"", "\"\"");

我试了很多方法都不行 郁闷
...全文
81 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
-过客- 2010-03-06
  • 打赏
  • 举报
回复
或者可能你要过滤的只是标签间的换行

Regex reg = new Regex(@"(?<=^|>)\s+(?=<|$)");
conStr = reg.Replace(conStr, "");
-过客- 2010-03-06
  • 打赏
  • 举报
回复
给个源字符串看看,不知道你说的是哪种

Regex reg = new Regex(@"\s+");
conStr = reg.Replace(conStr, "");
//or
Regex reg = new Regex(@"(?i)</?br\b[^>]*>");
conStr = reg.Replace(conStr, "");
wuyq11 2010-03-06
  • 打赏
  • 举报
回复
string s= Regex.Replace(content, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧