关于字符串操作小问题

ybblack001 2009-04-12 08:56:24
数据库储存一篇帖子的内容,可能有<b><a><img>等标记。我希望截取前200个字符,但不希望包含HTML元素以及元素中间的内容。应该怎么处理?
...全文
105 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
解释多余的 2009-04-12
  • 打赏
  • 举报
回复
up
netwar 2009-04-12
  • 打赏
  • 举报
回复
晕,用正则替换掉就可以了
String content="你的文章内容";
Strint pattern="<.*?>";
Regex reg=new Regex(pattern,RegexOptions.Ignorecase);
content=reg.Replace(content,"");
cao_love 2009-04-12
  • 打赏
  • 举报
回复
学习,学习
felix3118 2009-04-12
  • 打赏
  • 举报
回复
3楼正解。
LemIST 2009-04-12
  • 打赏
  • 举报
回复
string htmlStr = "...";
StringBuilder first200 = new StringBuilder();
bool skip = false;
foreach (char ch in htmlStr.ToCharArray())
{
switch (ch)
{
case '<':
skip = true;
break;
case '>':
skip = false;
break;
default:
if (!skip)
first200.Append(ch);
break;

}
if (first200.Length >= 200)
break;
}
claymore1114 2009-04-12
  • 打赏
  • 举报
回复

public string NoHTML(string Htmlstring) //去除HTML标记
{
//删除脚本
Htmlstring = Regex.Replace(Htmlstring, @" <script[^>]*?>.*? </script>", "", RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring, @" <(.[^>]*)>", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @" <!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", " <", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);

Htmlstring.Replace(" <", "");
Htmlstring.Replace(">", "");
Htmlstring.Replace("\r\n", "");
Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;
}
wuyq11 2009-04-12
  • 打赏
  • 举报
回复
先把html替换掉,可参考我博客
再截取数据
teerhu 2009-04-12
  • 打赏
  • 举报
回复
关注

62,267

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧