正在表达 截取字符串

top_99 2010-08-02 10:19:27
我现在有这样一个字符串:
.....<li class="g"><h3 class="r"><a href="http://gmo.greenpeace.org.cn/index.aspx" class="l" onmousedown="return clk(0,'','','','1','','0CBoQFjAA')">Greenpeace</a></h3><div class="s">《避免转基因<em>食品</em>指南2010》是一本“健康生活”宝典。内容包含近四百个市面上常见的<em>食品</em><wbr>品牌是否承诺拒绝转基因成份,透过红绿名单告诉你,如何健康过生活。 <b>...</b><br><span class="f"><cite>gmo.greenpeace.org.cn/index.aspx</cite> - <span class="gl"><a href="http://webcache.googleusercontent.com/search?q=cache:86Hz5lkiQVoJ:gmo.greenpeace.org.cn/index.aspx+%E9%A3%9F%E5%93%81+site:gmo.greenpeace.org.cn&cd=1&hl=zh-CN&ct=clnk" onmousedown="return clk(0,'','','','1','','0CBwQIDAA')">网页快照</a></span></span></div><!--n--><!--m--></li>

<li class="g"><h3 class="r"><a href="http://gmo.greenpeace.org.cn/aboutgpc.aspx" class="l" onmousedown="return clk(0,'','','','2','','0CB0QFjAB')">关于绿色和平 - Greenpeace</a></h3><div class="s">绿色和平是一个全球性的环保组织,致力于以实际行动推动积极的改变,保护地球环境与世界和平。 绿色和平<em>食品</em>与农业项目致力于推动有利于环境、农民和消费者的农业,让 <b>...</b><br><span class="f"><cite>gmo.greenpeace.org.cn/aboutgpc.aspx</cite> - <span class="gl"><a href="http://webcache.googleusercontent.com/search?q=cache:_ZgzY5mIDVIJ:gmo.greenpeace.org.cn/aboutgpc.aspx+%E9%A3%9F%E5%93%81+site:gmo.greenpeace.org.cn&cd=2&hl=zh-CN&ct=clnk" onmousedown="return clk(0,'','','','2','','0CB8QIDAB')">网页快照</a></span></span></div><!--n--><!--m--></li>.....

我要截取
...全文
63 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
top_99 2010-08-02
  • 打赏
  • 举报
回复
求大侠赐教啊。
我帖子要沉了。
myhope88 2010-08-02
  • 打赏
  • 举报
回复
路过,来学习下
top_99 2010-08-02
  • 打赏
  • 举报
回复
不要意思刚才没说清楚。现在补充了下。
top_99 2010-08-02
  • 打赏
  • 举报
回复
.....<li class="g"><h3 class="r"><a href="http://gmo.greenpeace.org.cn/index.aspx" class="l" onmousedown="return clk(0,'','','','1','','0CBoQFjAA')">Greenpeace</a></h3><div class="s">《避免转基因<em>食品</em>指南2010》是一本“健康生活”宝典。内容包含近四百个市面上常见的<em>食品</em><wbr>品牌是否承诺拒绝转基因成份,透过红绿名单告诉你,如何健康过生活。 <b>...</b><br><span class="f"><cite>gmo.greenpeace.org.cn/index.aspx</cite> - <span class="gl"><a href="http://webcache.googleusercontent.com/search?q=cache:86Hz5lkiQVoJ:gmo.greenpeace.org.cn/index.aspx+%E9%A3%9F%E5%93%81+site:gmo.greenpeace.org.cn&cd=1&hl=zh-CN&ct=clnk" onmousedown="return clk(0,'','','','1','','0CBwQIDAA')">网页快照</a></span></span></div><!--n--><!--m--></li>


<li class="g"><h3 class="r"><a href="http://gmo.greenpeace.org.cn/aboutgpc.aspx" class="l" onmousedown="return clk(0,'','','','2','','0CB0QFjAB')">关于绿色和平 - Greenpeace</a></h3><div class="s">绿色和平是一个全球性的环保组织,致力于以实际行动推动积极的改变,保护地球环境与世界和平。 绿色和平<em>食品</em>与农业项目致力于推动有利于环境、农民和消费者的农业,让 <b>...</b><br><span class="f"><cite>gmo.greenpeace.org.cn/aboutgpc.aspx</cite> - <span class="gl"><a href="http://webcache.googleusercontent.com/search?q=cache:_ZgzY5mIDVIJ:gmo.greenpeace.org.cn/aboutgpc.aspx+%E9%A3%9F%E5%93%81+site:gmo.greenpeace.org.cn&cd=2&hl=zh-CN&ct=clnk" onmousedown="return clk(0,'','','','2','','0CB8QIDAB')">网页快照</a></span></span></div><!--n--><!--m--></li>
.....
不好意思 字体没边红色。
我要截取的是:
1.Greenpeace
2.《避免转基因<em>食品</em>指南2010》是一本“健康生活”宝典。内容包含近四百个市面上常见的<em>食品
3.http://gmo.greenpeace.org.cn/index.aspx

第二个<li>中的:
1.Greenpeace
2.绿色和平是一个全球性的环保组织,致力于以实际行动推动积极的改变,保护地球环境与世界和平。 绿色和平<em>食品</em>与农业项目致力于推动有利于环境、农民和消费者的农业,让
3.http://gmo.greenpeace.org.cn/aboutgpc.aspx
top_99 2010-08-02
  • 打赏
  • 举报
回复
字怎么没变红色
fds
晕了。
tsmoon2009 2010-08-02
  • 打赏
  • 举报
回复
截取什么
每天回帖即可获得10分可用分!
tanbin_0521 2010-08-02
  • 打赏
  • 举报
回复
接上面的内容:根据不同的网页要写不同的函数。希望对你用帮助。
tanbin_0521 2010-08-02
  • 打赏
  • 举报
回复


先格式掉html./// <summary>

/// 去除HTML标记

/// </summary>

/// <param name="NoHTML">包括HTML的源码 </param>

/// <returns>已经去除后的文字</returns>

public static string NoHTML(string Htmlstring)
{

//删除脚本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);

//删除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);



Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);


Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

Htmlstring.Replace("\r\n", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();


return Htmlstring;

}

62,052

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧