解析HTML用哪个更好【HtmlAgilityPack VS正则表达式】

OROCHIORI615 2011-12-16 08:15:39
解析html,用正则和用HtmlAgilityPack哪个性能更好啊(就不问哪个更容易用了,显然HtmlAgilityPack比正则用起来简单的多)?用HtmlAgilityPack的话碰到太大的网页是不是会很慢阿(因为相比正则分析,有个html转化成转化成xml的过程)。还有灵活性方面哪个更好,高手说说,谢谢了!!


另:求个正则表达式生成工具
应该有很多款吧,推荐个最强大的吧。有经验的高手说说。
PS:要是有C#开源的正则生成工具,那就推荐带C#开源的工具,开源有诱惑力啊。
...全文
175 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
OROCHIORI605 2011-12-17
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 dalmeeme 的回复:]
你可以到这个网站下载Convert.net:点此
HtmlAgilityPack的话碰到太大的网页也比较快的,它生成Dom节点树的算法效率估计要比正则高很多,主要是没什么回溯。得到Dom节点树后,基本都是对树的遍历和操作,效率是比较高的。
但是正则也非常有用。
[/Quote]
说得好 学习了 UP
OROCHIORI615 2011-12-17
  • 打赏
  • 举报
回复
http://topic.csdn.net/u/20111216/20/02265e4c-5476-4f4f-9ecd-52d703d95ff6.html?46446
OROCHIORI615 2011-12-17
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 sbwwkmyd 的回复:]
HTML解析在各方面应该都优于正则。当然如果数据只使用一次,并且环境特定的话一般是正则快。
因为HTML规则太复杂,所以我从来没有看到过通用的并且能保证正确的正则。
[/Quote]
...谢谢回答..不过你回答的前一两分钟..我结贴了..
showjim 2011-12-17
  • 打赏
  • 举报
回复
HTML解析在各方面应该都优于正则。当然如果数据只使用一次,并且环境特定的话一般是正则快。
因为HTML规则太复杂,所以我从来没有看到过通用的并且能保证正确的正则。
dalmeeme 2011-12-16
  • 打赏
  • 举报
回复
你可以到这个网站下载Convert.net:点此
HtmlAgilityPack的话碰到太大的网页也比较快的,它生成Dom节点树的算法效率估计要比正则高很多,主要是没什么回溯。得到Dom节点树后,基本都是对树的遍历和操作,效率是比较高的。
但是正则也非常有用。

110,538

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧