用Microsoft.XMLHTTP获得某网页内容并转换成字符数据后,想要用正则网页中提取所有<a>标记及其内容
Pattern = "(^<a.+href=['""]?.{4,}>.+<\/a>$)"
虽说能够获取,但是内容如下:
<a href="/Default.html">8848so</a> <a href="d.html">ddd</a>
<a href='http://www.google.cn/search?complete=1&hl=zh-CN&ie=GB2312&q=ASP+href%D5%FD%D4%F2&meta='>复杂</a>
<a href=http://www.thws.cn/article.asp?id=911 dir="ltr" class="无 CSS 样式">无单双引号</a>
第一行,把两个<a>给当成一个提取了
此Pattern只能正确提取一行中有一个<a>标记的数据,如果一行内有多个,则错误的当成了一个提取
请各位高手指点