有时候人要偷偷懒,想自己处理 HTML 页面不是不行,但难度实在有点那个了。光是处理静态的 tag 也许还能够解决,我到 w3 下了 HTML 文档,也就 100 个不到的标记,光这些东西就足够你忙一壶的,并且 HTML 文件也实在太随意了,怎么写也不会出错,也许很标准的东西处理起来还不难,但有些不怎么标准的你怎么办。如果页面中有 js,就最简单的 <script language='javascript'>document.write("hello");</script> 要搞定也不是一朝一夕能够搞定的,要自己处理就当你弄个浏览器了,太不现实了。