用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图)

cz0020 2009-02-05 10:03:53
用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图)

下载地址: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-ff11da70f37b11dd8000354100003541.html

用法很简单,比如:你把网页分析器保存到D:\那你直接在 dos 窗口下输入:
d:\czhtmlparse "http://tieba.cangzhuo.com/"
然后回车就可以了!
运行需要一个参数,
第一个参数
"http://tieba.cangzhuo.com/"
表示要下载的地址



目前测试过的大型网站有
http://www.csdn.net/
http://www.google.cn/

目前支持 GB2312编码、UTF-8编码自动转换、ISO-8859-1 及无编码类型网页!
下一版本将增加对BIG5编码类型网页的转换支持!

我打算等有 200人回复说好的时候就开源!大家要是喜欢就回复哈!
...全文
225 18 打赏 收藏 转发到动态 举报
写回复
用AI写文章
18 条回复
切换为时间正序
请发表友善的回复…
发表回复
ivan707 2012-09-03
  • 打赏
  • 举报
回复
牛逼的哇
baigooer 2009-02-07
  • 打赏
  • 举报
回复
HtmlParser 网页采集分析器已经升级更新

已经增加对UTF-8中文繁体、GBK中文繁体、BIG5中文繁体 转换成BG2312的功能!
另外增加了对宽字符的支持!

另补充说明:未使用任何第三方类库和正则库,完全自己编码实现!

欢迎大家批评指正!多提宝贵意见!谢谢!
No_Data_Found 2009-02-06
  • 打赏
  • 举报
回复
结帖率:0.00%
xiaoleiI982 2009-02-06
  • 打赏
  • 举报
回复
UP!
IridesC 2009-02-06
  • 打赏
  • 举报
回复
顶一个先!坐等200人,嘿嘿
Fireway_2009 2009-02-06
  • 打赏
  • 举报
回复
这个技术含量很高啊,期待源码!
liuenhai211 2009-02-06
  • 打赏
  • 举报
回复
谢谢啊!
argenCHN 2009-02-06
  • 打赏
  • 举报
回复
ding ding
linghengmao 2009-02-06
  • 打赏
  • 举报
回复
才14楼,什么时候才到200楼呀?
xdk 2009-02-06
  • 打赏
  • 举报
回复
说好的都是新注册的...又是广告的.
d1yme 2009-02-06
  • 打赏
  • 举报
回复
我感觉很棒,很强大!支持......
wq610612 2009-02-06
  • 打赏
  • 举报
回复
靠。垃圾
Iaorer 2009-02-06
  • 打赏
  • 举报
回复
不错!支持!
s0ngpengasp 2009-02-06
  • 打赏
  • 举报
回复
顶一个先!
delphi_new 2009-02-06
  • 打赏
  • 举报
回复
希望楼主下次用汇编写个,吼吼
baigooer 2009-02-05
  • 打赏
  • 举报
回复
tantaiyizu 2009-02-05
  • 打赏
  • 举报
回复
为什么要强调是用了c语言?
The_Joker 2009-02-05
  • 打赏
  • 举报
回复
nice

696

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧