多线程爬虫 CPU 占用 100%的问题

panni15 2016-03-21 04:09:04
之前的解析用的是正则表达式,没什么问题,三十个线程稳稳的,后来改成了XPath 的方式取页面内容,CPU 没一会就占用到了百分之百
...全文
450 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
panni15 2016-03-22
  • 打赏
  • 举报
回复
引用 3 楼 zhangCbrother 的回复:
是查下 你是设置了几个线程同时运行的?
之前用正则的时候,我是三十个线程,因为是递归所以不敢开太多,现在开十个 ,CPU 波动还是特别厉害
panni15 2016-03-22
  • 打赏
  • 举报
回复
引用 2 楼 dongxinxi 的回复:
线程状态是等待的,应该不是这个线程的问题 是不是有些线程中出异常了,如果对方的网页html并没遵循xml规范(标记或者<>不完整),有试过没
这样的 我都是直接 给抛掉的 return了的
zhangCbrother 2016-03-21
  • 打赏
  • 举报
回复
是查下 你是设置了几个线程同时运行的?
  • 打赏
  • 举报
回复
线程状态是等待的,应该不是这个线程的问题 是不是有些线程中出异常了,如果对方的网页html并没遵循xml规范(标记或者<>不完整),有试过没
panni15 2016-03-21
  • 打赏
  • 举报
回复



这是线程监控

110,556

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧