高级python爬虫工程师

datouwawa123456 2023-07-20 16:47:12

岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行数据抓取和分析;
2、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
3、参与分布式爬虫和数据采集系统的架构设计和开发,快速响应业务变动;
4、负责网络数据抓取规划、定期爬取指定网站的数据;
5、参与数据层建设,专注于垂直领域数据爬取,进行多平台信息的抓取和分析;
6、实现数据提取、清洗、结构化、入库、统计分析等需求;
7、研究优化算法,提升爬虫系统的稳定性、可扩展性。

任职要求:
1、熟悉Python和常用的开源库,熟练使用Django/Flask等至少一种主流的web开发框架;
2、熟悉Mysql,mongoDB, Redis,Es,队列等数据库的使用和优化;
3、对进程、线程、协程、异步、非阻塞有一定了解和使用
4、对linux系统基础知识及原理了解较深入的,如linux软中断硬中断,服务器安全等
5、熟悉爬虫主流框架Scrapy、requests、Selenium、gocolly,webmagic等框架(深入了解其中一种)。
6、对相关算法有一定了解;
7、有大型项目管理经验优先。
8、熟悉应用IP代理池、Headers认证和Cookie等;
9、有分布式爬虫、反爬机制经验者优先
10、熟悉js逆向,js破解优先考虑
11、有参与实时监控爬虫的进度和警报反馈系统的优先考虑,如Prometheus+zabbix+granafa等服务器相关爬虫监控检测体系
12、有高可用分布式集群项目设计、开发经验,优先考虑,如K8S,docker,keepalived等
13、有多种语言,如GO、Python、Rust、php可作为加分项
14、有训练过自己的模型可作为加分项
15、github或者码云有相关开源项目可作为加分项

 

薪资:20-50K    

坐标:河南南阳

有意向者可发送简历至:452792660@qq.com

...全文
335 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
慕飒潇湘 2023-12-08
  • 打赏
  • 举报
回复

薪资对口,但是坐标不对口,哭晕在厕所....

mummy2 2023-11-19
  • 打赏
  • 举报
回复

薪资范围不要开这么大吧, 当真只看下限开工资么, 上限就随便写?

11,092

社区成员

发帖
与我相关
我的任务
社区描述
创建由Python学习者和社区专家组成的国内最大的第三方Python中文社区,帮助社区成员更好地入门学习、职业成长和应用实践
python学习 企业社区
社区管理员
  • Python全栈技术社区
  • Lumos_zbj
  • 北侠大卫
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

创建由Python学习者和社区专家组成的国内最大的第三方Python中文社区,帮助社区成员更好地入门学习、职业成长和应用实践

  • 这里有最新最全的 Python 学习内容及资源,每月多达4次技术公开课
  • 这里有众多 Python 学习者,陪伴你一起交流成长
  • 这里有专业 Python 社区专家、讲师,帮助你跨越学习瓶颈,解决实操难题
  • 这里有丰富的社区活动,可以开阔眼界,结识更多同伴

【最新活动】:

  1. 周四技术公开课讲师招募中,点击查看详情
  2. “Python 社区专家团” 招募中,点击查看详情

 

试试用AI创作助手写篇文章吧