python爬虫 ip被谷歌翻译封掉了

whxb69 2018-05-31 04:49:25

有没有也被谷歌翻译封过的大概多长时间能解封
写了一个翻译word文件的程序，按句子翻译。没用代理，但是设置了每翻译一条间隔2~3秒，没翻译100条间隔半分钟，这样的速率也会被封吗？

...全文

1874 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

Truda. 2018-07-01

打赏
举报

回复

加个自动换代理功能,提前准备好一些代理

_pray 2018-07-01

打赏
举报

回复

看管理员的心情了，他心情好或许你就能解封了，要不然就永久了。

oyljerry 2018-05-31

打赏
举报

回复

google应该有很多判断方法，可能被检测出来。

包含谷歌翻译、百度翻译、有道翻译、必应翻译等引擎爬虫（Web Crawler）是一种自动化程序，用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储，以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。爬虫的工作流程包括以下几个关键步骤： URL收集：爬虫从一个或多个初始URL开始，递归或迭代地发现新的URL，构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。请求网页：爬虫使用HTTP或其他协议向目标URL发起请求，获取网页的HTML内容。这通常通过HTTP请求库实现，如Python中的Requests库。解析内容：爬虫对获取的HTML进行解析，提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据，如文本、图片、链接等。数据存储：爬虫将提取的数据存储到数据库、文件或其他存储介质中，以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。遵守规则：为避免对网站造成过大负担或触发反爬虫机制，爬虫需要遵守网站的robots.txt协议，限制访问频率和深度，并模拟人类访问行为，如设置User-Agent。反爬虫应对：由于爬虫的存在，一些网站采取了反爬虫措施，如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。爬虫在各个领域都有广泛的应用，包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而，使用爬虫需要遵守法律和伦理规范，尊重网站的使用政策，并确保对被访问网站的服务器负责。

Python爬虫被封IP，怎么换ip？常听到很多人抱怨自己的IP因爬虫次数太多而被网站屏蔽，不得不频繁使用各种代理IP，却又因为网上的公开代理大部分都是不能使用，而又要花钱花精力去申请VIP代理，几番波折又遭屏蔽。特此写一篇如何利用Python搭建代理池的文章，以降低时间及精力成本，实现自动化获取活跃代理IP的功能。1.运作原理：一：网站代理获取1.爬免费代理网站的IP列表测试是否可用以及是否高匿...

网络爬虫，其实就是自动抓取网络信息的程序。它能通过解析网页或请求接口获取有价值的数据。我们可以选择将获取到的数据直接转载展示（类似于百度的网页快照），或者是将数据持久化到DB或者直接以文件存储。爬虫程序的主要开发语言有Python、Java、PHP等，其中属Python爬虫开发最为热门。由于Python提供了许多可以用于爬虫开发的库和模块，并且Python语言本身语法简单、易学，非常适合初学者上手，因此Python爬虫几乎成了所有网络爬虫的代名词。

Python爬虫---爬虫介绍，实战案例

37,719

社区成员

34,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章