使用 Python 解除烦人的网页浏览限制

albertlee 2004-09-01 11:08:52

昨天找到一个比较好的人工智能网站，其中有一些很不错的 prolog 文章，我很感兴趣。文中有很多示例程序，可是网页的右键被禁止了，也不能选择，不能保存，不能察看源代码！！

实在不爽，信息本来就要共享嘛！

只好发扬下 hack 精神，冲破限制。还好，有 python 方便多了。

网页中增加限制，无非是在 html 中设置脚本，既然浏览器可以显示出来，就一定能得到它的文本。

第一步，在 python shell 中执行：

>>> import urllib
>>> urllib.urlretrieve("http://www.chinaai.org/Article_Show.asp?ArticleID=315","c:/tmp.html")

urlretrieve 可以把一个网页保存到本地文件。

第二步，分析这个 tmp.html 文件，发现其中的标签比较恶心：

把这个标签换成比较干净的：

浏览这个文件， ok 限制解除。

第三步，自动下载网页，进行“净化”处理，编写一个python 程序：

import urllib

urls = {'http://www.chinaai.org/Article_Show.asp?ArticleID=315':'prolog2.html'}

new_tag = ""

for url in urls:
filename = urls[url]
urllib.urlretrieve(url,filename)
f = open(filename,'r')
content = f.read()
f.close()
l_pos = content.find(' r_pos = content.find('>', l_pos)
cont1 = content[:l_pos]
cont2 = content[r_pos + 1:]
content = cont1 + new_tag + cont2
f = open('tmp.html','w')
f.write(content)
f.close()

程序中 urls 是一个字典，里面是 url 和相应的本地文件名，使用者可以根据自己的情况添加。

注意，这个程序是专门针对这个网站的，对于其他的网站，可能使用的方法会有不同，但是按照上面的步骤，相信大家都能搞定。

我们的口号是，“还我自由！”

http://blog.csdn.net/albertlee/archive/2004/09/01/damn_chinaai.aspx

...全文

381 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

cpunion 2004-09-01

打赏
举报

回复

支持。不过更简单的办法是使用MyIE，GoSuRF之类的浏览器。

当然我们可以从程序中学习到一些东西

albertlee 2004-09-01

打赏
举报

回复

抱歉，由于 html 的原因， < body > 这些标签，在上面没有显示出来

大家可以去
http://blog.csdn.net/albertlee/archive/2004/09/01/damn_chinaai.aspx
察看正常的程序。

cpunion 2004-09-01

打赏
举报

回复

HTML加密只能对付不会编程的人。一般艺术设计、文学的网站可以用一些。

albertlee 2004-09-01

打赏
举报

回复

果然 MyIE 可以，呵呵刚刚发现。

实际上， www.chinaai.org 上面的文章也是从别人那里转贴来的，还要搞这么恶心的限制，实在是过分。

zhushizu 2004-09-01

打赏
举报

回复

是呀，我也是想了好久。。关注中。。。

本文介绍了如何在星图GPU平台上自动化部署Realistic Vision V5.1虚拟摄影棚镜像，实现开箱即用的AI人像生成。该平台简化了部署流程，用户无需配置复杂环境即可一键启动。该镜像专注于生成光影自然、细节丰富的超写实人像照片，可广泛应用于角色设计、肖像素材创作等场景。

每个分支下又细分了四个关键方向，并按照“研究对象/焦点、基本问题、核心理论/概念、研究方法、应用/目标、前沿/发展”的框架进行阐述，严格遵循了六级编码体系。在最终整合时，应建立唯一的学科分类编码表（例如，用两位数字或“ART”、“MED”、“ECO”等字母前缀），并确保所有下级编码（尺度、层次、类别、子类、具体项）的逻辑一致性。此回答中的编码为示例，实际系统需据此调整。控制过程（前馈、同期、反馈）、全面质量管理（TQM）、平衡计分卡（BSC）定量（调查、实验）、定性（访谈、民族志）、混合方法、大数据。

科易网基于40亿+科创知识图谱数据库，深度探索AI技术在技术转移、成果转化、技术经纪、知识产权、产业创新、科技招商等垂直领域的多样化应用场景，研究科技创新领域的AI+数智化解决方案，推动科技创新与产业创新智能化发展。

内容概要：本文围绕“新能源发电接入弱电网的宽频带振荡机理及抑制方法”开展深入研究，结合Matlab编程与Simulink仿真平台，系统剖析新能源发电系统在弱电网条件下引发的宽频带振荡问题。研究聚焦于变流器控制动态、锁相环（PLL）频率耦合效应、序阻抗建模及其交互特性等关键因素，揭示振荡产生的内在机理。通过构建精确的数学模型与电磁暂态仿真模型，采用扫频分析法获取系统序阻抗特性，并结合奈奎斯特稳定性判据进行判别，验证理论分析的正确性。同时，提出针对性的抑制策略，如改进控制算法、引入阻尼补偿环节或优化控制器参数设计，以提升系统在弱电网环境下的稳定性。整个研究流程完整复现了博士论文级别的科研工作，具有较强的理论深度与工程应用价值。; 适合人群：适用于具备电力系统、电力电子或自动控制等相关专业背景，熟悉Matlab/Simulink仿真工具，正在从事新能源并网、电力系统稳定性分析、变流器控制策略研究的研究生、科研人员及电力行业工程技术开发者。; 使用场景及目标：①深入理解新能源并网系统在弱电网中发生宽频带振荡的物理本质与动态演化过程；②掌握基于频域阻抗法的系统稳定性建模与分析方法；③学习并复现高水平学术论文中的关键技术路线，提升独立科研能力与仿真建模水平；④为实际工程中新能源电站的并网稳定性问题提供理论依据与可行的抑制方案参考。; 阅读建议：建议读者结合文中提供的Matlab代码与Simulink仿真模型，逐步完成从阻抗建模、扫频仿真到稳定性判据应用的全过程实践，重点关注锁相环与电流环之间的动态耦合关系，并辅以相关文献深化对频域分析理论的理解，实现理论与仿真的深度融合。

stm32单片机项目资料课程设计文档C语言程序代码原理图电路PCB实例宽频鱼雷自导目标回波模拟仿真

37,738

社区成员

34,210

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章