求助！如下功能该如何实现！

爱吃辣子鸡阿 2017-11-27 02:45:52

编写一个简单网络爬虫脚本，统计任一指定网页里特殊关键词，例如“学生”出现的次数，执行环境
为CentOS 6.9，使用wget抓取网页。

具体要求：
a、脚本输入参数为：关键字指定页面URL
b、只统计网页<body>...</body>标记之间的内容；
c、统计子链接内容，但需要去除重复的链接（相同的子链接和子链接的父链接），统计连接深度为3；
指定页面URL
|____子页面1
| |____子页面1
| |____......
| |____子页面n
|____......
|
|____子页面n
|____子页面1
|____......
|____子页面n

d、在用户主目录下创建结果目录：名称为学号，权限设为755，结果目录下再创建content子目录，权
限同样设为755；
e、将wget download下来的网页按如下格式存储在结果目录的content子目录下，文件名称按如下格式
命名：
指定页面名称为 0.<url>
子页面名称为 0.x.<url>
子页面的子页面名称为 0.x.y.url
f、输出一个中间计算结果文件，名称为intermediate：存放在结果目录下，格式如下：
行号:<URL1><TAB><Key word><TAB><count>
行号:<URL2><TAB><Key word><TAB><count>
...
行号:<URLn><TAB><Key word><TAB><count>
g、输出结果文件，名称为result，存放在结果目录下，文件格式如下：
<keyword><TAB><total amount>
h、脚本需要考虑防错处理、效率和程序结构。

...全文

229 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

求助！！设计一个基于DOS菜单的应用程序设计一个基于DOS菜单的应用程序。要利用多级菜单实现各种功能。内容如下：1．无向图的基本操作及应用① 创建无向图的邻接矩阵② 创建无向图的邻接表③ 无向图的深度优先遍历④ 无向图的广度优先遍历2．无向网的基本操作及应用① 创建无向网的邻接矩阵② 创建无向网的邻接表③ 求最小生成树3．有向图的基...

求助！！！！用单片机的定时器T1怎么写一个LED亮2秒灭3秒的程序 C语言关注:120答案:4mip版解决时间 2021-02-05 00:55提问者習慣邇的習慣2021-02-04 14:09求助！！！！用单片机的定时器T1怎么写一个LED亮2秒灭3秒的程序 C语言最佳答案二级知识专家柚旅时光机2021-02-04 14:29#include #defineuchar unsigned ...

紧急求助!!! 这是网教学校发下来的一份作业，现向广大网友征集求助。一、（共50分）利用DOS系统功能调用编写汇编程序，在屏幕上显示自己学号的后4个数字符号。例如，你的学号如果是20191234，则在屏幕上显示出‘1234’。具体要求如下：（1）编写出完整的汇编语言程序；（2）利用宏汇编程序MASM和连接程序LINK对所编写的程序进行汇编和连接，生成可执行文件，并在DOS下运行程序。（3...

一、实验目的 1．考察对数据结构中相关知识的理解 2．采用模块化程序设计二、实验环境 1．Windows系统 2．VC++ 三、实验要求 1．不同功能模块采用独立的函数完成 2．测试数据条数不少于10条数 3．系统要有主界面，运行结果截图四、实验内容采用顺序表和单链表，设计手机通讯录，主要包含：联系人姓名、电话号码。完成基本功能如下：（1）初始化通讯录；（2）插入20名联系人信息；（...

今天带来的是基于微信小程序的高校报修求助系统，高校报修求助平台小程序的开发利用现有的成熟技术参考，以源代码为模板，分析功能调整与高校报修求助平台小程序管理的实际需求相结合，讨论了基于高校报修求助平台小程序管理的使用。本文以java为开发技术，实现了一个高校报修求助平台小程序。高校报修求助平台小程序的主要使用者分为管理员、学生、工作人员；实现功能：首页、公告栏、模块管理（文章分类、学生文章、职工文章、校园文章、宿舍报修、室内报修、室外报修、网络报修、求助信息、用户反馈、职工反馈）

Linux/Unix社区

23,223

社区成员

74,537

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章