求助！如下功能该如何实现！

爱吃辣子鸡阿 2017-11-27 02:45:52

编写一个简单网络爬虫脚本，统计任一指定网页里特殊关键词，例如“学生”出现的次数，执行环境
为CentOS 6.9，使用wget抓取网页。

具体要求：
a、脚本输入参数为：关键字指定页面URL
b、只统计网页<body>...</body>标记之间的内容；
c、统计子链接内容，但需要去除重复的链接（相同的子链接和子链接的父链接），统计连接深度为3；
指定页面URL
|____子页面1
| |____子页面1
| |____......
| |____子页面n
|____......
|
|____子页面n
|____子页面1
|____......
|____子页面n

d、在用户主目录下创建结果目录：名称为学号，权限设为755，结果目录下再创建content子目录，权
限同样设为755；
e、将wget download下来的网页按如下格式存储在结果目录的content子目录下，文件名称按如下格式
命名：
指定页面名称为 0.<url>
子页面名称为 0.x.<url>
子页面的子页面名称为 0.x.y.url
f、输出一个中间计算结果文件，名称为intermediate：存放在结果目录下，格式如下：
行号:<URL1><TAB><Key word><TAB><count>
行号:<URL2><TAB><Key word><TAB><count>
...
行号:<URLn><TAB><Key word><TAB><count>
g、输出结果文件，名称为result，存放在结果目录下，文件格式如下：
<keyword><TAB><total amount>
h、脚本需要考虑防错处理、效率和程序结构。

...全文

181 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

要利用多级菜单实现各种功能。内容如下：1．无向图的基本操作及应用① 创建无向图的邻接矩阵② 创建无向图的邻接表③ 无向图的深度优先遍历④ 无向图的广度优先遍历2．无向网的基本操作及应用① 创建无向网的邻接...

一、（共50分）利用DOS系统功能调用编写汇编程序，在屏幕上显示自己学号的后4个数字符号。例如，你的学号如果是20191234，则在屏幕上显示出‘1234’。具体要求如下：（1）编写出完整的汇编语言程序；（2）利用宏...

求助！！！！用单片机的定时器T1怎么写一个LED亮2秒灭3秒的程序 C语言关注:120答案:4mip版解决时间 2021-02-05 00:55提问者習慣邇的習慣2021-02-04 14:09求助！！！！用单片机的定时器T1怎么写一个LED亮2秒灭3秒的...

今天带来的是基于微信小程序的高校报修求助系统，高校报修...实现功能：首页、公告栏、模块管理（文章分类、学生文章、职工文章、校园文章、宿舍报修、室内报修、室外报修、网络报修、求助信息、用户反馈、职工反馈）

JavaScript操作cookie实现记住用户名密码功能（一）由来简述最近一段时间在使用springboot编写一个简单的小系统，但是写到登录注册时，...主要实现了如下的一些功能： 1、页面加载完检测是否有cookie，有的话，把co

Linux/Unix社区

23,116

社区成员

74,506

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章