第二次的软件工程作业

102101240黄斌源 2023-09-15 13:04:22
这个作业属于哪个课程2023秋-福州大学软件工程
这个作业要求在哪里<2023秋软工实践个人作业二>
这个作业的目标学会python基本语法,了解requests、beautifulsoup、urllib、re等库的一些常用用法,在AIGC的帮助下,使用爬虫,用tkinter库制作相应的GUI页面
学号102101240

本项目Github代码仓库

spider.py是爬虫,GUI视图就是GUI界面.py

luogu是我爬取到的题目和题解存放的文件夹

AIGC表格

子任务预估哪些部分使用AIGC实际中哪些部分使用AIGC
爬取题目发起get请求获取源码都可以
爬取题解获取网页源码,直接得到题解的.md文件需自行解码,在题解的截取中可以用到AIGC
数据储存和命名自行命名并找好存储路径命名规则需自己定义
GUI可视化和搜索直接得到一个GUI可视化界面可以,但是具体如何搜索得自己加

1.遇到的困难(苦难

  • 不会python,不会爬虫,花了一天时间学
  • 学完之后还是不是很懂怎么爬,上网剽窃了一下其他人的智慧
  • 网上的智慧终归不是自己的,爬10题不给爬了,在看到聪慧的群友发的贴子之后,知道了是没有伪装完全和没有爬取的间歇时间导致的
  • 爬题解本来想用相同的方法爬,发现需要解码,又啥都不会,又在聪明的群友帮助下得到解决了
  • 题解的截取,在GPT的帮助下好像没有解决
  • 难度是真的不会爬,于是又又又剽窃了(没办法只能当小偷好吧)
  • GUI界面不知道咋弄搜索,在GPT帮助下,成功写出了一个很丑并且功能很差的界面(怪我)

总结,群友是万能的!!!

2.难看前端展示

说一下这么丑且难用的前端是怎么用的,首先输入关键字,然后选择难度(我把题解也放里面了,实在不知道咋搞的),然后就可以选择文件夹了,我爬取的题目和题解都在桌面的文件夹里,所以要选择桌面的文件夹。

img

什么都不懂,只能搞个最简单的,非常少的功能

3.爬取结果展示

img

弄不出题解的截取,所以题解大小大概是题目的十倍,希望到时候有万能的群友能讲解一下。

爬取的题目和题解的展示

img

img

3.单元测试

img

这里大概就是打印出题解的md格式,看看解码过程和截取过程是否顺利,但是好像截取过程并不顺利

4.学会的内容和心得体会

内容:python基本语法,爬虫和一点的反爬,AIGC的使用,一点tkinter库的使用

心得体会:很后悔前两年没多学点东西,导致现在啥都不会很痛苦。

代码方面写得非常乱,冗余度非常高,基本不大能改,一改就错。希望下次可以改进,尽量模块化一点。

5.PSP表格

Personal Software Process Stages预估耗时实际耗时
学习新技术一天两天
具体编码一天一天半吧
测试并修改半天半天
...全文
64 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

107

社区成员

发帖
与我相关
我的任务
社区描述
2023秋-福州大学软件工程
软件工程 高校
社区管理员
  • fzusdn
  • qq_54359329
  • Jason_Zhou1
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧