2023软工K班个人编程任务

李嘉骏102102122 2023-09-15 23:27:23

github入口

一、PSP表格

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 | 40 | 30 |
· Estimate · 估计这个任务需要多少时间 | 10 | 10 |
Development 开发 | 1200 | 1500 |
· Analysis · 需求分析 (包括学习新技术) | 300 | 350 |
· Design Spec · 生成设计文档 | 60 | 120 |
· Design Review · 设计复审 | 120 | 120 |
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) | 60 | 60 |
· Design · 具体设计 | 150 | 240 |
· Coding · 具体编码 | 240 | 320 |
· Code Review · 代码复审 | 30 | 30 |
· Test · 测试(自我测试,修改代码,提交修改) | 120 | 60 |
Reporting 报告 | 120 | 145 |
· Test Repor · 测试报告 | 30 | 45 |
· Size Measurement · 计算工作量 | 10 | 20 |
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 | 30 | 30 |
· 合计 | 2550 | 3110 |

二、任务要求的实现
(2.1)项目设计与技术栈。从阅读完题目到完成作业,这一次的任务被你拆分成了几个环节?你分别通过什么渠道、使用什么方式方法完成了各个环节?列出你完成本次任务所使用的技术栈。
这次任务被分为:规划任务、学习爬虫、编码实现、测试代码、总结报告
1.查看任务要求并思考如何完成 2.观看bilibili视频和csdn,并结合数据采集与融合技术课程所学爬虫知识 3.在csdn和bilibili上学习githu如何运用知识 4.完成博客作业
用到的技术栈有:request、re正则表达式,wordcloud词云可视化,jieba分割词汇,文件读写
(2.2)爬虫与数据处理。说明业务逻辑,简述代码的设计过程(例如可介绍有几个类,几个函数,他们之间的关系),并对关键的函数或算法进行说明。
代码主要有登录url网站,爬取网站弹幕,对弹幕内容进行读取并规划,进行词云分析,然后整合。
(2.3)数据统计接口部分的性能改进。
主要是再爬取数据和整合弹幕词云方面。
(2.4)数据结论的可靠性。介绍结论的内容,以及通过什么数据以及何种判断方式得出此结论
结论:弹幕中呼声较高的是关于海洋环境的保护,以及抵制日本排放核污水。是通过词云也就是词汇量的最高词汇来得到结论的。
(2.5)数据可视化界面的展示。

三、心得体会
1.本次作业的工作量大,需要学习的知识十分繁重,导致任务进度进展缓慢,也跟我自己的知识量不高有关
2.在爬取弹幕的过程中遇到了诸多问题,还是通过csdn和查询b站查找学习才得到方法。
3.感觉本次作业还是太过匆忙,争取下次能紧凑一点吧,这样才能跟上进度。

...全文
72 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

117

社区成员

发帖
与我相关
我的任务
社区描述
2023福州大学软件工程K班
软件工程 高校 福建省·福州市
社区管理员
  • kevinkex
  • Devil angel
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧