2023软工K班个人编程任务

李嘉骏102102122 2023-09-15 23:27:23

一、PSP表格

PSP2.1 Personal Software Process Stages 预估耗时（分钟）实际耗时（分钟）
Planning 计划 | 40 | 30 |
· Estimate · 估计这个任务需要多少时间 | 10 | 10 |
Development 开发 | 1200 | 1500 |
· Analysis · 需求分析 (包括学习新技术) | 300 | 350 |
· Design Spec · 生成设计文档 | 60 | 120 |
· Design Review · 设计复审 | 120 | 120 |
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) | 60 | 60 |
· Design · 具体设计 | 150 | 240 |
· Coding · 具体编码 | 240 | 320 |
· Code Review · 代码复审 | 30 | 30 |
· Test · 测试（自我测试，修改代码，提交修改） | 120 | 60 |
Reporting 报告 | 120 | 145 |
· Test Repor · 测试报告 | 30 | 45 |
· Size Measurement · 计算工作量 | 10 | 20 |
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 | 30 | 30 |
· 合计 | 2550 | 3110 |

二、任务要求的实现
（2.1）项目设计与技术栈。从阅读完题目到完成作业，这一次的任务被你拆分成了几个环节？你分别通过什么渠道、使用什么方式方法完成了各个环节？列出你完成本次任务所使用的技术栈。
这次任务被分为：规划任务、学习爬虫、编码实现、测试代码、总结报告
1.查看任务要求并思考如何完成 2.观看bilibili视频和csdn，并结合数据采集与融合技术课程所学爬虫知识 3.在csdn和bilibili上学习githu如何运用知识 4.完成博客作业
用到的技术栈有：request、re正则表达式，wordcloud词云可视化，jieba分割词汇，文件读写
（2.2）爬虫与数据处理。说明业务逻辑，简述代码的设计过程（例如可介绍有几个类，几个函数，他们之间的关系），并对关键的函数或算法进行说明。
代码主要有登录url网站，爬取网站弹幕，对弹幕内容进行读取并规划，进行词云分析，然后整合。
（2.3）数据统计接口部分的性能改进。
主要是再爬取数据和整合弹幕词云方面。
（2.4）数据结论的可靠性。介绍结论的内容，以及通过什么数据以及何种判断方式得出此结论
结论：弹幕中呼声较高的是关于海洋环境的保护，以及抵制日本排放核污水。是通过词云也就是词汇量的最高词汇来得到结论的。
（2.5）数据可视化界面的展示。

三、心得体会
1.本次作业的工作量大，需要学习的知识十分繁重，导致任务进度进展缓慢，也跟我自己的知识量不高有关
2.在爬取弹幕的过程中遇到了诸多问题，还是通过csdn和查询b站查找学习才得到方法。
3.感觉本次作业还是太过匆忙，争取下次能紧凑一点吧，这样才能跟上进度。

...全文