118
社区成员
1.(1.1)在Github仓库中新建一个学号为名的文件夹,同时在博客正文首行给出作业Github链接。
https://github.com/qi-2/xieqi
(2.1)在开始实现程序之前,在附录提供的PSP表格记录下你估计将在程序的各个模块的开发上耗费的时间。
(2.2)在你实现完程序之后,在附录提供的PSP表格记录下你在程序的各个模块上实际花费的时间。
PSP2.1 | Persona Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 56 | 40 |
.Estimate | .估计这个任务需要多少时间 | 56 | 50 |
Development | 开发 | 560 | 400 |
.Analysis | .需求分析(包括学习新技术) | 42 | 30 |
.Design Spec | .生成设计文档 | 35 | 25 |
.Design Review | .设计复审 | 28 | 15 |
.Coding Standard | .代码规范(为目前的开发制定合适的规范) | 21 | 17 |
.Design | .具体设计 | 70 | 55 |
.Coding | .具体编码 | 252 | 230 |
.Code Review | .代码复审 | 49 | 10 |
.Test | .测试(自我测试,修改代码,提交修改) | 91 | 10 |
Reporting | 报告 | 63 | 15 |
.Test Repor | .测试报告 | 21 | 10 |
.Size Measurement | .计算工作量 | 14 | 10 |
.Postmortem & Process Improvement Plan | .事后总结,并提出过程改进计划 | 21 | 10 |
合计 |
(3.1)项目设计与技术栈。从阅读完题目到完成作业,这一次的任务被你拆分成了几个环节?你分别通过什么渠道、使用什么方式方法完成了各个环节?列出你完成本次任务所使用的技术栈。
拆分成四个环节,计划,编程,测试,修改
技术栈:
Python
requests库
re库
random模块
jieba
wordcloud
(3.2)爬虫与数据处理。说明业务逻辑,简述代码的设计过程(例如可介绍有几个类,几个函数,他们之间的关系),并对关键的函数或算法进行说明。
爬虫:通过在bilibili前加‘i’前往该页面获取弹幕网址,再复制到程序中进行爬取弹幕
(3.3)数据统计接口部分的性能改进。记录在数据统计接口的性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(例如可通过VS /JProfiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。
(3.4)数据结论的可靠性。介绍结论的内容,以及通过什么数据以及何种判断方式得出此结论
结论:由图可知,大部分人对日本的行为持抵制态度,并表态抵制日本商品,大部分国人怀有正确的是非观。
(3.5)数据可视化界面的展示。在博客中介绍数据可视化界面的组件和设计的思路。
(4.1)在这儿写下你完成本次作业的心得体会,当然,如果你还有想表达的东西但在上面两个板块没有体现,也可以写在这儿~
制作词云过程报错Process finished with exit code -1073741819 (0xC0000005),难以解决,本次作业还存在许多不足无法解决,需平时多加学习。