2022（春）软工作业2：个人编程练习

李灏0 2022-05-25 19:18:17

1.程序分析，对程序中的四个函数做简要说明

# 读文件到缓冲区
def process_file(dst):
try: # 打开文件
f = open(dst, 'r') # dst为文本的目录路径
except IOError as s:
print(s)
return None
try: # 读文件到缓冲区
bvffer = f.read()
except:
print('Read File Error!')
return None
f.close()
return bvffer

# 统计词频函数
def process_buffer(bvffer):
if bvffer:
new_bvffer = re.sub(r'[^A-Za-z]', ' ', bvffer) # 使用正则表达式把除了字母和空格以外的符号都去除
words = new_bvffer.split()
word_freqs = {}
for word in words:
if word.lower() in word_freqs:
word_freqs[word.lower()] = word_freqs[word.lower()] + 1
else:
word_freqs[word.lower()] = 1
return word_freqs

# 输出结果
def output_result(word_freq):
if word_freq:
sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
for item in sorted_word_freq[:10]: # 输出 Top 10 的单词
print(item)

#函数调用
def main():
dst = "C:\Users\hp\Documents\Tencent Files\2190820592\FileRecv\Gone_with_the_wind.txt
"
bvffer = process_file(dst)
word_freq = process_buffer(bvffer)
output_result(word_freq)

2.代码风格说明。

一个缩进级别四个空格。

(1). 连续行使用两种方式使封装元素成为一行：括号内垂直隐式连接 & 悬挂式缩进。使用悬挂式缩进应该注意第一行不应该有参数，连续行要使用进一步的缩进来区分。

# 括号内隐式连接，垂直对齐
foo = long_function_name(var_one, var_two,
var_three, var_four)

# 悬挂缩进，进一步缩进区分其他语句def long_function_name(
var_one, var_two, var_three,
var_four):
print(var_one)
# 悬挂缩进，一般是四个空格，但非必须
foo = long_function_name(
var_one, var_two,
var_three, var_four)
否：
# 括号内隐式连接，没有垂直对齐时，第一行的参数被禁止
foo = long_function_name(var_one, var_two,
var_three, var_four)
# 悬挂缩进，需要进一步的缩进区分其他行def long_function_name(
var_one, var_two, var_three,
var_four):
print(var_one)
2.当 if 语句过长时，可选的处理方式，但不限于此：
# 不使用额外缩进if (this_is_one_thing and
that_is_another_thing):
do_something()

# 增加注释区分，支持语法高亮if (this_is_one_thing and
that_is_another_thing):
# Since both conditions are true, we can frobnicate.
do_something()
# 条件连续行额外缩进if (this_is_one_thing
and that_is_another_thing):
do_something()

3.程序运行命令、运行结果截图

4.性能分析结果及改进

运行次数最多的代码

 sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)

运行时间最长的代码

def process_buffer(bvffer):
if bvffer:
word_freq = {} # 新建一个空字典word_freq
# 下面添加处理缓冲区 bvffer代码，统计每个单词的频率，存放在字典word_freq
for word in bvffer.split(): # .split()函数将bvffer切片
if word not in word_freq:
word_freq[word] = 0
word_freq[word] += 1
return word_freq

存在的问题

句首的大写单词被当作新单词，应该改写process_buffer,使用.lower()将句首的大写字母改为小写,同时去除文本中的中英文标点符号

def process_buffer(bvffer): # 处理缓冲区，返回存放每个单词频率的字典word_freq
if bvffer:
# 下面添加处理缓冲区bvffer代码，统计每个单词的频率，存放在字典word_freq
word_freq = {}
# 将文本内容都改为小写且去除文本中的中英文标点符号
for ch in '“‘!;,.?”':
bvffer = bvffer.lower().replace(ch, " ")
# strip()删除空白符（包括'/n', '/r','/t'）；split()以空格分割字符串
words = bvffer.strip().split()
for word in words:
word_freq[word] = word_freq.get(word, 0) + 1
return word_freq

通过cprofile性能评估可知，调用次数、执行时间最多的部分代码是process_buffer函数部分。

...全文

94 回复打赏收藏转发到动态举报

写回复

用AI写文章

切换为时间正序

请发表友善的回复…

发表回复

个人软件过程是一种可用于控制、管理和改进个人工作方式的自我持续改进过程，是一个包括软件开发表格、指南和规程的结构化框架。PSP与具体的技术（程序设计语言、工具或者设计方法）相对独立，其原则能够应用到几乎任何的软件工程任务之中。确定过程的改变对软件工程师能力的影响。用"悲"、"哭"、"泣"等同义词表示悲。Step2：阅读理解以下编程任务，并估计完成这些任务需要的时间，填表写PSP表中预估耗时（时间单位：分钟）Step5：写出这次实验与以往编程练习不同之处，感受（体会）、经验教训。实验名称：个人编程项目练习。

学习目标：提示：这里可以添加学习目标例如：一周掌握 Java 入门知识学习内容：提示：这里可以添加要学的内容例如：搭建 Java 开发环境掌握 Java 基本语法掌握条件语句掌握循环语句学习时间：提示：这里可以添加计划学习的时间例如：周一至周五晚上 7 点—晚上9点周六上午 9 点-上午 11 点周日下午 3 点-下午 6 点学习产出：提示：这里统计学习计划的总量例如：技术笔记 2 遍 CSDN 技术博客 3 篇习的 vlog 视频 1

1 自我介绍2 项目中遇到的困难，怎么解决的3 场景题，一个项目需要4天完成，现在需要你2天完成，你会怎么做4 场景题，接3，接到项目，你会最先考虑什么？哈哈哈哈，上周学校一个宣讲会点击就送，因为等offer没去，周末发现挂了，加hr微信去问，顺便叫我朋友一起，结果今天他的岗位确认直接三方了，我选的岗位不缺人彻底。但是架构图却并不好设计，需要。简介最近这两年互联网行业的行情很不好，找工作的人多了，可是工作岗位却变少了，找工作变得越来越难，很多人简历投了一大堆，可是却拿不到面试机会，其实除了大环境的问题。

Note: 以下 `markdown` 格式文本由 `json2md` 自动转换生成，可参考[JSON转Markdown：我把阅读数据从MongoDB中导出转换为.md了](https://blog.csdn.net/u013810234/article/details/113360229)了解具体的转换过程。2022年读书笔记

南通大学-软件工程

197

社区成员

425

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

只讨论科学和技术问题

试试用AI创作助手写篇文章吧

+ 用AI写文章