社区
脚本语言
帖子详情
python词频统计
tangjingxiao
2011-10-11 09:54:32
实现对单个文档词频统计和对多个文档共词词频统计,将统计结果输出到另外一个txt文档中,对多个文档,需要指明词当前所在的文档名。
...全文
624
13
打赏
收藏
python词频统计
实现对单个文档词频统计和对多个文档共词词频统计,将统计结果输出到另外一个txt文档中,对多个文档,需要指明词当前所在的文档名。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
13 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
荷兰人号
2011-11-04
打赏
举报
回复
怎么实现分词呢?
jiaweiqq123
2011-11-03
打赏
举报
回复
mapreduce里面的wordcount用例,好简单的说
jibohe2
2011-10-29
打赏
举报
回复
我可以帮你。需要的话给我写邮件吧hejibo@ueseo.org
[Quote=引用楼主 tangjingxiao 的回复:]
实现对单个文档词频统计和对多个文档共词词频统计,将统计结果输出到另外一个txt文档中,对多个文档,需要指明词当前所在的文档名。
[/Quote]
gle2135_15993328320
2011-10-20
打赏
举报
回复
这个问题好眼熟啊,曾经用perl做过。。。
tangjingxiao
2011-10-20
打赏
举报
回复
[Quote=引用 7 楼 alliwannasay 的回复:]
提供一段代码 实现单个文本的word统计
#!/usr/bin/env python
dic={}
for i in open('data.txt'):
array=[]
i=i.strip()
array=i.split()
for j in array:
if not dic.has_key(j):
dic[j]=0
dic[j]+=1
……
[/Quote]
python3.2中has_key已经没有了
stewartzy
2011-10-16
打赏
举报
回复
这是mapreduce的作业吧,网上有的是,看一下就是了
alliwannasay
2011-10-16
打赏
举报
回复
提供一段代码 实现单个文本的word统计
#!/usr/bin/env python
dic={}
for i in open('data.txt'):
array=[]
i=i.strip()
array=i.split()
for j in array:
if not dic.has_key(j):
dic[j]=0
dic[j]+=1
for i in dic.keys():
print i,dic[i]
效率还不错 5M的文本1S内出结果。
tangjingxiao
2011-10-14
打赏
举报
回复
统计中文文章里面的词
aidings
2011-10-13
打赏
举报
回复
什么意思。如果是统计string 出现多少次用str.count()
tangjingxiao
2011-10-12
打赏
举报
回复
关键是我刚开始学,不会。。。
iambic
2011-10-11
打赏
举报
回复
这么简单的作业,自己写。
mkki
2011-10-11
打赏
举报
回复
没开明白,要表达什么意思
libralibra
2011-10-11
打赏
举报
回复
不就是string.count吗?
python
词频统计
2
python
词频统计
2
python
信用评分卡建模(附代码)
作者Toby,持牌照消费金融模型专家,发明金融模型算法专利,和中科院,清华大学,百度,腾讯,爱奇艺,同盾,聚信立等平台保持长期项目合作;与国内多所财经大学有模型项目。熟悉消费金融场景业务,包括现金贷,商品贷,医美,反欺诈等。擅长
Python
机器学习建模,对变量筛选,衍生变量构造,变量缺失率高,正负样本不平衡,共线性高,多算法比较,调参等有良好解决方法。原创公众号(
python
风控模型) 课程概述A级优质课,360度讲解
python
信用评分卡构建流程,解决个人信用评级和企业信用评级模型的难题。课程附
python
代码直接使用,支持老师答疑。算法采用逻辑回归。弥补了网络上讲解不全,信息参差不齐的短板。个人信用评级模型可自动化审批客户资质,让银行,消费金融,小额贷贷款风险最小化并将利润最大化。企业信用评级模型可自动筛选优质企业和不良企业,为评级机构,企业融资,银行贷款,企业上市,企业并购,企业债发行提供有价值参考。
python
金融风控评分卡模型和数据分析系列课
python
词频统计
资源1
python
词频统计
资源1
python
词频统计
(csdn)————程序.pdf
python
词频统计
(csdn)————程序
脚本语言
37,720
社区成员
34,239
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章