统计报纸一篇文章名词个数?

xiuhe 2006-07-22 02:51:56
老师给出一个课题,统计一篇报纸上名词的个数。我们班上的同学基本都放弃了,我觉得通过算法应该能解决,哪怕接近正确值。
请高手们帮忙分析一下。先谢谢了。
...全文
180 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
ASDC001 2006-07-22
  • 打赏
  • 举报
回复
这个难点在于怎么确定哪几个字是一个词,然后确定这个词是名词
这个金山词霸到是会,自己做吧,难啊。

笨办法:
1。把所有名词做成一个数据库。(这个看你有没有,有=简单,没有=难)
2。将一篇文章从头开始,逐字计算,取出来跟数据库里的记录比较,速度就看算法功底啦。

方法笨,但理论上应该可以实现,精确度根据你的数据库词的广度。


diandian82 2006-07-22
  • 打赏
  • 举报
回复
名词的个数?

========================

什么语言?英语?
还要判断是不是名词
xiuhe 2006-07-22
  • 打赏
  • 举报
回复
kavinsnow(落叶) ( ) 信誉:100 2006-07-22 15:11:00 得分: 0


看过C#primer这本书吗?里面有你要的答案的提示.


_________________________________________________________________________________
能说的再明白点吗?谢谢,你说的是《C#入门经典》?
syeerzy 2006-07-22
  • 打赏
  • 举报
回复
"哪怕接近正确值。"



多找些报纸,数出多少名词,多少总词数(多找些人...很多很多人,人多力量大...呵呵). 然后求出个平均值,比如46.5%是名词...多弄些报纸,让这个词相对准一些.---------->当然如果已经有人做过了,你也可以拿人家的现成结果.


然后,计算总词数,乘上百分比.....



当然是不准的,不过却不是没有依据的.
cpio 2006-07-22
  • 打赏
  • 举报
回复

借助其它的图片转文字软件吧

自己做可麻烦大了
lotuswlz 2006-07-22
  • 打赏
  • 举报
回复
恐怕你得先把所有可能出现的名词存入文件或者数据库里,然后再跟文章对比,不然我想是没办法了。
kissknife 2006-07-22
  • 打赏
  • 举报
回复
重点不是算法的问题...是语文的问题
kavinsnow 2006-07-22
  • 打赏
  • 举报
回复
看过C#primer这本书吗?里面有你要的答案的提示.
xiuhe 2006-07-22
  • 打赏
  • 举报
回复
在线等待中。。。

110,538

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧