信息过滤系统的问题(急,高分求助)

robur 2005-11-04 06:12:43
声明:无论问题最后是否得到解决,本帖子肯定结贴给分!
只要参与讨论,我尽量都给分,但是灌水的除外。
如果得以完美解决,给关键人另开帖子给分!

我最近在做一套信息过滤的系统,就是为了判断一个文章的性质如何。已经基本完成了基于Bayes算法的文章性质判定、对同音异体字的检测处理和关键字过滤部分。
其实主要的判断依据是Bayes的结果,但是这样对Bayes过于依赖,而且准确性不高。用某个高手的话说,就是“幼稚Bayes”。

希望能跟大家讨论下相关的问题。
1、如何有效的绕开各种过滤系统;
2、有效的信息过滤算法;
3、信息过滤的发展方向。

另外,还想请教下,那些拆字的行为,我们如何处理?(如何识别这些拆开的文字)
比如:口斤 言兑 言仑 土云

不胜感激。。。
...全文
190 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
robur 2005-11-18
  • 打赏
  • 举报
回复
谢谢楼上各位的关注。我不是给政府做的,只是一个学术性的课题。
所以,对某些方面的要求并不需要达到某个标准。
zkx2321 2005-11-18
  • 打赏
  • 举报
回复
这个问题呀,有点意思。

伙计,你是给政府做的吗?看你的意思是针对网上的明文信息做的。

鄙人觉得有点像语言分析器。你不妨向这个方面考虑一下。
wudi626 2005-11-17
  • 打赏
  • 举报
回复
前沿,关注哈。
不过说到现在的加密似乎比这更神奇,可能是由于关注加密解密的人多推动其发展。希望更多的人关注这种技术,让其得以发展。
jianice 2005-11-10
  • 打赏
  • 举报
回复
拆开的字也想处理?别说电脑,人脑看多了都变比目鱼...

4,452

社区成员

发帖
与我相关
我的任务
社区描述
云计算 云安全相关讨论
社区管理员
  • 云安全社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧