语言解析优化!求高高手。。。

gotta521 2014-04-04 03:56:16
主语: 我、你、他、她
动词: 吃、喝、玩
名词: 米饭、馒头、面条、饮料、水、手机、游戏机

我喝饮料
我喝水
我玩手机
。。。。
等,采用 主语 + 动词 + 名词的形式。如何让计算机知道这些主语、动词、名词包含哪些词呢?
目前,采用的是java String contains()或者 indexOf() 方法,但是随着主语、动词、名词的量增加,性能会迅速下降。

谁有更好的方式呢?
...全文
415 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
MiceRice 2014-04-08
  • 打赏
  • 举报
回复
这属于典型的自己去发明轮子啊。。。 至少先把现在常规的算法熟悉后,再考虑要不要发明或改进吧。 另外顺便说下:搜索过程是反向的,是以句子为基础,到词库中检索。词库本身应该被分类索引,简单点就是B+树,用计算机编码即可;量不大的话(比如百万以内),直接用HashMap存储。 话说不知道你要做到什么级别,如果想做到Siri啥的,难度数量级恐怕太高了。。。
gotta521 2014-04-04
  • 打赏
  • 举报
回复
索引?如何建这个索引呢?根据拼音字母建二叉树么?
快快猪搞技术 2014-04-04
  • 打赏
  • 举报
回复
可以到网上查查分词算法,感觉会比你的方法高效一些
cchvsgame 2014-04-04
  • 打赏
  • 举报
回复
做个索引,然后用折半查找,性能不会是问题

25,985

社区成员

发帖
与我相关
我的任务
社区描述
高性能WEB开发
社区管理员
  • 高性能WEB开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧