关于文件中搜索词组的算法问题,请多指教,我已经没辄了

lvzhong 2001-07-23 05:33:56
把一句英文翻译成中文是,小弟遇到了拆分词组的问题。目前我用的方法是这样的
先搜索第一词,在搜索一、二两词 在搜索一、二、三三个词。。。直到词库之找不
到词组 例如:Go shoping at once. 一句,先从词库找go 再找 go shoping 再找
go shoping at 则确定 go shoping是词组。 从词库中搜索单词使用的是二分法。

向上面那样找词组太傻了。那位老大能教我一个比较快的方法。使用vb60编写
我看有的人做的挺快的。
只要能提出具体意见的就给分。
...全文
95 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
lvzhong 2001-07-28
  • 打赏
  • 举报
回复
谢谢各位,请继续发言。头脑风暴也挺好玩的
wangxiaojun1981 2001-07-27
  • 打赏
  • 举报
回复
这样行不行:
词组库的建立用树形结构!这样可以减少搜索的时间!从词到词组也挺快的!如果从词到词的组话!
比如 第一次搜到go 在go 的孩子中无shoping continue;
第二次搜到shoping 在shoping 的孩子中无at continue;
第三次搜到at 在at 的孩子中找到了 once break;
这样把第一此搜到后的再搜的范围降的很低了!
第一次搜 Go shoping at once 肯定是搜不到的!在词组库中不可能有一个句子的!而且这么长的模式匹配是很难匹配成功的!越长的字符组的模式匹配时间复杂度是越大的!但是可以这样:
第一次:整个句子进行模式匹配 找到匹配程度最大的词组(判断匹配字符数就可以了);
第二次:把剩下来的部分当成下一次匹配的字符组!重复第一次(第归就可以了);
这是我的看法!不知道对不对!请指教!
one_add_one 2001-07-27
  • 打赏
  • 举报
回复
goto:
http://www.souwu.com/
lvzhong 2001-07-25
  • 打赏
  • 举报
回复
多谢laozi(老子)老兄的指点
不知小弟这样,理解是否正确,还以Go shoping at once. 为例:
第一次搜索 Go shoping at once;第二次 Go shoping at第三次Go shoping;第四次at once 。
希望老兄能给讲的详细一点。
词库里的单词和词组是以字母顺序排序的,空格也算。
多谢laozi(老子)老兄请再给帮帮忙

laozi 2001-07-24
  • 打赏
  • 举报
回复
你的方法有问题,其实不应该从词到词组,而是应该从词组到词。在词库里把词组按字母顺序排列,空格也算。以第一个单词为基准进行比较。

33,028

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧