一个题

namewchlp 2010-10-20 05:52:10
在大规模数据处理中经常会用到大规模字典。现需要处理一个词搭配的字典。条件为:
1) 字典中存在的项是两个词的搭配,例如:字典中有“今天”和“晚上”是两个词,那么它们组成的搭配为“今天|晚上”和“晚上|今天”
2) 词的集合很大,约为10万量级
3) 一个词并不会和其他所有词搭配,通常只会和不超过1万个其他此搭配
4) 对字典的使用读操作很大,通常每秒有上千次请求,几乎没有写入需求。
请设计一个字典服务系统,当请求是两个词的搭配时,能够快速返回搭配的相关信息。请使用尽可能少的资源,并估算出需要使用的机器资源。
...全文
331 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
oo 2010-11-03
  • 打赏
  • 举报
回复
一个词分配一个ID
有关联的两个词组成一个ID1-ID2对,用一个int64可以表示

然后对这个int64做hash表

查找时查这个hash表即可

需要10w*1w个int64的存储空间
namewchlp 2010-11-03
  • 打赏
  • 举报
回复
确实是一个笔试题目 居然没人回答
michael122 2010-10-22
  • 打赏
  • 举报
回复
笔试题吧。。
huaer89 2010-10-20
  • 打赏
  • 举报
回复
楼主是要别人帮你写程序码?

33,008

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧