一个题
在大规模数据处理中经常会用到大规模字典。现需要处理一个词搭配的字典。条件为:
1) 字典中存在的项是两个词的搭配,例如:字典中有“今天”和“晚上”是两个词,那么它们组成的搭配为“今天|晚上”和“晚上|今天”
2) 词的集合很大,约为10万量级
3) 一个词并不会和其他所有词搭配,通常只会和不超过1万个其他此搭配
4) 对字典的使用读操作很大,通常每秒有上千次请求,几乎没有写入需求。
请设计一个字典服务系统,当请求是两个词的搭配时,能够快速返回搭配的相关信息。请使用尽可能少的资源,并估算出需要使用的机器资源。