关于在XML中快速查找大量数据的算法
设有如下格式的数据(数据量比较大,有数十万条):
……
……
……
<work>
<![CDATA[vi.(使)工作 vt.[(使)工作 n.工作,劳动,作业]]>
<![CDATA[wə:k]]>
</work>
……
……
……
<task>
<![CDATA[工作,任务,差事]]>
<![CDATA[tɑ:sk]]>
</task>
……
……
……
1、现在要按中文查找英文,例如输入“工作”,将查找到work及task这两个单词。
2、要模糊查找单词,例如键入as,task将被找到;键入rk,work将被找到。
如果数据量少的话,上述的查找都不成问题,但是,在数据量大的情况下(数十万条),算法就很成问题了。大家对此有什么好的算法?