比如把"shu4jv4 suan4fa3"(数据 算法)切分成:"sh v 4 j u 4 s uan 4 f a 3"
数字代表声调,词之间有空格。
假设已经有声母b,p,m,f...和韵母a,o,e,i,u,v...的列表,
应该如何组织这些数据以及采取什么算法能使切分的速度最快?
能针对声母和韵母词典构造一个哈希表吗?还是有什么其他更快的切分-匹配算法?
因为特别强调速度,所以请斑竹和各位大虾给我一些提示。
...全文
3032打赏收藏
如何将汉语拼音序列快速切分成声母和韵母序列
比如把"shu4jv4 suan4fa3"(数据 算法)切分成:"sh v 4 j u 4 s uan 4 f a 3" 数字代表声调,词之间有空格。 假设已经有声母b,p,m,f...和韵母a,o,e,i,u,v...的列表, 应该如何组织这些数据以及采取什么算法能使切分的速度最快? 能针对声母和韵母词典构造一个哈希表吗?还是有什么其他更快的切分-匹配算法? 因为特别强调速度,所以请斑竹和各位大虾给我一些提示。