拼音匹配算法的讨论
xingguan 这里原来应是由两个拼音(xing,guan )组成的词:性观。但它又可以拆分出达6个拼音,分别五个xi,xin ,xing ,gu ,an,gua, guan 。
最理想字结果。符串匹配,将所有字母都用到,应是匹配出完整两组
1 性观(xing,guan)和
2.xing gu an 星故安
不理想的结果。在通过普通的字符匹配方法,有可能出现这样的结果。
1. xi,gu,an 拆分为3个拼音,缺少第3、4两个字母:ng
2. xi,guan 拆分为2个拼音,缺少第3、4两个字母:ng
3. xin,gu,an 拆分为3个拼音,缺少第4个字母:g
4. xin guan 拆分为2个拼音,缺少第4个字母:g
5. xi,gua 拆分为2个拼音,缺少第3、4、8个字母:ngn
5. xin,gua 拆分为2个拼音,缺少第3、8个字母:gn
5. xing,gua 拆分为2个拼音,缺少第8个字母:n
有什么算法可以实现第一种匹配,而避免产出不理想的结果呢???