如何效率更高

橘子皮... 2020-05-06 08:29:39
在字符中寻找可能存在的汉字拼音,然后分别替换成拼音的首字母
pingyin5656aaa 转成 py5656aaa
wu999han... 转成 w999h...
没有的就不转换,有啥效率高点的方法?
...全文
103 4 打赏 收藏 转发到动态 举报
写回复
用AI写文章
4 条回复
切换为时间正序
请发表友善的回复…
发表回复
wanghui0380 2020-05-06
  • 打赏
  • 举报
回复
百度了一下 https://baike.baidu.com/item/%E9%9F%B5%E6%AF%8D/2666749?fr=aladdin 中文韵母也就36个,你这问题一下就简化了
wanghui0380 2020-05-06
  • 打赏
  • 举报
回复
如果不管歧义,要快可以直接扫描 词根 xiang ---------------ang pinyin -------------in 基本上拼音后面韵母词根的前面扫1,2个字符。后去做个hashkey判定就好 比如上面 ang----------前面扫1个----iang-----还是韵母------再扫一个-------xiang--------这个应该就在你准备的hash词库里了 ang----------- --------------hang-------------------------------------------------再hash里 当然把前缀1,前缀2,韵母词根------扔给贝叶斯算概率也行。 当然我个人其实现在不纠结。快么这要求现在到不纠结。现在的项目未必要多快,了不起一个公用队列,,开8个docker,同时并行处理。单纯分析那么1条50个字符就是全扫也就1,2秒。8个并行docker足够调度了
wanghui0380 2020-05-06
  • 打赏
  • 举报
回复
利用jieba 分词后再弄(当然词库你的先预备着) 快不快难说,主要是有歧义的分法,就是俺们打字输入法有时候提示的都不对味儿啊。
橘子皮... 2020-05-06
  • 打赏
  • 举报
回复
已经收集了所有常见汉字的拼音

110,535

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 C#
社区管理员
  • C#
  • Web++
  • by_封爱
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧