社区
C#
帖子详情
[100分]求汉字转拼音声母的最佳算法
csShooter
2005-09-06 10:59:56
who的算法好,分就给who!
要求:
(1) 认识率最大化,比如最好能达到认识如"踵zhong"这样的汉字!
(2) 最好能解决部份多音字问题:如"行 xing\hang"..
...全文
289
9
打赏
收藏
[100分]求汉字转拼音声母的最佳算法
who的算法好,分就给who! 要求: (1) 认识率最大化,比如最好能达到认识如"踵zhong"这样的汉字! (2) 最好能解决部份多音字问题:如"行 xing\hang"..
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
iheshi
2005-10-07
打赏
举报
回复
http://iheshi.cnblogs.com/archive/2005/10/07/249782.html
ybzsu
2005-09-06
打赏
举报
回复
我操
关注!!!
iloveyour
2005-09-06
打赏
举报
回复
还要解决多音字怕是没办法,难
orin_chan
2005-09-06
打赏
举报
回复
up~~~~~
csShooter
2005-09-06
打赏
举报
回复
在线等待..
csShooter
2005-09-06
打赏
举报
回复
jinjazz兄,对自己的代码太不负责了!...受批评哈!
csShooter
2005-09-06
打赏
举报
回复
兄弟们,努力啊!.....
jinjazz兄提供的方法也太老套,问题没解决!
jinjazz
2005-09-06
打赏
举报
回复
static public string GetChineseSpell(string strText)
{
int len = strText.Length;
string myStr = "";
for(int i=0;i<len;i++)
{
myStr += getSpell(strText.Substring(i,1));
}
return myStr;
}
static public string getSpell(string cnChar)
{
byte[] arrCN = Encoding.Default.GetBytes(cnChar);
if(arrCN.Length > 1)
{
int area = (short)arrCN[0];
int pos = (short)arrCN[1];
int code = (area<<8) + pos;
int[] areacode = {45217,45253,45761,46318,46826,47010,47297,47614,48119,48119,49062,49324,49896,50371,50614,50622,50906,51387,51446,52218,52698,52698,52698,52980,53689,54481};
for(int i=0;i<26;i++)
{
int max = 55290;
if(i != 25) max = areacode[i+1];
if(areacode[i]<=code && code<max)
{
return Encoding.Default.GetString(new byte[]{(byte)(65+i)});
}
}
return cnChar;
}
else return cnChar;
}
xamaizi
2005-09-06
打赏
举报
回复
mark!!
Pytorch基于mlm方式的带有纠错功能的
拼音
转
汉字
bert模型源码+项目说明+模型.zip
Pytorch基于mlm方式的带有纠错功能的
拼音
转
汉字
bert模型源码+项目说明+模型.zip 依赖 python>3.6 torch==1.4.0 tranformers==3.1.0 scikit-leran==0.23.2 目的 将可能包含有错误的
拼音
解码成正确的
汉字
序列,可...
论文研究-一种汉语方言编码与
转
换机制的研究.pdf
回顾了汉语
拼音
方案的组成和特点,
分
析了方言编码的可行性。引入二进制编码方式对
汉字
发音进行编码。编码序列包括了
声母
、韵母、音调、儿化音等编码部
分
。建立了方言音、修饰音、标准音之间的
转
换关系。以湘汨地区的...
拼音
加加 v4.9 便携版
它支持全拼、双拼、简拼、
声母
拼词、立即造词、频度调整、模糊音设置等;支持微软视窗全系列操作系统;支持 GBK 大字符集;无需切换,直接混合输入中英文;还精心设计的三重码技术,辅以左右 Shift 键选择重码,彻底...
HanLP:汉语语言处理-源码
一百兆内存) 最短路
分
词,N-最短路
分
词 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 感知机
分
词,CRF
分
词 词典
分
词(侧重速度,每秒数千万字符;省内存) 极速词典
分
词 所有
分
词器都支持: ...
hmm的matlab代码-HanLP:自然语言处理中文
分
词词性标注命名实体识别依存句法
分
析新词发现关键词短语提取自动摘要文本
分
类聚类
拼音
简繁h
一百兆内存) 、 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 、 词典
分
词(侧重速度,每秒数千万字符;省内存) 所有
分
词器都支持: 词性标注 (速度快) 、(精度高) 命名实体识别 基于HMM...
C#
110,545
社区成员
642,580
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章