关于歌词逐字显示的思路

Jerryup 2018-11-13 02:18:55

最近在用qt做个MP3播放器，已经实现了精准到读取每行歌词，但是如果想逐字解析歌词，只是用指定时间间隔扫描lrc文件，来计算遮罩的长度来近似的模拟，但是缺点是遮罩的速度是匀速的，有的歌词无法精准匹配，如何实现抽取每个字的时长，搞了很长时间没思路，能否有高手给个实现思路，谢谢

...全文

559 19 打赏收藏转发到动态举报

写回复

用AI写文章

19 条回复

切换为时间正序

请发表友善的回复…

发表回复

aakzhangliangming 2019-09-16

打赏
举报

https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个，一个android一个java，都实现了动感歌词显示

aakzhangliangming 2019-06-14

打赏
举报

https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个，一个android一个java，都实现了动感歌词显示

aakzhangliangming 2019-04-21

打赏
举报

https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个，一个android一个java，都实现了动感歌词显示

redboxf 2018-11-15

打赏
举报

有点困难，每个字的时长不好确定的

Jerryup 2018-11-15

打赏
举报

引用 12 楼 zjq9931 的回复:

[quote=引用 11 楼 Jerryup 的回复:] 酷狗的krc是获得专利的，估计肯定不是按字获取时间戳的

看一下专利公开的内容应当能猜到一些。我搜酷狗KRC专利没有搜到，你知道是什么专利名称吗？ [/quote]这个我是在网上看到一些帖子是说krc有专利的，名称不太清楚，不过酷狗能做到听音识曲，我想语音识别技术肯定非常成熟了，做个krc不是什么难事吧

蠓虫带着秤砣飞 2018-11-15

打赏
举报

引用 14 楼 Jerryup 的回复:

这个我是在网上看到一些帖子是说krc有专利的，名称不太清楚，不过酷狗能做到听音识曲，我想语音识别技术肯定非常成熟了，做个krc不是什么难事吧

听音识曲确实是一种语音识别，这是识别旋律的，这个技术比语音识别文字更早。

英雄@末路 2018-11-14

打赏
举报

语音识别来得及么？这个可是按字来识别的，还不如按字打时间戳呢。。。

蠓虫带着秤砣飞 2018-11-14

打赏
举报

引用 7 楼 Jerryup 的回复:

那酷狗的krc也是语音识别做的？

这个不知道，没有用过，不过原理肯定是相似的，如果不是人工做，就是语音识别。人工做的准确率更高一些，但成本高。

Jerryup 2018-11-14

打赏
举报

引用 6 楼 zjq9931 的回复:

[quote=引用 5 楼 zjq9931 的回复:] [quote=引用 4 楼 Jerryup 的回复:]语音识别涉及到哪方面知识啊？

我也不是很懂，这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了，有的提供windows的有的不提供。 [/quote] 另外就是带上音乐了之后，识别率应当更低。。。[/quote]那酷狗的krc也是语音识别做的？

蠓虫带着秤砣飞 2018-11-14

打赏
举报

引用 11 楼 Jerryup 的回复:

酷狗的krc是获得专利的，估计肯定不是按字获取时间戳的

我网上看到了不少破解krc文件的，找一个krc文件，看看内容，就知道是怎么会事了。

蠓虫带着秤砣飞 2018-11-14

打赏
举报

引用 11 楼 Jerryup 的回复:

酷狗的krc是获得专利的，估计肯定不是按字获取时间戳的

看一下专利公开的内容应当能猜到一些。我搜酷狗KRC专利没有搜到，你知道是什么专利名称吗？

Jerryup 2018-11-14

打赏
举报

引用 8 楼 zjq9931 的回复:

[quote=引用 7 楼 Jerryup 的回复:] 那酷狗的krc也是语音识别做的？

这个不知道，没有用过，不过原理肯定是相似的，如果不是人工做，就是语音识别。人工做的准确率更高一些，但成本高。[/quote]酷狗的krc是获得专利的，估计肯定不是按字获取时间戳的

蠓虫带着秤砣飞 2018-11-14

打赏
举报

引用 9 楼 hjwang77 的回复:

语音识别来得及么？这个可是按字来识别的，还不如按字打时间戳呢。。。

微信的语音识别可以不把语音放出来就识别，明白了吗？

蠓虫带着秤砣飞 2018-11-13

打赏
举报

引用 5 楼 zjq9931 的回复:

[quote=引用 4 楼 Jerryup 的回复:]语音识别涉及到哪方面知识啊？

我也不是很懂，这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了，有的提供windows的有的不提供。 [/quote] 另外就是带上音乐了之后，识别率应当更低。。。

蠓虫带着秤砣飞 2018-11-13

打赏
举报

引用 4 楼 Jerryup 的回复:

语音识别涉及到哪方面知识啊？

我也不是很懂，这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了，有的提供windows的有的不提供。

Jerryup 2018-11-13

打赏
举报

引用 3 楼 zjq9931 的回复:

[quote=引用 2 楼 Jerryup 的回复:] [quote=引用 1 楼 zjq9931 的回复:] 歌词的时间是人写的，遮罩的变化速度肯定也要人写啊。 KTV的歌词变色就是根据字来的，肯定是人工做的，自动做，就需要用到语言识别了。

查了一下，有个叫小熊卡拉ok软件，是听到唱哪个字时候按下空格键，来确定字的时长，想弄个自动生成的，需要语音识别？[/quote] 是的，否则怎么能够判断唱到了哪个字呢？还有就是如果是纯人声，还可以根据振幅的变化来判断（也不准）有音乐的时候根据振幅来判断就难了。[/quote]语音识别涉及到哪方面知识啊？

蠓虫带着秤砣飞 2018-11-13