关于歌词逐字显示的思路

Jerryup 2018-11-13 02:18:55
最近在用qt做个MP3播放器,已经实现了精准到读取每行歌词,但是如果想逐字解析歌词,只是用指定时间间隔扫描lrc文件,来计算遮罩的长度来近似的模拟,但是缺点是遮罩的速度是匀速的,有的歌词无法精准匹配,如何实现抽取每个字的时长,搞了很长时间没思路,能否有高手给个实现思路,谢谢
...全文
559 19 打赏 收藏 转发到动态 举报
写回复
用AI写文章
19 条回复
切换为时间正序
请发表友善的回复…
发表回复
aakzhangliangming 2019-09-16
  • 打赏
  • 举报
回复
https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个,一个android一个java,都实现了动感歌词显示
aakzhangliangming 2019-06-14
  • 打赏
  • 举报
回复
https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个,一个android一个java,都实现了动感歌词显示
aakzhangliangming 2019-04-21
  • 打赏
  • 举报
回复
https://github.com/zhangliangming/HappyPlayer5
https://github.com/zhangliangming/HappyPlayer-PC
看看这两个,一个android一个java,都实现了动感歌词显示
redboxf 2018-11-15
  • 打赏
  • 举报
回复
有点困难,每个字的时长不好确定的
Jerryup 2018-11-15
  • 打赏
  • 举报
回复
引用 12 楼 zjq9931 的回复:
[quote=引用 11 楼 Jerryup 的回复:] 酷狗的krc是获得专利的,估计肯定不是按字获取时间戳的
看一下专利公开的内容应当能猜到一些。我搜酷狗KRC专利没有搜到,你知道是什么专利名称吗? [/quote]这个我是在网上看到一些帖子是说krc有专利的,名称不太清楚,不过酷狗能做到听音识曲,我想语音识别技术肯定非常成熟了,做个krc不是什么难事吧
  • 打赏
  • 举报
回复
引用 14 楼 Jerryup 的回复:
这个我是在网上看到一些帖子是说krc有专利的,名称不太清楚,不过酷狗能做到听音识曲,我想语音识别技术肯定非常成熟了,做个krc不是什么难事吧
听音识曲确实是一种语音识别,这是识别旋律的,这个技术比语音识别文字更早。
英雄@末路 2018-11-14
  • 打赏
  • 举报
回复
语音识别来得及么?这个可是按字来识别的,还不如按字打时间戳呢。。。
  • 打赏
  • 举报
回复
引用 7 楼 Jerryup 的回复:
那酷狗的krc也是语音识别做的?
这个不知道,没有用过,不过原理肯定是相似的,如果不是人工做,就是语音识别。人工做的准确率更高一些,但成本高。
Jerryup 2018-11-14
  • 打赏
  • 举报
回复
引用 6 楼 zjq9931 的回复:
[quote=引用 5 楼 zjq9931 的回复:] [quote=引用 4 楼 Jerryup 的回复:]语音识别涉及到哪方面知识啊?
我也不是很懂,这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了,有的提供windows的有的不提供。 [/quote] 另外就是带上音乐了之后,识别率应当更低。。。[/quote]那酷狗的krc也是语音识别做的?
  • 打赏
  • 举报
回复
引用 11 楼 Jerryup 的回复:
酷狗的krc是获得专利的,估计肯定不是按字获取时间戳的
我网上看到了不少破解krc文件的,找一个krc文件,看看内容,就知道是怎么会事了。
  • 打赏
  • 举报
回复
引用 11 楼 Jerryup 的回复:
酷狗的krc是获得专利的,估计肯定不是按字获取时间戳的
看一下专利公开的内容应当能猜到一些。我搜酷狗KRC专利没有搜到,你知道是什么专利名称吗?
Jerryup 2018-11-14
  • 打赏
  • 举报
回复
引用 8 楼 zjq9931 的回复:
[quote=引用 7 楼 Jerryup 的回复:] 那酷狗的krc也是语音识别做的?
这个不知道,没有用过,不过原理肯定是相似的,如果不是人工做,就是语音识别。人工做的准确率更高一些,但成本高。[/quote]酷狗的krc是获得专利的,估计肯定不是按字获取时间戳的
  • 打赏
  • 举报
回复
引用 9 楼 hjwang77 的回复:
语音识别来得及么?这个可是按字来识别的,还不如按字打时间戳呢。。。
微信的语音识别可以不把语音放出来就识别,明白了吗?
  • 打赏
  • 举报
回复
引用 5 楼 zjq9931 的回复:
[quote=引用 4 楼 Jerryup 的回复:]语音识别涉及到哪方面知识啊?
我也不是很懂,这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了,有的提供windows的有的不提供。 [/quote] 另外就是带上音乐了之后,识别率应当更低。。。
  • 打赏
  • 举报
回复
引用 4 楼 Jerryup 的回复:
语音识别涉及到哪方面知识啊?
我也不是很懂,这里有一个百度的SDK http://ai.baidu.com/sdk#asr 看你是在什么平台上开发了,有的提供windows的有的不提供。
Jerryup 2018-11-13
  • 打赏
  • 举报
回复
引用 3 楼 zjq9931 的回复:
[quote=引用 2 楼 Jerryup 的回复:] [quote=引用 1 楼 zjq9931 的回复:] 歌词的时间是人写的,遮罩的变化速度肯定也要人写啊。 KTV的歌词变色就是根据字来的,肯定是人工做的,自动做,就需要用到语言识别了。
查了一下,有个叫小熊卡拉ok软件,是听到唱哪个字时候按下空格键,来确定字的时长,想弄个自动生成的,需要语音识别?[/quote] 是的,否则怎么能够判断唱到了哪个字呢? 还有就是如果是纯人声,还可以根据振幅的变化来判断(也不准)有音乐的时候根据振幅来判断就难了。[/quote]语音识别涉及到哪方面知识啊?
  • 打赏
  • 举报
回复
引用 2 楼 Jerryup 的回复:
[quote=引用 1 楼 zjq9931 的回复:] 歌词的时间是人写的,遮罩的变化速度肯定也要人写啊。 KTV的歌词变色就是根据字来的,肯定是人工做的,自动做,就需要用到语言识别了。
查了一下,有个叫小熊卡拉ok软件,是听到唱哪个字时候按下空格键,来确定字的时长,想弄个自动生成的,需要语音识别?[/quote] 是的,否则怎么能够判断唱到了哪个字呢? 还有就是如果是纯人声,还可以根据振幅的变化来判断(也不准)有音乐的时候根据振幅来判断就难了。
Jerryup 2018-11-13
  • 打赏
  • 举报
回复
引用 1 楼 zjq9931 的回复:
歌词的时间是人写的,遮罩的变化速度肯定也要人写啊。 KTV的歌词变色就是根据字来的,肯定是人工做的,自动做,就需要用到语言识别了。
查了一下,有个叫小熊卡拉ok软件,是听到唱哪个字时候按下空格键,来确定字的时长,想弄个自动生成的,需要语音识别?
  • 打赏
  • 举报
回复
歌词的时间是人写的,遮罩的变化速度肯定也要人写啊。 KTV的歌词变色就是根据字来的,肯定是人工做的,自动做,就需要用到语言识别了。

64,643

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧