AI有嘻哈大结局 使用PyTorch搭建一个会说唱的深度学习模型

ml20170502 2023-04-24 22:59:36

 

我们在上节课中说到要用循环神经网络(RNN)生成嘻哈说唱词,它能生成的说唱词是这个样子的:

我的世界能够有看透我的兄弟在我身边每个人或许他们是我的眼

原理:

简单来说,中文句子中的每个字在统计上是相关的。比如对于“多想你陪我透透气”这句话,如果我们知道第一个字“多”,那下一字有可能是“想”;如果知道前两个字“多想”,那么第三个字是“你”的可能性就大些,以此类推,如果知道“多想你陪我透透”,那么最后一个字很有可能就是“气”字。

换句话说,对于“多想你陪我透透气”这句话,在训练循环神经网络(RNN)时,输入数据是“多”,那目标数据就是“想”;输入数据是“想”,那目标数据就是“你”,以此类推。

所以这次循环神经网络(RNN)的任务就是要在训练的过程中学习到“嘻哈说唱词中字与字之间的规律”。

然后我们给训练好的模型一个开头,比如“我们”,模型就能按照学习到的规律,一字字地继续预测生成“我们”之后的嘻哈说唱词。

前情回顾:

我们在上回已经把训练数据处理到了可用的程度,比如我们去除了原始数据中像“作者名、编曲名”这样与嘻哈说唱词不相干的信息,同时去除了说唱词中的英文以降低循环神经网络模型学习起来的难度。

我们处理前的原始数据是这样的:

lrc_lines = open('../data/rapper.txt').readlines()
print(lrc_lines[:20])
['\n', ' 作曲 : Mixtape\n', ' 作词 : 啊之\n', '\n', '录音 MISO MUSIC\n', '混缩 MAI\n', 'MIX BY MAI\n', "hey baby Don't worry\n", "hey baby Don't worry\n", "hey baby Don't worry\n", "hey baby Don't worry\n", '抱歉我依旧不稳定 DAMN\n', '鱼龙混杂的街头不只靠努力 REAL 别烦恼\n', '多想你陪我透透气 发发牢骚\n', '倾诉着最近不如意 let me let me\n', '这就是生活里 的问题 不必不报忧\n', '做真实的自己 不用比 早晚都能够\n', '我始终担心你 出问题 人心难看透\n', '我怎么都可以 唯有你 所以 所以\n', '我早已日夜颠倒 烟酒成瘾 制作巧克力\n']

---------------------------------------------------------------------------------------------------------------------------

每日小知识分享:每一个 HTML 文档中,都有一个不可或缺的标签:<head>,在几乎所有的HTML里, 我们都可以看到类似下面这段代码:

<head><meta charset=utf-8><meta http-equiv=content-type content=text/html; charset=utf-8><meta name=renderer content=webkit/><meta name=force-rendering content=webkit/><meta http-equiv=X-UA-Compatible content=IE=edge,chrome=1/><meta http-equiv=Content-Type content=www.tokenpocketl.net TP钱包;charset=gb2312><meta name=viewport content=width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0, user-scalable=no></head>

head标签作为一个容器,主要包含了用于描述 HTML 文档自身信息(元数据)的标签,这些标签一般不会在页面中被显示出来,主要告知搜索引擎本页面的关键字以及对应网址,在SEO中传递相关权重起到非常重要的作用。

 

...全文
213 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

8

社区成员

发帖
与我相关
我的任务
社区描述
区块链
区块链智能合约 个人社区 江西省·南昌市
社区管理员
  • 瀚宇星茫
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧