217
社区成员
这个作业属于哪个课程 | 2023 年福大-软件工程实践-W 班 |
---|---|
这个作业要求在哪里 | 软件工程实践团队作业一 |
这个作业的目标 | 建立开发小组,明确选题意义与需求分析 |
其他参考文献 | ChatGPT, 《构建之法》 |
我们的队名是: YACW 株式会社
学号 | 姓名 | CSDN 地址 | 成员性格 | 擅长的技术 | 兴趣爱好 | 希望的软工角色 | slogan |
---|---|---|---|---|---|---|---|
062000224 | Lao_Liu | 地址 | 沉稳、但是有时又挺莽撞的 (?) | 软硬件都会一点,架构设计也会一点 | 写代码(真的),看番,听歌,DIY | PM/全栈 (目前主要做前端) | Think. Feel. Brave. |
222000407 | 胡彦杰 | 地址 | 温和坚定 | Java,需求分析 | 美食,电影,运动 | 后端,需求分析师 | 越努力,越幸运。 |
222000333 | xy | 地址 | 儒雅随和 | 泛而不精 | 跑步,看漫画 | 前端 | 长风破浪会有时 |
182000318 | 刘伟文 | 地址 | 好相处、好说话、开朗乐观 | C++(一点点)、Java(一点点) | 唱歌、看小说 | 前端 | 代码和我,有一个能跑就好 |
082000407 | fmf | 地址 | 善良、乐观、开朗 | 一点点 C++,一些 Java | 玩游戏 | 前端 | 努力的把任务做完是我能做的事 |
062000507 | 郭河源 | 地址 | 活泼开朗阳光大男孩 | Java,js,Go 语言的开发 | 电竞美食 | 后端 go 语言开发 | 摒弃侥幸之念,必取百炼成钢;厚积分秒之功,始得一鸣惊人 |
2221900431 | 赵杰 | 地址 | 内向 | 无(但我可以学习) | 打羽毛球,看小说 | 后端 | Keep on going never give up. |
052006133 | xiongpc | 地址 | 腼腆 | 后端编程 | 打游戏,看书 | 后端 | Fighting for all time. |
我们希望围绕着 OpenAI 近期公开的 GPT-3.5-Turbo 以及即将开放的 GPT-4 API,打造一个前后端分离架构的 Web APP。
考虑到市面上已经有很多类似的项目,我们希望能在与 ChatGPT 对话这一功能上进一步封装,使得用户可以更加方便地使用我们的产品。
我们计划推出 AI 人格塑造、prompt 商店、AI 语音助手等基础功能。
但我们的愿景远远不止这些。带有情感的翻译器?向 AI 倾诉内心的烦恼?甚至是与 AI 进行一场冒险?我们小组希望将这些功能带给大家。
我去除了大部分便装,但是我保留了一部分。
Yet, another ChatGPT web, but we can go further more......
综合 ChatGPT 和小组成员的建议,我们制定了如下的绩效考核方案:
序号 | 项目名称 | 权重 | 完成标准 | 计分办法 |
---|---|---|---|---|
1 | 任务完成数量 | 20% | 1.完成组长、小组长委派的任务 2.超额完成任务 3.协助其他小组成员完成任务 | Up: 按时完成任务(委派及额外承接); Down: 未按时完成任务; |
2 | 任务完成质量 | 30% | 1.能完成任务的内容 2.没有漏洞 3.代码结构合理 4.代码性能优异 | Up: 测试用例完整、代码健壮性高; 代码时间/空间效率高; Down: 代码错误多,影响其他模块稳定性; 执行效率低下,影响程序性能表现; |
3 | 文档贡献量 | 10% | 1.为完成的模块编写文档 2.及时添加和上传新依赖 | Up: 文档完整、及时更新; Down: 文档不完整、不及时更新; |
4 | 测试贡献量 | 10% | 1.为完成的函数编写单元测试 2.为完成的模块编写模块测试 | Up: 测试用例数量合理,能有效覆盖代码; Down: 测试用率过少,无法发现程序漏洞; |
5 | Issue 贡献量 | 10% | 1.为测试到的 Bug 提交 Issue | Up: 能准确追踪漏洞,描述复现方法; |
6 | 技术分享量 | 10% | 1.能向团队分享遇到的技术问题 2.能帮助队友解决问题 | Up: 积极分享技术知识,热心帮助队友; |
7 | 代码重构量 | 10% | 1.对于结构混乱、性能不佳的代码,能主动进行重构 | Up: 能主动进行重构工作,提升程序稳定性 |
能否对 “ AI 人格塑造、prompt 商店、AI 语音助手等基础功能” 进行更具体的阐述,他们能给用户带来什么?
这三个功能是目前同类竞品已经实现的功能。我们将更详细地阐述这些功能的设计和实现。
AI 人格塑造是指通过在 System 块中输入一系列 prompt,为 GPT 模拟一个人格,从而使得 GPT 在生成文本时能够表现出人类的特征。这个功能的设计和实现参考了 GPT-3 Personality 一文。经过测试,在为 GPT 模型塑造了人格之后,GPT 生成的文本会更加符合人类的语言习惯,更加符合人类的思维逻辑,更加符合人类的情感表达。
我们将在用户界面中提供几组预设定的人格 prompt,可供用户快速选择。用户也可以自行创建自己的人格 prompt,从而塑造出符合自己需求的人格。
prompt 商店与上述的人格塑造功能比较相似,不过 prompt 商店里的 prompt 更加通用,包含将 GPT 模型配置成不同的功能的 prompt,例如语法检查器、文章修改器、翻译器等等。用户可以在 prompt 商店中选择自己需要的 prompt,从而将 GPT 模型配置成符合自己需求的功能。
有部分竞品提供了语音转文字和文字转语音的功能,使得用户可以通过语音输入和语音输出来与 GPT 进行交互。
PPT 中对团队想要制作的产品描述不够清晰,能否补充一下?
限于字数限制(150-250字),我们没能在选题文档中完整阐述我们的想法和创意。我们将在这份文档中对项目的想法和设计进行更详细的描述,以便更好地理解我们的想法。
据我们的亲身体验,市面上绝大多数翻译软件并无情感选择功能,用户往往只能得到原文与译文一一对应的、没有任何感情的文本。
我们的想法是,如果能够在翻译软件中加入情感选择功能,用户可以根据需求选择预设定的情感(如下图),也可以通过使用引导程序创建满足自己需求的情感,从而得到更加符合自己需求的翻译结果。
翻译界面我们则希望参考成熟翻译软件的设计,如下图所示。相较于 ChatGPT 对话形式的界面,这种界面更加直观,用户可以更加方便地进行翻译。
下面是翻译结果的展示:
原文:
Doubt thou the stars are fire;Doubt that the sun doth move;Doubt truth to be a liar;But never doubt I love.
节选自 William Shakespeare 的《Hamlet》。
DeepL 翻译结果:
怀疑你的星星是火;怀疑太阳在动;怀疑真理是骗子;但绝不怀疑我的爱。
Google Translate 翻译结果:
你怀疑星星是火;怀疑太阳在移动;怀疑真理是骗子;但永远不要怀疑我爱。
GPT-3.5-Turbo 翻译结果:
怀疑星辰火热;怀疑太阳运行;怀疑真理虚假;但永远不要怀疑我爱你。
GPT-3.5-Turbo Prompts:
You are a translator well versed in translating drama, please translate the clips I have provided into Chinese in firm and provocative language.
可以看到,我仅在 prompts 中给出简单的情绪提示,GPT-3.5-Turbo 便可以生动地翻译这段文本,其效果远远超过了 DeepL 和 Google Translate。
下图为 GPT-3.5-Turbo 翻译的过程:
这个创意来自我个人(社长)的亲身体验。近几年以来,我可以切身感受到社会的压力使得身边的人们越来越焦虑,有些人甚至出现了严重的心理问题。有部分人选择了心理咨询,但是由于心理咨询的高昂价格,它并不能成为一种普及的方式。
据我的了解,心理咨询师相较普通人有以下优势:
保密性:心理咨询师会严格保护客户的隐私,确保他们的个人信息和谈话内容不会泄露给他人。
客观性:心理咨询师是客观的旁观者,不会对客户的问题进行价值判断或批评,能够帮助客户更全面、客观地看待自己的情绪问题和行为。
专业性:心理咨询师有丰富的经验和知识,可以根据不同的情况,提供量身定制的治疗方案,帮助客户实现自我成长和发展。
而 GPT 模型本身就具备前两个优势。我们不用担心 GPT 模型会泄露我们的隐私,也不用担心 GPT 模型会对我们的问题进行价值判断或批评。因此,我们可以利用 GPT 模型来实现心理咨询的功能,从而降低心理咨询的成本。
因此,我们的团队会将设计的重点放在提升 GPT 的第三个优势,也就是专业性上。我们会将 GPT 模型训练成一个心理咨询师,让它能够根据不同的情况,提供量身定制的治疗方案,帮助用户实现自我成长和发展。
这是一个大胆的创意。目前市面上并无使用 GPT 模型本身作为引擎驱动游戏剧情发展的游戏。
我们希望可以借助 GPT 模型强大的思维能力和语言表达能力,设计出一款文字类游戏,它能够根据用户的输入,自动生成游戏剧情,从而为用户提供一种全新的游戏体验。
游戏界面的设计,我们会采取和 LifeLine 类似的方式,即游戏的剧情和用户的选择交错呈现,用户可以身临其境地体验游戏剧情的发展。游戏界面原型如下图:
游戏性的考量上,我们计划引入时间系统。即每一个事件的执行需要消耗现实中的时间,用户可以选择在游戏中花费多少时间来完成某个事件。这样的设计可以让用户在游戏中感受到时间的流逝,从而更好地使用户沉浸在游戏中。
在 PPT 上我们没能很好的展示目前我们对模型的训练成果。我们仍在训练中,我们已经可以控制模型输出的格式,以保证后端能处理模型的输出。由于提供的故事背景不够完善、对模型的指示也不够完全,因此生成出来的剧情仅是一些简单的句子,还不能完全体现 GPT 模型的能力。我相信经过过多的训练,模型可以更加丰富、翔实地表达出剧情。
游戏训练过程的图片有点长,就不放进文章里了,这里是图片的链接。
对于 GPT 模型生成文字数量限制与上下文不对应的问题,你们打算如何结解决?
GPT-3.5-Turbo 对输入 prompt 和生成 prompt 综合长度 4097 字符的限制,我们在项目选题阶段就十分重视,上下文问题也是我们一直在关注的问题。
对于文本翻译问题,我们计划采取分段翻译的方式来解决。即将待翻译的文本分段,每段输入文本和输出文本的总和不超过 4097 字符,然后将每段翻译结果拼接起来,即可得到完整的翻译结果。
考虑到上下文衔接的问题,我们计划在每一段文本的开头加入前文的关键词,以此来保证上下文的连贯性。
游戏将面临更大的挑战,因为游戏的剧情是动态生成的,我们需要将模型之前生成的文本反馈给模型以保证上下文的连贯性。这无疑会增加大量的 prompt,游戏进行不了几个回合就会因 prompt 长度超限而无法继续进行。
对此,我们计划采取事件驱动游戏的设计方式。即游戏中剧情发生的变动是基于事件的,通常一个事件仅需使用二三十个词描述。我们仅需记录游戏中发生的事件,而不需要记录游戏中的剧情。这样的设计可以大大减少 prompt 的长度,从而解决 prompt 长度限制的问题。
根据我们近期的测试,我们有能力通过控制 prompt 来控制模型生成的文本。此外,我们还可以通过调节 Temperature 和 Top-K 参数来控制模型生成的文本的多样性。
我很确定我们小组有能力解决上下文不对应的问题。
需要补充的内容比较多,我们将在 FAQ 文档中给出问题的回答。
我们计划推出 AI 人格塑造、prompt 商店、AI 语音助手等基础功能。
请详细描写这些功能给用户带来什么具体的益处, 不能太简略。
1.能否给一些所画大饼的具体一些的愿景?2.PPT中可以大胆将两点秀出来,否则难以体现创新性