109
社区成员
这个作业属于哪个课程 | 2401_CS_SE_FZU |
---|---|
这个作业要求在哪里 | 软件工程实践——软件评测作业 |
这个作业的目标 | 1、对相关AI大模型软件进行使用和测评 2、进行软件分析 3、对相关产品市场进行调查,并规划 |
其他参考文献 | 《构建之法》 《软件工程案例分析作业》 |
基本功能介绍和使用
当未登录时无法与AI进行交谈
优点
缺点
意见
用户采访
对于文心一言,我采访的是我的舍友:
于我而言,文心一言的体验非常差,几乎每一个问题它都不能给我满意的答案,这种产品居然就这么水灵灵地上市了,感觉唯一的作用就是缓解本人对未来人工智能统治地球的担忧。以前没使用过它,以后也不想再用它。
定性结论:b) 不推荐
定量结论:
界面是否精简美观(20) | 使用是否方便(20) | 响应速度(30) | 用户体验感(30) | 总分(100) | |
---|---|---|---|---|---|
文心一言 | 14 | 18 | 20 | 15 | 67 |
基本功能介绍和使用
当未登录时无法与AI进行交谈
优点
缺点
意见
用户采访
一位计算机专业就读中、长期使用Kimi的朋友对Kimi的看法与评价如下:
1. BUG1
2. BUG2
总之,Kimi在当前市场中具有明显的竞争优势,尤其是在多语言支持和大容量文本处理方面,因此,对于需要免费长文本阅读和多文档阅读做为知识库的问答助手,我十分推荐。然而,为了满足更广泛的市场需求并实现持续增长,Kimi需要不断优化和扩展其功能,同时加强用户自定义能力和交互体验。
定性结论:d) 好,不错
定量结论:
界面是否精简美观 | 使用是否方便 | 响应速度 | 用户体验感 | 总分 | |
---|---|---|---|---|---|
Kimi | 17 | 19 | 26 | 26 | 88 |
团队背景:人数6人左右,计算机大学毕业生,并有专业UI支持。
产品名称 | 需求分析 | 架构设计 | 模型训练 | 前后端设计与开发 | 测试优化 | 部署与维护 | 总开发时间(天) |
---|---|---|---|---|---|---|---|
文心一言 | 10 | 15 | 40 | 60 | 45 | 10 | 180 |
Kimi | 15 | 15 | 50 | 60 | 45 | 15 | 200 |
我使用过的ai模型如下:
考量指标 | 分值 | ChatGPT | 文心一言 | Kimi |
---|---|---|---|---|
界面是否精简美观 | 20 | 20 | 14 | 17 |
使用是否方便 | 20 | 20 | 18 | 19 |
响应速度 | 30 | 26 | 20 | 26 |
用户体验感 | 30 | 27 | 15 | 26 |
总分 | 100 | 93 | 67 | 88 |
仅代表个人的排名:ChatGPT > Kimi > >文心一言
文心一言:优化UI界面,使其更加美观、简洁。
优化以文生图功能,使其能够更好地理解描述的文字,生成更加准确的图片。
Kimi:Kimi应加强对科学领域专业术语的学习和理解,确保能够准确解析和回答相关的专业问题。对于交互体验方面,继续优化界面设计,提升用户查询的便捷性
文心一言和Kimi出现的Bug都是因为开发人员或测试流程未对基础功能进行充分验证,需要提升测试的覆盖范围和质量。
市场规模
IDC数据显示,2023年中国大模型平台及相关应用市场规模达17.65亿元人民币。大语言模型的发展历程虽然只有短短六年的时间,但是发展速度相当惊人,迄今为止,国内外有超过百种大模型相继发布。随着人工智能技术的不断发展和普及,这类产品的市场潜力将会进一步得到释放。
用户概况
直接用户:科技公司、企业客户、教育和研究机构
潜在用户:由于ai大模型具备广泛的应用能力和场景适应性,它的潜在用户实际上可以覆盖社会生活的各个角落,如借助ai解答学术疑问、辅助学习复杂知识点的学生、运用模型进行灵感激发、文章大纲生成或部分文字内容创作的内容创作者等。想要只要有自然语言处理需求的场景,都可能是其潜在的用户群体,所以潜在用户数量是极其大的。
产品名称 | 定位 | 优势 | 劣势 |
---|---|---|---|
百度文心一言 | 面向企业级应用和个人用户的智能写作和对话生成工具 | 强大的中文理解和生成能力,适应性广泛,涵盖多种行业 | 处理特定领域知识时可能不如专门模型准确 |
阿里巴巴通义千问 | 提供商业解决方案和客户服务支持 | 与阿里云生态系统紧密集成,便于企业使用 | 相对较少的开源或社区支持 |
华为盘古 | 面向工业和技术研发领域 | 强大的算力支持,适合大规模应用 | 生态建设仍在发展中,应用场景相对狭窄 |
科大讯飞星火 | 语音识别和自然语言处理领域 | 语音识别技术积累深厚 | 与纯文本生成模型相比,功能上有所局限 |
ChatGPT | 通用对话生成和智能写作工具 | 在全球范围内拥有广泛的用户基础,能够处理多种语言 | 在中文领域的本地化和特定场景适应性有待提升 |
Kimi | 专注于办公场景、长文本处理、文件解读 | 优秀的长文本处理能力、多模态融合、自适应学习与个性化推荐 | 逻辑推理能力相对较弱、缺乏多模态能力 |
Need(需求):
许多用户在使用大语言模型时,期望获得更符合自己需求和偏好的答案。这种需求在面对不同用户对同一问题有不同解答倾向时尤其明显。当前的语言模型回答是基于普遍性和通用性,而不能直接识别或适应用户的个人喜好。因此,引入用户偏好并根据历史采纳情况生成个性化答案的功能,能有效满足用户对个性化和精准回答的需求。
Approach(方法):
当前的功能已经支持对回答进行“赞”和“踩”的操作,我们可以根据用户对给出的回答进行的这些操作,推断出用户对回答的偏好,并将这些偏好以附加要求的形式隐式的添加在用户提出的问题中,帮助用户更快地找到希望得到的答案,用户也可以自行添加那些模板式的限制和要求以供算法使用。
Benefit(好处):
Competiton(竞争):
市场上已有一些大语言模型产品在尝试个性化推荐或用户定制功能,但仍未完全实现根据用户偏好定制回答的功能。通过更加完善的用户偏好模型和算法,可以在个性化服务领域超越竞争对手,从而获得市场优势。
Delivery(推广):
可以基于现有的产品,通过产品版本更新迭代上线这项功能,也可以在产品更新上线时进行适当的宣传。最好逐步推广给不同的用户群体,并根据用户反馈调整和改进模型。
人员角色 | 人数 |
---|---|
项目经理(兼任开发经理) | 1人 |
前端开发人员 | 3人 |
后端开发人员 | 3人 |
UI 设计师 | 1人 |
测试工程师 | 1人 |
时间段 | 工作内容 |
---|---|
第1周 | 产品经理组织初次会议,确定项目目标与任务分配;后端开发人员设计服务器架构,明确大模型的设计思路;UI设计师着手模块和组件设计;测试工程师制定测试策略。 |
第2-3周 | 前端开发工程师编写接口文档;后端开发工程师完成技术选择并搭建技术框架;UI设计师完成初步的界面设计;测试工程师搭建测试环境,并协助设计接口文档。 |
第4-9周 | 前端开发人员构建用户界面;后端开发人员实现核心功能接口并进行模型训练;UI设计师根据前端反馈调整界面设计;测试工程师编写测试脚本,进行接口的模拟测试。 |
第10-13周 | 前端开发人员与后端进行对接,完成交互功能;后端开发人员完善功能并进一步优化模型训练;UI 设计师协助前端团队进行开发并优化设计细节;测试工程师开展功能测试。 |
第14-15周 | 完成功能开发,全面进入测试阶段,并根据测试结果进行问题修复和性能优化。 |
第16周 | 进行最后的测试验证,准备发布上线,并计划推出改进版本。 |