109
社区成员




这个作业属于哪个课程 | 软件工程实践2024 |
---|---|
这个作业要求在哪里 | 软件工程实践软件评测作业 |
这个作业的目标 | 评测两款软件 |
其他参考文献 | 《构建之法》、CSDN |
@
语言理解与对话:kimi能够理解中文和英文,与用户进行流畅的对话。
信息检索:kimi可以查找信息,解答问题。
文件阅读:kimi能够TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等格式的文件。
网页内容解析:kimi可以通过提供的网址解析网页内容。
数学计算:kimi能够进行基本的数学计算和逻辑推理,解决数学问题。
写作辅助:kimi可以帮助用户撰写或编辑文本,提供写作建议。
优点:
功能丰富有趣:kimi在基础问题功能上分化出了许多有趣的功能如塔罗牌占卜等,更加符合年轻人需求。
缺点:
用户背景
使用栏目
使用过程遇到的亮点或问题
改进之处
测试环境:
可复现性:偶然发生,二十次中实现4次
具体描述:在kimi+的诺贝尔吐槽奖功能中,如果你提供的照片过于非人类则可能生成不了人像
复现步骤:首先输入获奖人姓名,职业和性别,在他要求你提供照片时提供一张并非人类的照片,则有可能不生成画像。
Bug分析:
该功能实现主要通过kimi首先对图片进行解析,生成相应的关键词,随后kimi根据关键词生成诺贝尔风格的图像,但如果提供的照片不具备人类的特征,则kimi无法生成匹配的关键词,而后在生成诺贝尔风格图像的函数中由于没有传入关键词,所以无法生成图片。
Bug严重性:
评价表格:
| Level | Urgency | Impact | Example | Response |
| --- | --- | --- | --- | --- |
| P0 | Critical | Extensive | System outage | Immediate |
| P1 | High | Large | Major feature malfunctioning | Urgent but not out of BAU schedule |
| P2 | Moderate | Moderate | Minor feature malfunctioning | Important but needs to be prioritized against other issues |
| P3 | Low | Minor | Functionality or feature prevents a few users from using the product | Part of routine work |
| P4 | Negligible | Negligible | Minor issue that doesn't affect user base | Should be placed on backlog |
评分:P1
理由:只有在用户提供照片非人类的极端情况下才发生,因此认为影响不大。
我认为KIMI是一款界面简洁,功能丰富有趣,适合学生使用的AI大模型。
| 类别 | 描述 | 评分(满分 10 分,良好 6 分,及格 4 分,聊胜于无 1 分,很差 -3 分) |
| --- | --- | --- |
| 核心功能 | 支持多语言多种类的输入,能够访问用户提供的网站,能够检索信息回答问题 | 8 |
| 细节 | 使用过的功能会在侧边框中保留,符合局部性原理 | 10 |
| 用户体验 | 对话后会提供一些可能想问的提示词,方便了后续提问| 9 |
| 辅助功能 | 在手机端也能提供服务 | 9 |
| 差异化功能 | 有更多如诺贝尔吐槽奖紧跟时事的功能 | 10 |
| 软件的效能 | 生成回答速度快 | 9 |
| 软件的体验 | 功能强大,支持多种文件输入 | 10 |
| 成长性 | 保存对话历史;一次对话中支持上下文分析,使得后续回答更精准 | 9 |
| 用户有控制权 | 答案生成过程中,用户可以中止生成 | 10 |
| 其他 | 软件的专业性 | 10 |
| 总分 | | 92 |
文心一言的基本功能与kimi相差不大,其亮点在于能根据关键词生成图片。
优点:
模块更加丰富:相较于kimi,文心一言提供了生成图片的功能,模块更加丰富。
功能专业化:相较于kimi的塔罗牌等功能,文心一言的功能更偏向专业化,职业化,为不同职业提供更符合其要求的功能。
功能场景化:能根据不同对话场景提供不同的对话内容,如创意写作,美食旅游等。
语言更加人性化:相较于kimi他的输出方式更像人类,不像kimi那样习惯分点输出。
缺点
文心一言更注重专业性,使用领域更广泛,更适合职场人士使用的AI大模型
我认为KIMI是一款界面简洁,功能丰富有趣,适合学生使用的AI大模型。
| 类别 | 描述 | 评分(满分 10 分,良好 6 分,及格 4 分,聊胜于无 1 分,很差 -3 分) |
| --- | --- | --- |
| 核心功能 | 支持多语言多种类的输入,能够访问用户提供的网站,能够检索信息回答问题 ,能够生成图片| 9 |
| 细节 | 左侧边框保留聊天记录,方便查找 | 10 |
| 用户体验 | 对话后会提供一些可能想问的提示词,方便了后续提问| 9 |
| 辅助功能 | 支持语音输入 | 10 |
| 差异化功能 | 有许多应用过不同场景不同职业的功能 | 10 |
| 软件的效能 | 生成速度极慢,并且在后台基本不生成 | 5 |
| 软件的体验 | 功能强大,支持多种文件输入 | 10 |
| 成长性 | 保存对话历史;一次对话中支持上下文分析,使得后续回答更精准 | 9 |
| 用户有控制权 | 答案生成过程中,用户可以中止生成 | 10 |
| 其他 | 软件的专业性 | 10 |
| 总分 | | 89 |
总时间估计:约12周
对于kimi:
对于文心一言:
开发人员粗心大意:没有给诺贝尔风格图片提供默认的关键词,并且在没能分析出关键词的情况下仍然能够运行而不是提示用户换一张图。
其他:为了抓住热点过于赶工导致出现疏忽。
市场规模:当前AI大模型市场正处于快速发展阶段。根据2024年的行业研究报告,大模型市场容量及规模巨大,预计到2028年将达到1179亿元人民币的规模
用户规模
竞争对手:国外的有chatGPT,国内有通义千问,星火大模型,豆包等
产品定位:
产品关系:
ChatGPT在技术上暂时领先,占据国际市场,星火大模型在语音识别方面较为领先,kimi在处理长文本方面特长,文心一言在搜索方面较为强大,但是免费版体验较差
市场分析:
该领域当前处于风口阶段
用户群体:
用户关系:
用户虽然来自不同领域,但他们可以通过分享使用技巧、协作项目和建立社区来互相帮助。要促进这种互动,可以创建交流平台,增加协作工具,设置激励机制,举办聚会活动,并听取用户的反馈。这样,用户之间就能形成一个互相支持、共同进步的生态环境。
产品生态:
利用AI大模型之间的特性关系构建产品生态是可行的。核心产品可提供基础服务,辅助产品扩展功能,技术基础设施确保高效运行,第三方合作拓展服务范围。通过这种方式,不同产品可以相互促进,共同为用户提供更多价值,推动整个生态系统的发展。
新功能:
提供用户定制体验,根据用户的使用情况,说话风格提供定制化体验,为每个用户提供独一无二的服务。
理由:
提供定制化服务可以给客户更完美的体验,帮助我们留住客户
NABCD分析:
项目规划:
项目规划和团队配置阶段(第1-2周)
项目经理:
负责整体规划、资源分配、风险管理、团队协调和与利益相关者沟通。
AI工程师/数据科学家(2人)
负责AI大模型的开发、训练和优化。
一人专注于模型架构和算法优化。
另一人负责数据处理和训练。
后端开发工程师(1人)
负责平台的后端逻辑、数据库设计和API开发。
确保平台能够处理和存储用户数据,并与AI模型有效交互。
前端开发工程师(1人)
负责平台的用户界面和用户体验设计。
确保用户界面直观、易用,并且能够无缝集成AI模型的输出。
测试工程师(1人)
负责编写测试用例,进行单元测试、集成测试和系统测试。
确保平台的稳定性和性能。
开发和测试阶段(第3-14周)
AI工程师/数据科学家
持续进行模型训练、测试和优化。
与后端开发工程师紧密合作,确保模型可以高效地集成到平台中。
后端开发工程师
开发和优化后端服务,包括用户数据处理、模型调用接口和数据库管理。
前端开发工程师
设计和实现前端界面。
确保它能够根据AI模型的输出动态调整,提供个性化体验。
测试工程师
与开发团队紧密合作,进行持续集成和测试。
确保新功能和改进按时添加到平台中,并且没有引入新的错误。
发布准备阶段(第15周)
发布和后续支持阶段(第16周及以后)
团队成员继续监控平台的性能,收集用户反馈,并准备后续的维护和更新。