软件工程实践——软件测评作业

222100103陈卓杨 2024-04-16 23:54:50

这个作业属于哪个课程	2023年福大-软件工程实践-W班
这个作业要求在哪里	软件工程实践-软件评测作业
案例分析作业要求	软件工程-案例分析作业
这个作业的目标	完成Kimi.ai与讯飞星火的软件评测及市场调研
参考文献	《构建之法》

一、产品调研与评测
1.1 Kimi
1.1.1使用体验
1.2BUG描述
1.3优缺点
1.4用户采访
1.5改进意见
1.6结论
1.2文心一言
1.1.1使用体验
1.1.2BUG描述
1.1.3优缺点
1.1.4用户采访
1.1.5改进意见
1.1.6结论
二、产品调研与评测
2.1开发时间
2.2对比排名
2.3软件工程方面建议
2.4 为什么我发现的Bug，开发团队不修改
三、建议和规划
市场概括
市场规模
用户数量
市场现状
同类产品
上述产品的定位、优势与劣势在哪里？
竞品关系
大语言模型领域的发展阶段
市场与产品生态
核心用户群
用户群体之间的关系和生态构建：
产品子产品及相关产品之间的关系和生态构建：
产品规划
新功能设计：智能个性化推荐系统
团队配置和发布规划：
16周详细规划：

一、产品调研与评测

1.1 Kimi

1.1.1使用体验

Kimi功能主要集中在提供信息查询、文件阅读、网页内容解析等方面，同时遵循严格的内容安全策略。下面给出除了文字对话之外的基本功能使用案例：

基本功能1——解析网站

当用户提供网址时可以解析网页内容。用户只需将网址发送，然后提出问题，Kimi会先解析网页内容，再结合这些内容回答用户的问题。

在这里插入图片描述

基本功能2——解析文件:

用户可以上传TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等格式的文件,KImi能够阅读这些文件的内容，并根据用户的问题提供相关的回答。使用方法是将文件发送给KImi，提出具体问题，
Kimi会结合文件内容给出回答。

在这里插入图片描述

基本功能3——信息搜索

对于需要额外信息的问题可以通过搜索功能获取相关信息。用户可以直接提出问题，如果需要搜索结果来提供更好的回答，Kimi会结合搜索结果来进行回答。

在这里插入图片描述

1.2BUG描述

测试环境：

电脑型号：macOS 13.5
浏览器版本：Safari16.6 (18615.3.12.11.2）

在我的测试环境下并没有发现值得提出的BUG

1.3优缺点

	优点
语言	擅长中文和英文的对话，可以与使用这两种语言的用户进行流畅的交流。
文本信息处理	可以处理大量的文本信息，支持最多20万字的输入和输出
互联网访问	能够访问互联网，结合搜索结果来提供更准确和全面的回答出
遵守法律法规	回答问题时会遵守中华人民共和国的法律法规，确保信息的合法性和安全性

	缺点
实时互动	虽然可以实时响应用户的问题，但在处理需要实时数据更新或实时协作的任务时可能不够灵活
互动方式单一	然处理大量文本信息的能力突出，但是其他维度例如视觉创作和语音远远落后
缺乏用户反馈机制	缺乏有效的用户反馈机制来持续改进服务质量

1.4用户采访

在这里插入图片描述

1.5改进意见

改进意见1——用户反馈机制

可以通过类似于chatgpt实现最基本的错误反馈和纠正机制，根据用户反馈进行对于问题的优化；并且可以在一定程度上进行自我诊断和修复问题。

改进意见2——实时互动与协作

可以增强实时数据处理和协作功能，以更好地支持实时项目和团队协作

1.6结论

Kimi适用于对与超大容量的文本内容进行总结归纳，这一优势的不可替代性在于大部分公司无法解决算力和商业化之间的平衡问题，也是Kimi最大的闪光点之所在。作为用户，我们可以去针对性的去使用这一功能，帮助我们在短时间内对于大容量的文本进行理解;但是在解决技术问题或者生成视觉作品等方面另有要求，需要语音交互等，那么建议使用其他AI。

1.2文心一言

1.1.1使用体验

基本功能1——说图解话

说图解话是一个可以将图像内容转化为自然语言描述的功能。借助人工智能技术，理解图像中的内容和语义信息，并生成对应的文字描述。主要应用在图文搜索、视力受损人士的生活辅助以及儿童教育等方面

在这里插入图片描述

基本功能2——览卷文档

览卷文档是一个文档处理工具，它允许用户基于文档完成各种任务，如生成摘要、回答问题和创作内容。应用场景：在日常办公、学习或研究中，览卷文档可以帮助用户更高效地处理文档内容，提高工作效率。

在这里插入图片描述

基本功能3——E言简图

E言易图是一个数据分析和可视化工具，它基于Apache ECharts，用于创建和编辑各种图表。应用场景：在数据分析、报告制作、决策支持等领域，E言易图可以帮助用户更直观地展示数据，提高数据理解和分析效率，支持多种图表类型，包括柱状图、折线图、饼图、雷达图、散点图、漏斗图以及思维导图等，满足用户不同的数据展示需求，涵盖的范围非常全面的。

在这里插入图片描述

基本功能4——商业信息查询

商业信息查询平台是一个提供企业信息查询服务的工具，它涵盖了企业基本信息、股东信息、法人信息、知识产权信息等多个方面。在商业合作、市场调研、风险控制等场景下，商业信息查询平台可以帮助用户快速了解目标企业的基本信息和运营状况，为决策提供支持提供实时更新数据、多维度的查询、定制化服务以及智能数据分析等功能确保准确性和时效性。

在这里插入图片描述

1.1.2BUG描述

BUG——绘图不能满足要求
复现率100%

我们输入绘图需求之后无法真正理解需求或者无法去满足这些要素，即使给了文字反馈，这个结果也不会网我们要求的方向去靠拢。一个满足不了用户需求的功能的存在是十分鸡肋的，尤其是在面对gpt4这种有明显在绘图上有优势的平台，用户的付费意愿会大大下降。

在这里插入图片描述

1.1.3优缺点

	优点
信息检索与处理能力强	拥有强大的信息检索和处理能力，可以快速准确地回答用户的问题，提供相关的知识和信息
智能纠错	具备基本的语法和拼写检查功能，能够帮助用户纠正错误，提高文本的准确性。
多模生态能力	适用于多种写作场景，如撰写商业计划书、营销文案、社交媒体内容等，满足不同行业用户的特定需求，画图、写长文、文字转视频等多模态生态能力是ChatGPT所不具备的

	缺点
版权风险	百度视频素材来源不明。但这一风险被转嫁至媒体及其他作者，若被告侵权，作者将承担巨大的版权风险。
智能纠错	具备基本的语法和拼写检查功能，能够帮助用户纠正错误，提高文本的准确性。
用户隐私	用户在使用在线写作助手时可能需要输入敏感信息，这可能引发对数据隐私和安全的担忧

1.1.4用户采访

1.1.5改进意见

改进意见1——提升创意生成能力

作为一个有着帮助用户创作的功能的AI，可以通过引入更先进的生成对抗网络（GANs）或变分自编码器（VAEs），AI可以生成更具创意和原创性的内容，更好地满足创意写作需求。

改进意见2——改进用户交互体验

提供更多交互选项，如语音输入手写输入等以适应不同用户的操作习惯。

改进意见3——增强学习能力和自我优化机制

通过持续学习和用户反馈，AI应能够自我优化，不断改进生成文本的质量和相关性，从而避免出现BUG中所描述的问题

1.1.6结论

文心一言是一个很好的辅助工具，但是无论在商业表现还是实际应用层面都不如Kimi。功能虽然众多，但是大部分板块最终呈现出的效果往往不尽如人意，最后还是需要很多人为的工作，再加上生成的作品我们无法调试和修改，且用户反馈机制并没有起到作用，个人使用下来有一种可以但是没必要的感觉。

二、产品调研与评测

2.1开发时间

估计开发一个类似于Kimi或文心一言这样的人工智能助手的项目，涉及到多个方面的工作，包括但不限于需求分析、系统设计、前后端开发、AI模型训练、UI设计和测试等。以下是一个大致的时间估计，基于一个6人团队，成员都是计算机专业的大学毕业生，并有专业的UI设计师支持：

需求分析和规划（1-2个月）
在项目开始之前，需要进行详细的需求分析和市场调研，确定产品的目标用户、核心功能、竞争优势等。这个阶段可能需要1到2个月的时间，团队成员需要紧密合作，确保对项目的理解一致。
系统设计（1个月）
根据需求分析的结果，进行系统架构设计、数据库设计、API设计等。这个阶段大约需要1个月的时间，设计师和开发人员需要共同参与，确保设计的系统既满足功能需求，又能高效运行。
前后端开发（2-3个月）
前后端开发是项目中最为耗时的部分。根据项目的复杂度，这个阶段可能需要2到3个月的时间。前端开发负责实现用户界面和交互逻辑，后端开发则负责处理业务逻辑、数据存储和API接口等。
AI模型训练（2-4个月）
对于一个AI助手来说，智能模型的训练是非常关键的部分。这个阶段可能需要2到4个月的时间，取决于模型的复杂度和训练数据的量。团队中需要有专门负责机器学习和自然语言处理的成员。
UI设计和用户体验优化（1-2个月）
UI设计不仅仅是美化界面，更重要的是提供良好的用户体验。这个阶段可能需要1到2个月的时间，UI设计师需要根据用户反馈不断迭代优化设计。
测试和调试（1-2个月）
在产品上线前，需要进行详尽的测试和调试，确保没有严重的bug和性能问题。这个阶段可能需要1到2个月的时间，测试人员需要编写测试用例，并对产品进行多轮测试。
产品上线和迭代（持续过程）
产品上线后，还需要持续收集用户反馈，进行产品迭代和功能优化。这个过程是持续的，需要团队不断地评估和改进产品。

综上所述，一个初步的产品原型可能在大约6到9个月的时间内完成。但请注意，这只是一个粗略的估计，实际的开发时间可能会因为项目的复杂度、技术难度、团队协作效率等因素而有所不同。此外，后期的产品维护和迭代也是非常重要的，需要持续投入资源和时间。
| 名称 |主要功能 |时间预测 |
|--|--|--|
| Kimi| 大容量的文本解析，用户的隐私安全保护 |17个月 |
| 文心一言 | 图片解析与生成，数据收集与处理 |19个月 |

2.2对比排名

对比角度	⭐️⭐️⭐️	⭐️⭐️	⭐️
UI设计	Kimi	文心一言
交互体验	文心一言	Kimi
功能生态	文心一言	Kimi
创新水平	Kimi		文心一言
实操应用	Kimi		文心一言

Kimi（15⭐️）>>文心一言（10⭐️）

2.3软件工程方面建议

对于文心一言开发团队，我想给出的建议是更加重视软件测试，不要让用户来充当测试人员，文心一言在发布之初就出现了很多错误，甚至出现3+4=5的情况，尽管经过了不断的改进，现在仍然存在一些问题

2.4 为什么我发现的Bug，开发团队不修改

大部分的人猜测可能在于开发团队测试不够充分，没有发现，或者软件开发时间周期短，上市匆忙，来不及修改。但是由一个软件道一个软件企业，商业要素是最先被考量的。如果一个bug没有被修改并不影响其优势带来的商业价值，或者对于同类竞品而言大家都存在这样的问题，那么这个bug就没有被修改的必要性所在。

三、建议和规划

市场概括

市场规模

根据提供的信息，全球和中国的大语言模型市场都在快速增长。截至2023年，全球人工智能大模型市场规模预计将达到210亿美元，并预计到2028年将增长至1095亿美元。6中国市场方面，预计到2023年，中国大模型产业市场规模将达到147亿元人民币，并在2028年达到1179亿元人民币。6

用户数量

至于用户数量，由于大语言模型技术的广泛应用，用户群体正在迅速扩大。具体到直接用户，目前尚无明确的统计数据，因为这取决于各个公司的产品发布和市场渗透情况。然而，考虑到大语言模型技术的多样性和适用性，潜在用户群体非常庞大，包括但不限于企业用户、开发者、研究人员以及对AI技术感兴趣的普通消费者。随着技术的成熟和应用案例的增多，预计会有更多的用户开始使用大语言模型技术。

需要注意的是，上述数据和预测是基于当前市场趋势和行业发展的分析，实际的市场规模和用户数量可能会受到多种因素的影响，包括技术进步、政策支持、市场需求等

市场现状

上述产品的定位、优势与劣势在哪里？

这些产品的定位和优势主要体现在以下几个方面：

百度的文心一言强调知识增强和多场景应用，旨在提供信息获取、知识问答和创作辅助等功能。
阿里云的通义千问着重于多轮交互和复杂指令理解，支持多模态融合和外部增强API，适用于电商、医疗、法律等多个行业。
Minimax系列模型以通用大语言模型为主，具备文本处理相关的场景应用能力，如逻辑推理、文案生成等。
科大讯飞的讯飞星火大模型则以多语种语音识别和自然语言理解为特色，提供跨领域的知识和强大的理解能力。
商汤的日日新大模型专注于自然语言处理和内容生成，提供问答、代码生成和数字人生成等服务。

这些产品之间的劣势可能包括对于特定领域的深度理解和应用能力有待提高，以及在用户体验、模型的准确性和可靠性方面的持续优化需求。

竞品关系

在竞品关系方面，上述产品在市场上形成了激烈的竞争态势，尤其是在中文大语言模型领域。百度的文心一言、阿里云的通义千问、科大讯飞的讯飞星火等产品都试图在各自的优势领域内占据市场领先地位。这些产品之间的竞争关系主要体现在技术创新、市场渗透、用户体验和商业模式等方面。

大语言模型领域的发展阶段

至于这个领域的发展阶段，根据目前的市场动态和技术发展趋势，大语言模型产业正处于“成长”阶段。随着技术的不断进步和应用场景的拓展，大模型正在逐步从研究和开发阶段转向商业化和产业化应用，吸引了大量的投资和关注，展现出强劲的增长势头和广阔的市场前景。

市场与产品生态

核心用户群

大语言模型（LLMs）的核心用户群通常包括技术专业人士、研究人员、开发者、企业用户以及对人工智能和自然语言处理感兴趣的普通消费者。这些用户的典型特征可能包括：

学历：本科或以上，特别是在计算机科学、数据科学、语言学等领域有专业背景的人士。
年龄：主要集中在20-45岁之间，这个年龄段的用户通常对新技术有较高的接受度和适应能力。
专业：涉及IT、软件开发、数据分析、市场营销、教育、医疗等多个行业。
爱好：对新技术、编程、数据科学、机器学习、创新应用有浓厚兴趣的人群。
收入：收入水平可能较为多样，但技术专业人士和企业用户往往拥有较高的经济能力。
表面需求：提高工作效率、解决特定技术问题、获取专业知识、实现自动化和智能化的工具或服务。
潜在需求：追求技术创新、提升个人或企业的竞争力、满足对人工智能技术的好奇心和探索欲。

用户群体之间的关系和生态构建：

大语言模型的用户群体之间存在一定的关系，例如开发者可能会利用这些模型来创建新的应用程序，而企业用户可能会使用这些应用程序来提高业务效率。此外，技术专业人士和研究人员可能会通过社区、论坛、学术会议等方式交流经验，形成知识共享和技术互助的生态。这种相互作用为构建一个活跃的开发者社区和用户生态提供了可能性，其中用户不仅是消费者，也是贡献者和创新者。

产品子产品及相关产品之间的关系和生态构建：

大语言模型的子产品和其他相关产品之间存在紧密的关系。例如，基础的大语言模型可以作为多种应用和服务的核心，如聊天机器人、内容生成工具、翻译服务、教育辅助工具等。这些应用和服务可以相互补充，形成一个综合的产品生态，为用户提供从基础技术支持到具体应用解决方案的全方位服务。通过这种方式，可以利用各个产品特性之间的相互关系，构建一个协同作用强、能够满足不同用户需求的产品生态系统。

产品规划

新功能设计：智能个性化推荐系统

为何要做这个功能： 当前软件虽然提供了强大的语言处理能力，但缺乏对用户个性化需求的深入理解和满足。智能个性化推荐系统能够根据用户的历史行为、偏好和实时需求，提供定制化的内容和服务，从而提高用户满意度和产品粘性。

为何用户会用你的产品/功能： 用户对个性化和定制化服务的需求日益增长，他们希望软件能够更好地理解自己的需求并提供相关服务。通过智能个性化推荐系统，用户可以更快地获取到他们感兴趣的信息，提高工作效率和生活便利性。

创新点：

利用大语言模型的深度学习技术，分析用户行为和偏好，实现精准推荐。
结合用户反馈和互动数据，不断优化推荐算法，提高推荐的准确性和个性化程度。
引入多模态内容理解，不仅分析文本，还能理解图像、音频等，为用户提供更丰富的推荐内容。

NABCD分析：

N（Need）：市场和用户对个性化推荐服务的需求。
A（Approach）：通过大数据分析和机器学习技术，开发智能个性化推荐系统。
B（Benefit）：用户可以获得更加个性化的内容和服务，提高使用体验和满意度。
C（Cost）：研发成本、数据采集和处理成本、系统维护成本。
D（Difference）：与竞品相比，提供更加精准和多样化的个性化推荐。

团队配置和发布规划：

项目经理（PM）：负责整体项目规划、团队协调和进度跟踪。
后端开发（2人）：负责推荐算法的实现、数据处理和后端服务开发。
前端开发（1人）：负责前端界面设计和功能实现。
数据科学家（1人）：负责数据分析、模型训练和算法优化。
测试工程师（1人）：负责软件测试、质量保证和bug修复。
UI/UX设计师（1人）：负责界面设计和用户体验优化。

16周详细规划：

1-2周：需求分析和项目规划，确定功能需求和项目里程碑。
3-4周：数据收集和预处理，建立初步的推荐模型。
5-6周：后端开发和前端设计同步进行，实现基础架构和界面框架。
7-8周：集成推荐算法，进行初步的功能测试和用户体验测试。
9-10周：根据测试反馈进行功能优化和界面调整。
11-12周：继续优化算法性能，提高推荐准确性。
13-14周：进行全面的系统测试，修复发现的问题。
15周：准备发布资料，进行市场推广和用户通知。
16周：正式发布改进版本，收集用户反馈并进行必要的紧急修复。

...全文