软件工程——软件评测作业

222100124_莫政毅 2024-04-16 16:41:24

这个作业属于哪个课程	<2302软件工程>
这个作业要求在哪里	<软件工程实践——软件评测作业>
学号	<222100124>
这个作业的目标	<软件测评>
其他参考文献	[构建之法]

目录
第一部分调研，评测
1、文心一言
1.1介绍
1.2体验
1.3优缺点分析
1.4bug描述
Bug发生时的测试环境
可复现性及具体复现步骤
Bug具体情况描述
Bug分析
1.5、用户采访
2、讯飞星火
2.1介绍
2.2体验
2.3优缺点分析
2.4bug描述
Bug发生时的测试环境
可复现性及具体复现步骤
Bug具体情况描述
Bug分析
2.5、用户采访
第二部分分析
1、开发时间估计
2、同类产品对比排名
3、软件工程方面的建议
4、bug为何软件团队不能在发布前修复？
第三部分建议和规划
1、市场概况
2、市场现状
3、市场与产品生态
4、产品规划
NABCD
配置角色与详细规划

文心一言（ERNIE Bot）是一个基于ERNIE模型的聊天机器人，ERNIE是百度开发的一种基于预训练的语言理解模型，专注于自然语言理解和生成任务。ERNIE模型采用了基于大规模文本语料的无监督预训练和基于特定任务的监督微调相结合的方式，能够学习到丰富的语义信息和语言规律，具有较强的语言理解和生成能力。文心一言利用ERNIE模型进行对话生成，可以应用于多种场景，如智能客服、教育培训、信息查询等。它能够理解用户输入的自然语言，并生成合乎语境的回复，具有一定的语境感知能力和对话连贯性。由于ERNIE模型的优秀性能和通用性，文心一言在自然语言处理领域取得了广泛的应用和良好的效果。

1.2体验

1.生成图片

2.纯文本回答

1.3优缺点分析

优点
1.可以处理大量的信息，快速地回答用户的问题。
2.知识库可以不断更新和扩展，以适应不断变化的用户需求。
3.能够快速生成优质文章，提供参考。

缺点
1.如生成图片中，对用户的提出的需求存在一定的理解难度。
2.由于文心一言通常采用简洁的语言表达，无法准确地传达复杂的概念或情感，导致语义上的局限性。
3.应用场景相对受限，适用于一些特定的文学、诗歌或者散文创作，而在其他领域的作用微乎其微。

1.4bug描述

Bug发生时的测试环境

操作系统：Windows 10 家庭中文版
CPU:11th Gen Intel(R)Core(TM)i7-11800H @ 2.30GHz 2.30 GHz
浏览器环境：Google Chrome (正式版本) (64 位)

可复现性及具体复现步骤

可复现性:每次都会出现
复现方式:“画一张三个太阳的图片”

Bug具体情况描述

只绘制出一个太阳，没有满足用户需求

Bug分析

严重性：★★★★☆
经过反复测试后发现，文心一言对于超出认知的绘画总会出错，或许是算法的原因导致超出认知的绘图
总是出错，我认为这个bug对于ai来说较为严重，致使ai难以创新只能在现有的基础上不断总结，却做不
到创新。
改进建议：优化相关算法，允许超出认知以外的绘图。

1.5、用户采访

采访了一位大三软件工程系的学生

他认为文心一言覆盖面不够广，只适用于某些特定场景，局限性比较大。

2、讯飞星火

2.1介绍

讯飞星火认知大模型是由科大讯飞自主研发的认知智能大模型，通过学习海量的文本、代码和图像，具备跨领域的知识和语言理解能力，能基于自然对话方式理解和执行任务。

2.2体验

1.文本问答

2.生成图片

2.3优缺点分析

优点:
1.可以处理大量的信息，快速地回答用户的问题。
2.会不断地从新的数据中学习，以扩展知识和提高性能。
缺点:
1.生成的图片不能满足用户的需求，生成图片内没有老鼠（模糊不清）。
2.某些问题的回答非常简短，对用户的帮助不大。
3.对于超出认知的图片生成时间较久。

2.4bug描述

Bug发生时的测试环境

操作系统：Windows 10 家庭中文版
CPU:11th Gen Intel(R)Core(TM)i7-11800H @ 2.30GHz 2.30 GHz
浏览器环境：Google Chrome (正式版本) (64 位)

可复现性及具体复现步骤

可复现性:每次都会出现
复现方式:“生成一张三个地球的图片”

Bug具体情况描述

只生成了2个地球，没有满足用户的需求

Bug分析

严重性：★★★☆☆
经过反复测试后发现，讯飞星火与文心一言一样对于超出认知的绘画总会出错，我又尝试了让它绘制5个地
球的图片，它只生成了一个。我认为这个bug对于ai来说较为严重，可能是超出一个数字后，因为算法无法
准确计算，自动默认生成一个地球。
改进建议：优化相关算法。

2.5、用户采访

采访了一位大三软件工程系的学生

他认为文心一言比讯飞星火更成熟，操作简便，UI简洁。

第二部分分析

1、开发时间估计

产品	时间
文心一言	180天
讯飞星火	140天

2、同类产品对比排名

类别	文心一言	讯飞星火
功能数量	较多	较多
用户体验	优	良好
功能实现	完善	一般
排名	1	2

3、软件工程方面的建议

1.性能提升：
通过算法和数据结构的优化，提升自然语言处理任务的执行效率，加快文本分析和生成的速度。
进行系统压力测试，确保在高并发情况下系统能够保持稳定和高效的性能。
2.质量保证：
编写全面的测试用例，覆盖单元测试、集成测试和端到端测试，以确保软件功能的正确性和稳定性。
建立自动化测试机制，减少人工测试工作量，提高测试效率。
3.推广优惠：
提供额外的免费使用次数，让用户体验文心一言4.0的优秀表现，让大家了解其所达到的高水平。

4、bug为何软件团队不能在发布前修复？

我认为bug是无法避免的，或许软件团队没有发现，存在幸存者偏差。只有发布后大量用户涌入充当软件测试员，才能发现其中的bug。
又或许是随着马斯克的ai开源，各大行业竞争激烈，急于上线产品导致bug来不及修复。

第三部分建议和规划

1、市场概况

市场：人工智能大模型市场正在迅速发展。随着技术不断进步和应用场景的拓展，人工智能大模型产业规模呈现出蓬勃增长的态势。据中商
产业研究院报告显示，中国大模型市场规模从2020年的15亿元增长至2022年的70亿元，年均复合增长率高达116.02%。预计到2024年，中国
大模型市场规模将达到216亿元。
直接用户和潜在用户：人工智能大模型的直接用户数和潜在用户数因各种因素而异，包括模型性能、应用场景、市场推广策略等。目前，虽然
没有确切的数据反映所有大模型的用户数量，但根据公开信息和趋势可以推测。
在直接用户方面，一些领先的人工智能大模型已经吸引了相当规模的用户群体。例如，百度文心一言自推出以来，用户数量迅速增长，已经突
破了1亿。这表明，人们对高效智能的大模型服务需求强劲，并且随着技术的成熟和普及，直接用户数量有望持续增加。
至于潜在用户，考虑到人工智能大模型在各领域的广泛应用前景，潜在用户群体非常庞大。无论是智能客服、自动驾驶、医疗诊断还是教育、
娱乐等领域，人工智能大模型都有巨大的应用潜力。随着技术进步和市场开拓，越来越多的用户将有机会接触到并受益于这些先进模型。

2、市场现状

人工智能大数据模型的市场现状可以描述为蓬勃发展、迅速增长的趋势。
快速增长的市场规模：随着人工智能和大数据技术的不断发展，人工智能大数据模型市场规模不断扩大。越来越多的企业和组织意识到了人工智能在数据分析和应用方面的重要性，从而推动了大数据模型市场的快速增长。
广泛的应用领域：人工智能大数据模型被广泛应用于各个行业和领域，包括金融、医疗、零售、制造、交通等。它们可以帮助企业和组织从海量数据中挖掘出有价值的信息和洞见，提高决策的准确性和效率。
技术不断创新：人工智能大数据模型市场处于不断创新和发展的阶段。新的算法、技术和方法不断涌现，不断提升模型的性能和效果，满足不同行业和应用场景的需求。
竞争激烈：由于市场前景广阔，吸引了众多企业和厂商进入该领域，竞争激烈。各家企业通过不断创新、提高技术水平和服务质量来争夺市场份额，推动了市场的发展和壮大。
政策支持和投资热潮：政府部门对人工智能和大数据领域给予了重视和支持，出台了一系列政策和计划，推动了人工智能大数据模型市场的发展。同时，投资者也对该领域充满了信心，纷纷投资于相关企业和项目，助力市场的快速增长。
综上所述，人工智能大数据模型市场处于蓬勃发展、竞争激烈的阶段，具有广阔的应用前景和巨大的发展潜力。

3、市场与产品生态

人工智能大模型产品的核心用户群主要来自对技术前沿感兴趣、追求数据驱动决策的人群。这些用户涵盖了科技、金融、医疗、教育等多个行业，需要处理和分析大量数据以获得有价值的洞察和决策支持。
典型用户具备以下特征：

学历：大多具有本科及以上学历，尤其是在计算机科学、数学、统计学等领域有深入学习背景的人群。
年龄：多集中在25至45岁之间，这个年龄段的人们在工作中通常需要处理复杂的数据和分析任务。
专业：主要包括计算机科学、数据分析、人工智能等领域的专业人士，以及各行业对数据分析有高度需求的从业者。
爱好：对新技术、数据分析、人工智能等领域有浓厚兴趣，并愿意不断学习和探索。
收入：相对较高，因为他们通常从事高技术或高附加值的工作。
这些用户的表面需求是高效、准确地处理和分析数据，以获取有价值的洞察。潜在需求则是通过人工智能技术优化工作流程，提高工作效率，降低运营成本，推动业务创新。
这些产品的用户之间通常存在一定的互动和合作。比如，不同行业的用户可能会分享数据处理和分析的经验，共同探讨如何更好地应用人工智能大模型解决实际问题。这种互动有助于形成一个良好的用户生态，促进产品的持续改进和优化。
4、产品规划

NABCD

在文心一言的基础上，我设计的新功能是跨语言交流增强器。
需求（Need）：
随着全球化的加速，跨语言交流的需求日益迫切。许多用户在与不同语言背景的人交流时，面临着语言障碍的问题。因此，一个能够实时翻译并理
解多种语言的交流工具成为了迫切的需求。
方法（Approach）：
跨语言交流增强器将利用先进的机器翻译技术和自然语言处理技术，实现多种语言之间的实时翻译和对话。通过集成文心一言的核心算法，并结合
多语言模型和语料库，该功能可以准确地翻译各种语言，并保持对话的连贯性和自然性。
好处（Benefit）：
使用跨语言交流增强器，用户可以轻松与不同语言背景的人进行交流，打破语言壁垒，促进全球范围内的沟通和合作。无论是在国际商务、文化交
流还是旅行等方面，用户都能够获得更广阔的信息和更深入的交流体验。
竞争力（Competitors）：
当前市场上虽然存在一些翻译工具，但它们往往只关注文本翻译，缺乏对话的连贯性和自然性。跨语言交流增强器通过结合文心一言的智能对话能
力，能够在翻译的同时保持对话的流畅和准确，从而在竞争中脱颖而出。
可持续性（Delivery）：
跨语言交流增强器的开发将基于现有的技术基础和算法模型，结合大规模语料库进行训练和优化。通过持续的技术更新和模型优化，该功能将不断
提升翻译质量和用户体验，确保长期的可持续性和竞争力。
创新点：
跨语言交流增强器的创新点在于结合了机器翻译和智能对话的技术优势，实现了多种语言之间的实时、连贯和自然的交流。它不仅解决了传统翻译
工具在对话方面的不足，还通过不断优化模型和技术，提高了翻译的准确性和效率。这种创新功能将为用户带来全新的跨语言交流体验，满足他们
在全球化背景下的迫切需求。

配置角色与详细规划

计划10人进行为期16周左右的大致开发过程：

阶段	角色	人数	时间（周）	主要任务
开发阶段	开发工程师	2	4-14	开发模型算法、构建系统框架和接口
	数据分析师	1	4-8	数据清洗、特征工程、模型训练和调优
	测试工程师	1	2-4	编写测试用例、执行测试、反馈问题
		4	4
部署阶段	运维工程师	1	2-4	部署系统、配置环境、监控维护
	安全专家	1	1-2	安全审查、漏洞修复、数据保护
		2	3
迭代优化阶段	运营专员	1	1-2	收集用户反馈、监测系统运行情况、制定优化方案
	数据分析师	1	1-2	分析数据，提取用户行为特征，为优化提供数据支持
	开发团队	2	持续	根据反馈和数据分析结果进行迭代优化