软件工程实践——软件评测作业

222100127黄泽钛 2024-04-19 15:39:44

这个作业属于哪个课程	软件工程实践-2023学年-W班
这个作业要求在哪里	软件工程实践——软件评测作业
这个作业的目标	软件评测，撰写博客
其他参考文献	《构建之法》

一.调研与测评（产品一：文心一言；产品二：kimi）
1.使用体验
（1）介绍和使用
（2）优缺点分析
（3）改进意见
（4）采访
对222100128黄煦陶采访：
2.bug描述
（1）bug发生时的测试环境
（2）bug的可复现性和具体复现步骤
（3）bug的具体情况描述
（4）bug分析
3.结论
二.分析
1.需要多少时间完成
2.优劣
3.可以提高的方面
4.未作改进的原因
5.
三.建议和规划

一.调研与测评（产品一：文心一言；产品二：kimi）

1.使用体验

（1）介绍和使用

产品一：文心一言是百度基于其先进的人工智能技术推出的一款知识增强大语言模型。文心一言背后的技术包括有监督精调、人类反馈的强化学习、提示以及知识增强、检索增强和对话增强等六个核心技术模块。这些技术共同构成了文心一言的技术基础，并在对话效果上得到了充分的展现。百度利用其深度学习平台飞桨和文心大模型对文心一言进行了联合优化，提供了从开发训练到推理部署的全流程支持。
产品二：KimiAI是由月之暗面（Moonshot AI）公司推出的一款智能助手产品。除了长文总结和生成、联网搜索，Kimi还具有数据处理、编写代码、用户交互和翻译等功能。它旨在通过大容量知识库提供智能闲聊、解答问题和生活助手服务，拥有高度的智能交互能力，可以让用户随时随地与之聊天，寻找乐趣。
（2）优缺点分析
产品一 - 优势：
- 知识增强技术：文心一言背后的关键技术之一是知识增强，它通过融合海量的知识和数据，提高了模型的效率、效果和可解释性。
- 持续的技术创新：百度持续对文心一言进行技术创新和训练数据的扩充，以保持其领先优势和适应新的应用场景。
- 广泛的应用场景：文心一言可以应用于多种场景，如商业报告、文案策划、日常交流等，其适用范围广泛，能够满足不同用户的需求。 - 劣势：
- 生成结果的连贯性和逻辑性问题：文心一言在某些情况下可能会出现语义不连贯或逻辑不清晰的情况。
- 隐私保护风险：由于文心一言需要大量的数据进行训练，数据采集和存储过程中可能涉及用户隐私信息，存在一定的隐私保护风险。
产品二 - 优势：
- 高效的数据处理和编写代码能力：KimiAI不仅能够处理大量的数据和文本，还具备编写代码的能力。这使得它在处理数据分析、编程任务等方面表现出色，能够为用户提供高效、便捷的支持。
- 智能交互体验：KimiAI注重用户体验，提供丰富的交互功能。它能够理解用户的指令和需求，提供有针对性的回答和解决方案。同时，其简洁直观的用户界面设计也使用户能够轻松上手，快速掌握使用方法。 - 劣势：
- 内容上下文的持续性问题：KimiAI在会话管理和上下文维持方面可能存在一定问题。它可能无法持续以特定的PDF或网页作为信息源。
- 智力值和语言流畅性：在某些情况下，KimiAI的智力值和语言流畅性可能不够理想。这主要体现在其对于复杂或深度推理的问题处理上可能出现偏差，语言使用也可能显得僵硬，不够自然流畅。这在一定程度上影响了其作为智能助手的用户体验。
  （3）改进意见
产品一： - 增强语义连贯性和逻辑性：通过进一步优化算法，提升模型对上下文的理解能力，确保生成的文本在语义上连贯，逻辑上清晰。这可能需要引入更先进的自然语言处理技术，如上下文感知的生成模型。 - 加强隐私保护措施：采取更加严格的数据保护措施，确保用户隐私不被泄露。这可能包括改进数据加密技术、限制对敏感数据的访问以及确保数据的合规性。
产品二： - 增强上下文管理能力：
- 优化会话管理算法，让KimiAI能够更好地跟踪和维持会话的上下文。
- 提供用户自定义上下文的功能，让用户能够根据需要设置特定的信息源或背景知识，以提高对话的连贯性和准确性。 - 提升智力值和语言流畅性：
- 引入更先进的自然语言处理技术和机器学习算法，以提高KimiAI的推理能力和语言生成能力。
- 增加更多的语料库和上下文信息，让KimiAI更好地理解用户的意图和需求，并生成更自然、流畅的回复。
  （4）采访
  
  对222100128黄煦陶采访：
- 文心一言名头大还不用翻墙，之前用了挺多次的，kimi刚开始用//这两个各有优劣吧//文心一言付费版没用过，免费版的文生图基本没用，纯玩具//代码能力一般吧，跟gpt没啥可比性//但中文语境的交互挺牛的//可能是是拿弱智吧的数据训练过，大部分脑筋急转弯都没法把它绕进去//就是有时候让他介绍某方面知识，分析某个问题，回答的很笼统，要不停追问才详说，比较懒。
- Kimi呢，我感觉还挺好用的//上下午token极长，文本分析的容量也很大//没精力看的大量文本直接丢进去，能很好地分析概括提炼总结，而且回答得很勤快，问一个问题，基本上方方面面背景知识得会给出来，推导过程也很详细//不过虽然交互界面很简洁，但是没有插件，这点不如文心，有一大堆插件。

2.bug描述

（1）bug发生时的测试环境

    - kimiAI
    - 系统windows11

（2）bug的可复现性和具体复现步骤

    - 下午时段经常出现错误代码

（3）bug的具体情况描述

    - 用户无法正常使用其APP和小程序服务，并显示“engine is overloaded”的429错误代码

（4）bug分析

可能造成的原因 - 应对高流量时存在性能问题或系统稳定性不足
bug的严重性 - 中等严重，影响用户体验
预期及改进建议 - 扩大服务器规模，希望可以承载更多用户的同时使用
3.结论
d 整体是很不错的，无论是ai绘画功能，写作，大文本解读还是学习能力都是很强的，但可以更强，智力能力以及平台水平都可以继续提升。
二.分析

1.需要多少时间完成
是一个复杂而耗时的过程，需要多方面的努力和投入。对于6名本科软件工程专业而言，需要充分评估自身的实力和资源，可能需要半年。
2.优劣
这个更难说了，肯定排不上，但如果后期还有机会精进数据，或许有机会。
3.可以提高的方面
合作层面，可以分配任务更加细致。
4.未作改进的原因
没做改进的原因（我觉得可能有很多方面。
技术挑战：自然语言处理（NLP）是一个快速发展的领域，尽管已经取得了显著进展，但要完全模拟人类的语言表达和理解能力仍然非常困难。语义连贯性和逻辑性需要深入理解文本的上下文、隐含意义和复杂结构，这对任何AI模型来说都是一个巨大的挑战
计算资源限制：训练和优化大型语言模型需要大量的计算资源。尽管技术不断进步，但计算资源的限制可能会影响模型训练和改进的效率和速度。
数据限制：系统的表现很大程度上依赖于其训练数据的数量和质量。可能受到可用训练数据的限制，这影响了其理解复杂情境和做出准确判断的能力。

5.

技术层面都存在一定短板

三.建议和规划

市场概况
- 2023年中国人工智能产业规模已达到2137亿元。预测到2028年，中国人工智能产业规模将达到8110亿元。
- 非凡产研的分析显示，文心一言以1001万的访问量高居榜首，月之暗面以297万的访问量和105.80%的环比增长，表明有大量的直接用户在使用这些AI产品
- 面向所有人
市场现状
- gpt 文心一言 kimiai等。
- 相对优势：
- 中文理解与生成：文心一言专注于中文自然语言处理，表现出色。
- 多模态生成能力：除了文本，文心一言还能生成图片和语音，提供更丰富的交互体验。
市场与产品生态
- 只能机器人，智能家居家电，自动驾驶，智慧医疗，智慧教育等
产品规划
- 第1周：项目启动
- 目标：定义项目范围和目标。
- 活动：
  - 组建项目团队。
  - 确定项目利益相关者。
  - 定义项目目标和预期成果。
  - 进行初步的市场和技术调研。
- 第2周：需求分析
- 目标：明确用户需求和系统功能。
- 活动：
  - 与利益相关者进行会议和访谈。
  - 收集和分析用户需求。
  - 确定系统功能和性能指标。
- 第3周：系统设计
- 目标：完成系统架构和模块设计。
- 活动：
  - 设计系统架构。
  - 确定技术栈和工具。
  - 设计各个模块和接口。
- 第4周：原型开发
- 目标：开发初步的系统原型。
- 活动：
  - 根据设计开发系统原型。
  - 实现核心功能的基础版本。
- 第5周：数据收集与处理
- 目标：收集训练数据并进行预处理。
- 活动：
  - 确定数据来源和收集方法。
  - 清洗和预处理数据。
  - 构建数据集。
- 第6周：模型开发
- 目标：开发和训练初步的AI模型。
- 活动：
  - 选择适当的机器学习算法。
  - 开始模型训练和调优。
- 第7周：模型评估与优化
- 目标：评估模型性能并进行优化。
- 活动：
  - 使用测试数据评估模型。
  - 调整模型参数进行优化。
- 第8周：系统集成
- 目标：将AI模型集成到系统中。
- 活动：
  - 将优化后的模型集成到原型中。
  - 进行系统集成测试。
- 第9周：用户界面设计
- 目标：设计用户界面和用户体验。
- 活动：
  - 设计用户界面。
  - 开发前端代码。
- 第10周：系统测试
- 目标：进行全面的系统测试。
- 活动：
  - 进行单元测试、集成测试和用户测试。
  - 修复发现的问题。
- 第11周：性能优化
- 目标：优化系统性能。
- 活动：
  - 分析系统性能瓶颈。
  - 优化算法和代码。
- 第12周：安全性和隐私保护
- 目标：确保系统的安全性和用户隐私。
- 活动：
  - 实施安全措施。
  - 保护用户数据和隐私。
- 第13周：文档编写
- 目标：编写系统文档和用户手册。
- 活动：
  - 编写技术文档。
  - 制作用户手册和操作指南。
- 第14周：用户培训
- 目标：对用户进行系统使用培训。
- 活动：
  - 准备培训材料。
  - 进行用户培训。
- 第15周：部署准备
- 目标：准备系统部署。
- 活动：
  - 确定部署计划和时间表。
  - 准备部署环境。
- 第16周：系统部署与上线
- 目标：完成系统部署并正式上线。
- 活动：
  - 部署系统到生产环境。
  - 监控系统运行状态。
  - 收集用户反馈。