164
社区成员
发帖
与我相关
我的任务
分享本作业所属课程:软件开发实践
本作业要求来源:第五次作业 —— 阿尔法冲刺任务说明
本作业目标:实现项目功能 100% 闭环,完成容器化部署与全量文档整理,复盘冲刺成效与问题,输出可演示、可交付的项目成果
其他参考资料:
Alpha Sprint:棱光智构造项目开发冲刺(第一次博客): https://blog.csdn.net/2501_94002919/article/details/155918294
棱光智构 第一篇冲刺博客: https://blog.csdn.net/2501_94002919/article/details/155917581
【阿尔法冲刺 第二篇】Day3-4: 主要功能开发: https://blog.csdn.net/2501_94002919/article/details/155948098
棱光智构 第三篇冲刺博客: https://blog.csdn.net/2501_94002919/article/details/155947917
棱光智构 第四篇冲刺博客: https://bbs.csdn.net/topics/620076760
超分辨率算法优化手册、视频特效开发指南、模型训练部署技术文档
时间区间:2025 年 12 月 20 日 - 2025 年 12 月 21 日(第 9-10 天,冲刺最终阶段)
| 计划任务 | 负责人 | 计划完成率 | 实际完成率 | 差异说明(具体且真实) |
|---|---|---|---|---|
| 项目规划与需求分析 | 高杰铭+黄林哿 | 100% | 100% | 已完成用户需求调研、PRD撰写,技术调研覆盖YOLO各模型差异,确定Ultralytics+PyTorch技术栈,交付物齐全 |
| 界面设计与开发 | 郑意捷+熊刘坤+杨力豪 | 100% | 100% | 完成Qt5主窗口及各功能子窗口布局,实现浅/深色主题切换,控件响应正常,适配1080P及以上分辨率 |
| 核心功能模块开发 | 郭益宁+郑柠苧+黄羿豪+徐逸涵 | 100% | 100% | 训练、测试、推理模块全量完成;数据集转换模块VOC转YOLO功能正常,COCO转YOLO存在少量标签格式兼容问题(已定位,待修复) |
| GPU加速与性能优化 | 张筱晗+林粲然 | 100% | 100% | 完成CUDA/cuDNN集成,训练速度提升3倍;实现损失曲线实时可视化,日志输出延迟控制在500ms内 |
| 集成测试与BUG修复 | 全体 | 100% | 100% | 45条回归用例通过率98%;已修复模型训练中断、界面响应异常等12个BUG;剩余1个大规模数据集训练稳定性问题待验证 |
| 文档编写与发布准备 | 黄林哿+高炜翔+徐逸涵 | 100% | 100% | 已完成使用手册、接口文档撰写;开发文档待补充核心模块代码注释;Windows发布包已完成,Linux版本依赖库适配中 |
项目燃尽图(最终版)说明:

YOLO目标检测训练与测试工具是一个基于Qt5的现代化图形用户界面应用程序,提供了使用YOLOv8、YOLOv5和YOLO11系列模型进行目标检测的完整解决方案。




| 问题描述(具体且详细) | 负责人 | 解决方案(可落地、可复用) |
|---|---|---|
| 不同YOLO模型系列API接口不兼容(YOLOv5自定义脚本与YOLOv8/11/12的Ultralytics API参数调用方式、训练流程差异大,统一封装时出现参数传递失败、训练中断) | 郭益宁+高炜翔 | 1. 设计抽象YOLOModel基类,定义统一的train()/test()/infer()接口,为各模型实现专属子类适配差异;2. 建立超参数映射字典,统一参数命名与传递规则;3. 为YOLOv5封装兼容层,将其脚本包装为Ultralytics风格接口 |
| Qt5界面在高分辨率屏幕(2K/4K)下控件缩放比例失调,部分按钮、文字显示模糊 | 郑意捷+熊刘坤 | 1. 在Qt应用初始化时开启高DPI缩放支持(QApplication::setAttribute(Qt::AA_EnableHighDpiScaling));2. 使用Qt的布局管理器(QGridLayout/QHBoxLayout)替代固定坐标布局,控件尺寸采用相对比例设置;3. 替换位图图标为SVG矢量图标,保证缩放清晰 |
| 数据集转换模块中COCO格式转YOLO格式时,复杂嵌套的标注信息(如多实例重叠标注)解析失败,生成的标签文件缺失目标类别ID | 郑柠苧+徐逸涵 | 1. 解析COCO JSON文件时,递归遍历annotations字段的嵌套结构,提取每个目标的bbox、category_id等核心信息;2. 增加数据校验步骤,对解析后的标注信息进行合法性检查(如bbox坐标是否超出图像范围);3. 建立COCO类别与YOLO类别ID的映射表,确保类别ID转换准确 |
| GPU加速训练时,批量加载大规模数据集出现内存溢出(OOM),训练进程被系统终止 | 张筱晗+林粲然 | 1. 采用数据加载器分批加载策略,将数据集按批次分割后异步加载,减少单次内存占用;2. 启用PyTorch的pin_memory和num_workers参数优化数据加载效率,同时限制每个批次的图像数量(根据GPU显存动态调整batch_size);3. 对图像进行预处理时,先缩放再加载到内存,降低单张图像的内存占用 |
| 模型推理时,批量处理文件夹图片出现部分图像检测结果为空(因图像格式为WebP、BMP等非通用格式,OpenCV无法解析) | 黄羿豪+杨力豪 | 1. 扩展图像解析支持库,集成Pillow库补充OpenCV对WebP、BMP等格式的解析能力;2. 在推理前增加图像格式校验步骤,过滤不支持的格式并给出提示;3. 实现自动格式转换功能,将非通用格式图像转换为JPG/PNG后再进行推理 |
| 集成测试中,多模型切换训练时,前一次训练的权重文件残留,导致新模型初始化时加载错误权重 | 全体 | 1. 在每次训练任务启动前,增加权重文件清理步骤,删除临时目录下的残留权重;2. 为不同模型的训练任务创建独立的临时目录,隔离权重文件;3. 训练初始化时增加权重文件校验,验证权重与所选模型的匹配性,不匹配则提示并终止初始化 |
进度与目标:10 天冲刺 100% 达成目标,核心功能全流程闭环,产出可演示、可部署的项目版本。
团队协作亮点:
待改进点: