114
社区成员
发帖
与我相关
我的任务
分享| 这个作业属于哪个课程 | 202501福大-软件工程实践W班 |
|---|---|
| 这个作业要求在哪里 | β冲刺 |
| 团队名称 | 月下调试人 |
本次项目在 Alpha 阶段已完成系统核心流程的基本闭环,包括奖状上传 → OCR 识别 → LLM 智能分类与查重 → 审核入库 → 管理员复审。进入 Beta 冲刺阶段后,我们的预期目标主要围绕“精度提升、系统体验增强、可扩展性优化”展开。具体计划包括:
(1)智能识别能力提升
引入更高精度的 OCR 模型,降低“无法分类”比率;
优化 LLM 提示词结构,使奖项分类上下文更清晰;
增强图像过滤模块,提高图像质量判断稳定性。
(2)智能查重逻辑优化
使用 OCR 拆分重要字段作为辅助;
加强相似文本聚合,提高查重准确率。
(3)后台管理体验增强
完成管理员列表、奖项管理、批量审核模块;
增加日志与审核轨迹,便于管理员查看处理过程;
提供批量处理入口,提升管理效率。
(4)学生端体验提升
完成注册、登录、提交记录查看、个人信息编辑模块;
支持拖拽上传、进度显示、失败一键重传;
提供奖状分类统计可视化。
(5)系统性能优化
添加 RocketMQ 异步处理流水线,提升高并发上传吞吐量;
对 Elasticsearch 查询进行缓存与权重分配调整;
完善 Worker 日志监控,追踪异常任务。
总体完成情况:
| 阶段任务 | 预期 | 实际完成度 | 说明 |
|---|---|---|---|
| OCR 与分类优化 | ✔ | ✔ | 模型精度提升,分类更稳定 |
| 智能查重优化 | ✔ | ✔ | 判别维度增强,误判率降低 |
| 管理后台增强 | ✔ | ✔ | 完成管理员列表、奖状管理、审核入口 |
| 学生端体验升级 | ✔ | 90% | 基本完成,部分统计图表在优化中 |
| 系统性能优化 | ✔ | 80% | RocketMQ 已完成,缓存策略仍在微调 |
小组采用 Scrum 式每日站会模式,通过短周期迭代、大量信息同步,使不同角色的任务明确且连续。整体表现为:
• 后端与前端同步推进,避免接口错位;
• 每日更新任务、记录困难点与次日计划;
• 团队成员保持高频交流,使整体进度贴合预期。
后端开发:
负责 OCR 接入、ES 检索优化、RocketMQ 异步流程、查重逻辑、管理员模块、学生模块等业务逻辑。
工作量大但分工明确,一人负责 AI 与查重处理逻辑,另一人负责审核流程、分页系统与后台接口。
前端开发:
完成后台管理端 AdminLayout、管理员列表、奖项详情、审核面板等页面;
另一人负责学生端注册、个人信息、奖状提交、提交记录查看等交互体验。
AI 技术员:
专职优化 prompt、设计分类与查重提示词、分析错误案例,并协助团队理解 AI 的行为模式。
测试与文档:
完成功能测试、撰写日志、绘制燃尽图、记录系统运行截图。
项目管理:
制定计划、跟踪每日进度、主持站会、更新需求、整合成果。
协作特点:所有成员均能按时汇报,遇到困难会及时同步。例如 RocketMQ 消息无法正常消费、Elasticsearch 权重策略导致查找不准问题,都是在站会上讨论后快速调整,从而保证整体进度不被阻塞。
| 功能点 | 计划实现 | 实际实现 | 备注 |
|---|---|---|---|
| OCR 识别 | 识别奖状文字内容 | 接入升级版 OCR,提高精度 | ✔ |
| 分类 | 基于关键词分类 | 引入 LLM 提示词优化结构化分类 | ✔ |
| 查重 | 简单文本匹配 | 增加姓名+时间+OCR分段字段 | ✔ 优化显著 |
| 上传并发处理 | 同步处理 | RocketMQ 异步化流水线 | ✔ 性能大幅提升 |
| 管理端 | 基础 CRUD | 增加批量审核、日志追踪 | ✔ |
| 学生端 | 上传与查看 | 提供进度、重传、统计 | ✔ |
前端模块:




后端模块:



问题:
Alpha 阶段 LLM 分类经常出现“AI 无法分类”或“分类偏差”。
AI 技术员修改的 Prompt 示例:
加入分析奖项等级、年份、文本上下文的要求
要求 LLM 给出分类理由,使决策可解释
明确奖项类别(科技竞赛、文体比赛等)的关键词指引
成果:
“无法分类”比率从 26% 降到约 8%,分类稳定性显著提升。
问题:
学生姓名、学号位置不固定,字体不清晰,查重经常出现误判。
AI 技术员的做法:
将奖状文本拆分为“姓名字段”、“奖项字段”、“时间字段”;
交由 LLM 判断哪个字段最可靠;
最终结合 ES 模糊匹配,实现更稳定的查重。
成果:
查重准确率提升明显,误判率下降,管理端审核工作量减少。
前端同学收到 LLM 的 JSON 结构不稳定时,AI 技术员会解释模型行为,并给出解决策略,如:
使用正则清洗无关字符
允许 LLM 重试两次
在提示词中明确要求输出 JSON 且字段必须完整
这极大降低了 AI 输出对系统稳定性的影响。
| 成员 | 贡献值 |
|---|---|
| 张宝仁 | 24% |
| 曾诗皓 | 11% |
| 黄俊平 | 11% |
| 王盛明 | 13% |
| 赵俊强 | 18% |
| 韩冰晨 | 12% |
| 池博洋 | 11% |
整个项目从 Alpha 到 Beta 冲刺,实现了从“功能闭环”到“体验优化 + 性能提升 + AI 深度融合”的升级。
团队协作稳定,分工明确,AI 技术员在系统智能性上起到关键作用,使项目在数据自动化处理方面取得显著提升。
对奖状识别过程中出现的各种问题考虑的比较细致,赞!
1.建议增加对上传图片大小的约束;
2.建议补充辅导员对系统使用的反馈。