大型语言模型推理过程中过程奖励模型(PRM)的优化与挑战研究及其应用

码流怪侠
音视频领域优质创作者
博客专家认证
2025-01-16 23:27:12
...全文
50 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

17,717

社区成员

发帖
与我相关
我的任务
社区描述
深度学习相关博客和资源~
人工智能图像处理深度学习 个人社区 浙江省·杭州市
社区管理员
  • 码流怪侠
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧