NLP之相关反馈

单程票闯天涯 2015-08-21 04:47:04

在大多数数据集中，同一个概念可以有不同的词进行表达，这个现象就是一义多词，这会对大部分的信息检索系统的召回率产生影响。在这里我们谈一下查询优化中的相关反馈的概念和方法。
相关反馈（RF）的主要思想是，用户会对初次检索的结果的相关性给出反馈意见，其基本过程包括：
1 用户提交一个初始的简短查询
2 系统返回初次检索结果
3 用户对部分结果进行标注（相关性，不相关性）
4 系统基于用户的反馈计算出一个更好的查询表示系统需求
5 利用新查询系统返回新的检索结果
上述过程可以反复多次循环。而相关反馈是依赖于某些假设。第一，用户必须有足够的知识来建立一个不错的初始查询，该查询至少要在某种程度上接近需求文档。第二，相关反馈方法要求相关文档之间非常相似。
相关反馈的算法——Rocchio算法
基本理论，假设我们要找一个最优的查询向量q,也就是查询语句关键词特征，它与相关文档之间的相似度最大同时又和不相关文档之间相似度最小。若Cr 表示相关文档集，Cnr表示不相关文档集，那么我们的最优查询向量q就是
q=argmax{sim(q,Cr)-sim(q,Cnr)} 其中sim是余弦相似度公式。

...全文

107 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

红面狼 2015-08-21

打赏
举报

回复

基于NLP和数字水印的智慧安全投诉反馈系统.zip 大学生课程设计课程设计自己大二写的课程设计

【资源说明】 NLP课程设计基于Pytorch+Flask+Vue的食堂反馈系统.zipNLP课程设计基于Pytorch+Flask+Vue的食堂反馈系统.zipNLP课程设计基于Pytorch+Flask+Vue的食堂反馈系统.zip 【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也可作为毕业设计、课程设计、作业、项目初期立项演示等，当然也适合小白学习进阶。 4、如果基础还行，可以在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

本课程隶属于自然语言处理(NLP)实战系列。自然语言处理(NLP)是数据科学里的一个分支，它的主要覆盖的内容是：以一种智能与高效的方式，对文本数据进行系统化分析、理解与信息提取的过程。通过使用NLP以及它的组件，我们可以管理非常大块的文本数据，或者执行大量的自动化任务，并且解决各式各样的问题，如自动摘要，机器翻译，命名实体识别，关系提取，情感分析，语音识别，以及主题分割等等。一般情况下一个初级NLP工程师的工资从15万-35万不等，所以掌握NLP技术，对于人工智能学习者来讲是非常关键的一个环节。【超实用课程内容】课程从自然语言处理的基本概念与基本任务出发，对目前主流的自然语言处理应用进行全面细致的讲解，包括文本分类，文本摘要提取，文本相似度，文本情感分析，文本特征提取等，同时算法方面包括经典算法与深度学习算法的结合，例如LSTM，BiLSTM等，并结合京东电商评论分类、豆瓣电影摘要提取、今日头条舆情挖掘、饿了么情感分析等过个案例，帮助大家熟悉自然语言处理工程师在工作中会接触到的常见应用的实施的基本实施流程，从0-1入门变成自然语言处理研发工程师。【课程如何观看？】 PC端：https://edu.csdn.net/course/detail/25649 移动端：CSDN 学院APP（注意不是CSDN APP哦）本课程为录播课，课程2年有效观看时长，大家可以抓紧时间学习后一起讨论哦~【学员专享增值服务】源码开放课件、课程案例代码完全开放给你，你可以根据所学知识，自行修改、优化下载方式：电脑登录https://edu.csdn.net/course/detail/25649，点击右下方课程资料、代码、课件等打包下载通过第二课时下载材料

【资源说明】基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip 基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip 基于LDA主题模型进行金庸小说的文本分类python源码(NLP大作业).zip 【备注】 1.项目代码均经过功能验证ok，确保稳定可靠运行。欢迎下载体验！ 2.主要针对各个计算机相关专业，包括计算机科学、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师、企业员工。 3.项目具有丰富的拓展空间，不仅可作为入门进阶，也可直接作为毕设、课程设计、大作业、初期项目立项演示等用途。 4.当然也鼓励大家基于此进行二次开发。在使用过程中，如有问题或建议，请及时沟通。 5.期待你能在项目中找到乐趣和灵感，也欢迎你的分享和反馈！

自然语言处理(NLP)的最新进展导致了强大的语言模型的发展，如 GPT(生成式预训练 Transformer)系列[1,2,3,4,5]，包括 ChatGPT 和 GPT-4 等大型语言模型(LLM)。这些模型在大量的文本数据上进行了预训练，并在广泛的 NLP 任务中表现出了卓越的性能，包括语言翻译、文本摘要和问答。特别是 ChatGPT 模型已经展示了其在各个领域的潜力，包括教育、医疗保健、推理、文本生成、人机交互和科学研究。 LLM 开发的一个关键里程碑是 InstructGPT[5]，该框架允许基于来自人类反馈的强化学习(RLHF)对预训练语言模型进行指令微调[6,5]。该框架使 LLM 能够适应广泛的 NLP 任务，通过利用人类反馈使其具有高度通用性和灵活性。 RLHF 使模型能够与人类的偏好和人类的价值观保持一致，通过无监督的预训练，这从仅训练文本语料库的大型语言模型中得到了显著改善。ChatGPT 是 InstructGPT 的继承者。自 2022 年 12 月发布以来，ChatGPT 已经配备了这些先进的开发，在推理和广义文本生成等各种下游 NLP 任务中取得

594

社区成员

254,047

社区内容

发帖

与我相关

我的任务

其他技术论坛（原bbs）

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章