一、说明 tf-idf是个可以提取文章关键词的模型;他是基于词频,以及词的权重综合因素考虑的词价值刻度模型。一般地开发NLP将包含三个层次单元:最大数据单元是语料库、语料库中有若干文章、文章中有若干词语。这样从词频上说,就有词在文章的频率,词在预料库的频率,文章在预料库的频率等概念,合理用这些概念,提取词的真实价值,起到提取关键词的目的。
【NLP模型】文本建模(2)TF-IDF关键词提取原理_无水先生的博客-CSDN博客
2
社区成员
331
社区内容
加载中
试试用AI创作助手写篇文章吧