(信息获取)什么是向量空间模型(VSM)?
什么是向量空间模型(VSM)?对于下面的文档集,项权值公式为tf*idf,tf为项在文档中出现的次数,idf为包含项的文档数,写出对应的VSM矩阵,并按向量内积计算两两文档间的相似度。注:空格为分词标记,假设“的”、“是”、“有”、“对”、“一个”、“一门”和英文字母是停止词。
(1) 信息 获取 是 计算机 科学 的 一个 研究 方向。
(2) C 语言 是 计算机 本科 学生 的 一门 必修课。
(3) Web 信息 获取 对 本科 学生 的 学习 有 帮助。
(4) 信息 获取 是 计算机 程序 自动 实现 的。