1.本项目基于jieba的中文分词库提取新闻中的关键词,获得相关内容,使用杰卡德相似系数计算不同新闻的相似度,在用户浏览某一新闻时,实现推荐相关新闻。
2.项目运行环境:Python环境、node.js前端环境和MySQL数据库。
3.项目包括6个模块:数据预处理、热度值计算、相似度计算、新闻统计、API接口开发、前端界面实现。数据来自网站的早年新闻,爬取时,源数据仅有新闻题目、正文和发帖时间,为方便计算新闻的热度值,给新闻添加了随机的浏览次数和评论数;每个新闻计算一个热度值,为后续的热度榜和为你推荐模块做新闻排序使用;新闻相似度是本项目进行推荐的基础,使用新闻主题词的重合度考量新闻相似度;统计指定标签下的新闻是为用户选择标签后生成“为你推荐”模块内容做准备。
4.项目博客:
https://blog.csdn.net/qq_31136513/article/details/132617120
, 相关下载链接:
https://download.csdn.net/download/qq_31136513/88285126?utm_source=bbsseo