06-电影数据集题材关联分析

精致的猪猪2 2023-01-13 01:55:05

课时名称	课时知识点
06-电影数据集题材关联分析	06-电影数据集题材关联分析

...全文

273 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

机器学习20241106-06

丧尸电影数据分析数据源

Children和Animation 这俩题材是最相关的了，常识也可以分辨出来。 ### 电影题材关联 数据集： [MovieLens (small)](https://grouplens.org/datasets/movielens/) ### 提升度（lift）：物品集A的出现对物品集B的出现概率发生了多大的变化 - lift（A==>B）=confidence（A==>B）/support(B)=p(B|A)/p(B) - 现在有** 1000 ** 个消费者，有** 500** 人购买了茶叶，其中有** 450人同时** 购买了咖啡，另** 50人** 没有。由于** confidence(茶叶=>咖啡)=450/500=90%** ，由此可能会认为喜欢喝茶的人往往喜欢喝咖啡。但如果另外没有购买茶叶的** 500人** ，其中同样有** 450人** 购买了咖啡，同样是很高的** 置信度90%** ,由此，得到不爱喝茶的也爱喝咖啡。这样看来，其实是否购买咖啡，与有没有购买茶叶并没有关联，两者是相互独立的，其** 提升度90%/[(450+450)/1000]=1** 。

docker基于知识图谱的电影推荐系统Demo项目_使用Python和Neo4j构建的智能推荐引擎_通过分析Netflix和TMDB数据集实现个性化电影推荐与问答功能_适用于学习Python编.zip

包含字段：排序、作品名称、作者、发布网站、男女频、作品分类、作品标签、作品字数、阅读数、热度值。

许伟的课程社区_NO_1

1

社区成员

117

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章