社区
许伟的课程社区_NO_1
Python数据分析零基础入门
帖子详情
06-电影数据集题材关联分析
精致的猪猪2
2023-01-13 01:55:05
课时名称
课时知识点
06-电影数据集题材关联分析
06-电影数据集题材关联分析
...全文
234
回复
打赏
收藏
06-电影数据集题材关联分析
课时名称课时知识点06-电影数据集题材关联分析06-电影数据集题材关联分析
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
机器学习202411
06
-
06
机器学习202411
06
-
06
丧尸
电影
数据分析数据源
丧尸
电影
数据分析数据源
基于 MovieLens
数据集
做的关联规则
Children和Animation 这俩
题材
是最相关的了,常识也可以分辨出来。 ###
电影
题材
关联
数据集
: [MovieLens (small)](https://grouplens.org/datasets/movielens/) ### 提升度(lift):物品集A的出现对物品集B的出现概率发生了多大的变化 - lift(A==>B)=confidence(A==>B)/support(B)=p(B|A)/p(B) - 现在有** 1000 ** 个消费者,有** 500** 人购买了茶叶,其中有** 450人同时** 购买了咖啡,另** 50人** 没有。由于** confidence(茶叶=>咖啡)=450/500=90%** ,由此可能会认为喜欢喝茶的人往往喜欢喝咖啡。但如果另外没有购买茶叶的** 500人** ,其中同样有** 450人** 购买了咖啡,同样是很高的** 置信度90%** ,由此,得到不爱喝茶的也爱喝咖啡。这样看来,其实是否购买咖啡,与有没有购买茶叶并没有关联,两者是相互独立的,其** 提升度90%/[(450+450)/1000]=1** 。
基于Python的畅销书大数据分析-本次课程设计,通过分析一份某互联网平台的图书热销榜单,分析热销书的各类指标
基于Python的畅销书大数据分析----本次课程设计,通过分析一份某互联网平台的图书热销榜单,分析热销书的各类指标,通过分析数据,整理热销书的共性特征,为出版社、作者、作者提供相应的指导信息。分析的图书热销榜单共有数据550条,字段7列。
tmbd_data_analysis:
电影
数据库的EDA
Movide数据库
数据集
的数据分析 有关更多详细信息,请参见或。 依存关系 为conda环境生成: conda list -e > 为点子环境生成: pip freeze > 执照
许伟的课程社区_NO_1
1
社区成员
117
社区内容
发帖
与我相关
我的任务
许伟的课程社区_NO_1
复制链接
扫一扫
分享
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章