项目需求-行为性别预测-用朴素贝叶斯算法实现

dht8899 2023-01-13 02:30:44

课时名称课时知识点
项目需求-行为性别预测-用朴素贝叶斯算法实现项目需求-行为性别预测-用朴素贝叶斯算法实现
...全文
53 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
一.用户聚类分析 1.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区 2.选取算法:聚类算法-KMeans 3.确定聚类个数(6个) 4.通过训练模型形成中心点 5.对用户进行聚类 二.性别预测 1.理解需求行为性别(男(1),女(0)) 2.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区 3.选算法:分类算法朴素贝叶斯) 4.获取经验样本:打上类别标签(抽取数据,人工打上标签--男--女) 5.评估模型效果(用样本中一部分数据做测试) 6.模型应用于大量待计算数据 三.年龄层次预测 1.理解需求:年龄阶段预测(青年(0),中年(1),老年(2)) 2.提取特征:用户msisdn,流量类型,上网时长,使用总流量,url访问网址地区 3.选算法:分类算法朴素贝叶斯) 4.获取经验样本:打上类别标签(抽取数据,人工打上标签--青年--中年--老年) 5.评估模型效果(用样本中一部分数据做测试) 6.模型应用于大量待计算数据 四.流失率标签预算() 1.理解需求:特征的选择,特征的加工 2.提取特征:用户msisdn,上网时长,上行流量,下行流量,目的端口,状态码(大于400访问不成功,小于400访问成功) 3.选算法:逻辑回归 4.获取经验样本:打上类别标签(抽取数据,人工打上标签--流式--没流失) 5.评估模型效果(用样本中一部分数据做测试) 6.模型应用于大量待计算数据 值域范围差距过大,把各个范围的值域进行缩放——>minmax缩放 五.用户活跃度预算 1.理解需求:特征的选择,特征的加工 2.提取特征:用户msisdn,上网时长,上行流量,下行流量,目的端口,状态码(大于400访问不成功,小于400访问成功) 3.选算法:逻辑回归 4.获取经验样本:打上类别标签(抽取数据,人工打上标签--活跃--不活跃) 5.评估模型效果(用样本中一部分数据做测试) 6.模型应用于大量待计算数据

1

社区成员

发帖
与我相关
我的任务
社区管理员
  • dht8899
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧