R语言离群值处理分析
社区首页 (3665)
请编写您的帖子内容
社区频道(9)
显示侧栏
卡片版式
全部
社区活动
技术交流
最新资讯
问答专区
社区指南
博文收录
Ada助手
活动专区
最新发布
最新回复
标题
阅读量
内容评分
精选

255
评分
回复
R语言离群值处理分析
数据中的异常值可能会使预测失真并影响准确性,最近我们被客户要求撰写关于离群值处理的研究报告,包括一些图形和统计输出。为了更好地理解异常值的含义,我将比较具有和不具有异常值的汽车数据集的简单线性回归模型的拟合。如果你提取并检查每一个有影响的行(从下面的输出),你将能够推断出为什么该行变得有影响力。对于给定的连续变量,异常值是那些位于1.5 * I Q R之外的观测值,其中IQR,“四分位数间距”是第75和第25个四分位之间的差值。库克距离是一个关于给定回归模型计算的度量,因此仅受模型中包含的X个变量的影响。
复制链接 扫一扫
分享

246
评分
回复
sas文本挖掘案例:如何使用SAS计算Word Mover的距离
WMD是两个文档之间的距离,作为将所有单词从一个文档移动到另一个文档所需的最小(加权)累积成本。通过解决以下线性程序问题来计算距离。T ij表示文档d中的单词i在文档d'中移动到单词j的多少;C(1;j)的表示从文件d中的单词我到文件d '中的单词J‘行进’的费用;这里的成本是word2vec嵌入空间中的两个词'欧几里德距离;如果字我出现Ç我在文档d次,我们记WMD是地球移动器距离度量(EMD)的一个特例,这是一个众所周知的运输问题。
复制链接 扫一扫
分享

243
评分
1
拓端tecdat|R语言是否对二分连续变量执行逻辑回归
原文链接:http://tecdat.cn/?p=6851 原文出处:拓端数据部落公众号 相关视频:R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险 逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例 ,时长06:48
复制链接 扫一扫
分享

262
评分
回复
拓端tecdat|R语言实现 Copula 算法建模相依性案例分析报告
原文链接:http://tecdat.cn/?p=6193 原文出处:拓端数据部落公众号 copula是将多变量分布函数与其边缘分布函数耦合的函数,通常称为边缘。Copula是建模和模拟相关随机变量的绝佳工具。Copula的主要吸引力在于,通过使用
复制链接 扫一扫
分享

267
评分
回复
拓端tecdat|R语言实现拟合神经网络预测和结果可视化
原文链接:R语言实现拟合神经网络预测和结果可视化 | 拓端tecdat 原文出处:拓端数据部落公众号 神经网络一直是迷人的机器学习模型之一,不仅因为花哨的反向传播算法,而且还因为它们的复杂性(考虑到许多隐藏层的深度学习)和受大脑启发的结构。 神经网
复制链接 扫一扫
分享

225
评分
回复
拓端tecdat|卡尔曼滤波器:用R语言中的KFAS建模时间序列
原文链接:卡尔曼滤波器:用R语言中的KFAS建模时间序列 | 拓端tecdat 原文出处:拓端数据部落公众号 时间序列预测,ARIMA等传统模型通常是一种流行的选择。虽然这些模型可以证明具有高度的准确性,但它们有一个主要缺点 - 它们通常不会解释“
复制链接 扫一扫
分享

287
评分
回复
拓端tecdat|R语言: GARCH模型股票交易量的研究道琼斯股票市场指数
全文链接:http://tecdat.cn/?p=6632 原文出处:拓端数据部落公众号 相关视频:时间序列分析:ARIMA GARCH模型分析股票价格数据 时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据 我将建立道琼
复制链接 扫一扫
分享

302
评分
1
拓端tecdat|R语言使用K-Means聚类可视化WiFi访问
全文链接:http://tecdat.cn/?p=6715 原文出处:拓端数据部落公众号 【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福质量系数可视化实例 KMEANS均值聚类和层次聚类:R语言分析生活幸福质量系数可视化实例 ,时长06:
复制链接 扫一扫
分享

302
评分
回复
拓端tecdat|Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
全文链接:http://tecdat.cn/?p=6663 原文出处:拓端数据部落公众号 此示例中,神经网络用于使用2011年4月至2013年2月期间的数据预测公民办公室的电力消耗。 每日数据是通过总计每天提供的15分钟间隔的消耗量来创建的。
复制链接 扫一扫
分享
为您搜索到以下结果:
2
社区成员
11
社区内容
发帖
与我相关
我的任务
拓端研究室TRL
拓端(http://tecdat.cn )创立于2016年,自成立以来,就定位为提供专业的数据分析与数据挖掘服务的提供商,致力于充分挖掘数据的价值,为客户定制个性化的数据解决方案与行业报告等。
复制链接 扫一扫
分享确定
社区描述
拓端(http://tecdat.cn )创立于2016年,自成立以来,就定位为提供专业的数据分析与数据挖掘服务的提供商,致力于充分挖掘数据的价值,为客户定制个性化的数据解决方案与行业报告等。 pythonr语言算法 企业社区
加入社区
获取链接或二维码
- 近7日
- 近30日
- 至今
加载中
社区公告
暂无公告