关于MLLIB 中逻辑回归的输入数据结构的问题。

我想飞走 2015-05-18 04:22:24

MLLIB的逻辑回归，输入的数据格式是

1 x1:y1 x2:y2 x3:y3 ...
0 x11:y11 x22:y22 x33:y33 ...

这样的格式，第一个数字是标签，我想请问x1和X2代表什么。

如果按这个格式写待测数据要怎么写？

谢谢回复。

...全文

189 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

本文深入探讨了Spark MLlib中的逻辑回归算法，包括基础理论、梯度下降算法和正则化。详细解析了Spark Mllib Logistic Regression的源码，涉及LogisticRegressionWithSGD、GradientDescent和Updater的实现。同时，提供了一个完整的逻辑回归训练实例，展示了如何使用Spark MLlib训练模型并评估性能。

本文介绍了如何使用Python和Spark MLlib进行逻辑回归模型训练和评估。通过StumbleUpon Evergreen数据集，从数据准备、预处理、模型训练、模型评估到参数调优，展示了完整的流程。最终，选定最佳参数并分析模型是否存在过拟合，结果显示模型预测性能良好。

本文深入探讨了Spark MLlib中的两种重要分类算法——线性支持向量机(SVM)和逻辑回归。通过实例演示了如何使用Spark MLlib进行模型训练、评估和保存。讲解了支持向量机寻找分类边界的特点，以及逻辑回归在概率模型分类中的应用。同时，提供了详细的代码示例，帮助读者理解并实施这两种算法。

这篇博客通过实例展示了如何在Spark MLlib中应用逻辑回归进行机器学习。数据集涉及肾细胞癌转移情况，包括年龄、VEGF表达等级、MVC、组织学分级和分期等特征。博主提供了使用SGD梯度下降法和LBFGS算法实现逻辑回归的代码示例。

这篇博客介绍了Spark MLlib中逻辑回归的使用，包括数据处理、SGD与LBFGS两种算法的实践，以及如何进行模型训练和预测。通过一个交通事故统计案例，展示了如何将数据转化为LabeledPoint并利用LogisticRegressionWithSGD和LogisticRegressionWithLBFGS进行模型训练，最终得出LBFGS在该问题上表现更优的结论。

1,274

社区成员

1,171

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章