社区
下载资源悬赏专区
帖子详情
数据挖掘中决策树算法JAVA编程的代码(J48)下载
weixin_39821526
2019-10-19 08:30:18
代码是数据挖掘技术中使用的,用Java编写。实际上就是数据挖掘技术中决策树的C45算法。
相关下载链接:
//download.csdn.net/download/dear_red9/1316164?utm_source=bbsseo
...全文
33
回复
打赏
收藏
数据挖掘中决策树算法JAVA编程的代码(J48)下载
代码是数据挖掘技术中使用的,用Java编写。实际上就是数据挖掘技术中决策树的C45算法。 相关下载链接://download.csdn.net/download/dear_red9/1316164?utm_source=bbsseo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
数据挖掘
中
决策树
算法
JAVA
编程
的
代码
(
J48
)
代码
是
数据挖掘
技术
中
使用的,用
Java
编写。实际上就是
数据挖掘
技术
中
决策树
的C45
算法
。
数据挖掘
18大
算法
实现以及其他相关经典DM
算法
数据挖掘
算法
算法
目录 18大DM
算法
包名 目录名
算法
名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘
算法
AssociationAnalysis DataMining_FPTree FPTree-频繁模式树
算法
BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升
算法
Classification DataMining_CART CART-分类回归树
算法
Classification DataMining_ID3 ID3-
决策树
分类
算法
Classification DataMining_KNN KNN-k最近邻
算法
工具类 Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯
算法
Clustering DataMining_BIRCH BIRCH-层次聚类
算法
Clustering DataMining_KMeans KMeans-K均值
算法
GraphMining DataMining_GSpan GSpan-频繁子图挖掘
算法
IntegratedMining DataMining_CBA CBA-基于关联规则的分类
算法
LinkMining DataMining_HITS HITS-链接分析
算法
LinkMining DataMining_PageRank PageRank-网页重要性/排名
算法
RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简
算法
SequentialPatterns DataMining_GSP GSP-序列模式分析
算法
SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析
算法
StatisticalLearning DataMining_EM EM-期望最大化
算法
StatisticalLearning DataMining_SVM SVM-支持向量机
算法
其他经典DM
算法
包名 目录名
算法
名 Others DataMining_ACO ACO-蚁群
算法
Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络
算法
Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类
算法
Others DataMining_Chameleon Chameleon-两阶段合并聚类
算法
Others DataMining_DBSCAN DBSCAN-基于密度的聚类
算法
Others DataMining_GA GA-遗传
算法
Others DataMining_GA_Maze GA_Maze-遗传
算法
在走迷宫游戏
中
的应用
算法
Others DataMining_KDTree KDTree-k维空间关键数据检索
算法
工具类 Others DataMining_MSApriori MSApriori-基于多支持度的Apriori
算法
Others DataMining_RandomForest RandomForest-随机森林
算法
Others DataMining_TAN TAN-树型朴素贝叶斯
算法
Others DataMining_Viterbi Viterbi-维特比
算法
18大经典DM
算法
18大
数据挖掘
的经典
算法
以及
代码
实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应
算法
的博文链接,希望能够帮助大家学。 目前追加了其他的一些经典的DM
算法
,在others的包
中
涉及聚类,分类,图
算法
,搜索算等等,没有具体分类。 C4.5 C4.5
算法
与ID3
算法
一样,都是数学分类
算法
,C4.5
算法
是ID3
算法
的一个改进。ID3
算法
采用信息增益进行决策判断,而C4.5采用的是增益率。详细介绍链接 CART CART
算法
的全称是分类回归树
算法
,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成
决策树
后之后还要进行剪枝,我自己在实现整个
算法
的时候采用的是代价复杂度
算法
,详细介绍链接 KNN K最近邻
算法
。给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。近的点的权重大点,远的点自然就小点。详细介绍链接 Naive Bayes 朴素贝叶斯
算法
。朴素贝叶斯
算法
是贝叶斯
算法
里面一种比较简单的分类
算法
,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导。详细介绍链接 SVM 支持向量机
算法
。支持向量机
算法
是一种对线性和非线性数据进行分类的方法,非线性数据进行分类的时候可以通过核函数转为线性的情况再处理。其
中
的一个关键的步骤是搜索最大边缘超平面。详细介绍链接 EM 期望最大化
算法
。期望最大化
算法
,可以拆分为2个
算法
,1个E-Step期望化步骤,和1个M-Step最大化步骤。他是一种
算法
框架,在每次计算结果之后,逼近统计模型参数的最大似然或最大后验估计。详细介绍链接 Apriori Apriori
算法
是关联规则挖掘
算法
,通过连接和剪枝运算挖掘出频繁项集,然后根据频繁项集得到关联规则,关联规则的导出需要满足最小置信度的要求。详细介绍链接 FP-Tree 频繁模式树
算法
。这个
算法
也有被称为FP-growth
算法
,这个
算法
克服了Apriori
算法
的产生过多侯选集的缺点,通过递归的产生频度模式树,然后对树进行挖掘,后面的过程与Apriori
算法
一致。详细介绍链接 PageRank 网页重要性/排名
算法
。PageRank
算法
最早产生于Google,核心思想是通过网页的入链数作为一个网页好快的判定标准,如果1个网页内部包含了多个指向外部的链接,则PR值将会被均分,PageRank
算法
也会遭到LinkSpan攻击。详细介绍链接 HITS HITS
算法
是另外一个链接
算法
,部分原理与PageRank
算法
是比较相似的,HITS
算法
引入了权威值和
中
心值的概念,HITS
算法
是受用户查询条件影响的,他一般用于小规模的数据链接分析,也更容易遭受到攻击。详细介绍链接 K-Means K-Means
算法
是聚类
算法
,k在在这里指的是分类的类型数,所以在开始设定的时候非常关键,
算法
的原理是首先假定k个分类点,然后根据欧式距离计算分类,然后去同分类的均值作为新的聚簇
中
心,循环操作直到收敛。详细介绍链接 BIRCH BIRCH
算法
利用构建CF聚类特征树作为
算法
的核心,通过树的形式,BIRCH
算法
扫描数据库,在内存
中
建立一棵初始的CF-树,可以看做数据的多层压缩。详细介绍链接 AdaBoost AdaBoost
算法
是一种提升
算法
,通过对数据的多次训练得到多个互补的分类器,然后组合多个分类器,构成一个更加准确的分类器。详细介绍链接 GSP GSP
算法
是序列模式挖掘
算法
。GSP
算法
也是Apriori类
算法
,在
算法
的过程
中
也会进行连接和剪枝操作,不过在剪枝判断的时候还加上了一些时间上的约束等条件。详细介绍链接 PreFixSpan PreFixSpan
算法
是另一个序列模式挖掘
算法
,在
算法
的过程
中
不会产生候选集,给定初始前缀模式,不断的通过后缀模式
中
的元素转到前缀模式
中
,而不断的递归挖掘下去。详细介绍链接 CBA 基于关联规则分类
算法
。CBA
算法
是一种集成挖掘
算法
,因为他是建立在关联规则挖掘
算法
之上的,在已有的关联规则理论前提下,做分类判断,只是在
算法
的开始时对数据做处理,变成类似于事务的形式。详细介绍链接 RoughSets 粗糙集
算法
。粗糙集理论是一个比较新颖的
数据挖掘
思想。这里使用的是用粗糙集进行属性约简的
算法
,通过上下近似集的判断删除无效的属性,进行规制的输出。详细介绍链接 GSpan gSpan
算法
属于图挖掘
算法
领域。,主要用于频繁子图的挖掘,相较于其他的图
算法
,子图挖掘
算法
是他们的一个前提或基础
算法
。gSpan
算法
用到了DFS编码,和Edge五元组,最右路径子图扩展等概念,
算法
比较的抽象和复杂。详细介绍链接 Others目录下的
算法
: GA 遗传
算法
。遗传
算法
运用了生物进化理论的知识来寻找问题最优解的
算法
,
算法
的遗传进化过程分选择,交叉和变异操作,其
中
选择操是非常关键的步骤,把更适应的基于组遗传给下一代。详细介绍链接 DbScan 基于空间密度聚类
算法
。dbScan作为一种特殊聚类
算法
,弥补了其他
算法
的一些不足,基于空间密,实现聚类效果,可以发现任意形状的聚簇。详细介绍链接 GA_Maze 遗传
算法
在走迷宫游戏
中
的应用。将走迷宫
中
的搜索出口路径的问题转化为遗传
算法
中
的问题通过构造针对此特定问题的适值函数,基因移动方向的定位,巧的进行问题的求解。详细介绍链接 CABDDCC 基于连通图的分裂聚类
算法
。也是属于层次聚类
算法
主要分为2个阶段,第一阶段构造连通图。第二个阶段是分裂连通图,最终形成聚类结果。详细介绍链接 Chameleon 两阶段聚类
算法
。与CABDDCC
算法
相反,最后是通过对小簇集合的合并,形成最终的结果,在第一阶段主要是通过K近邻的思想形成小规模的连通图,第二阶段通过RI(相对互连性)和RC(相对近似性)来选一个最佳的簇进行合并。详细介绍链接 RandomForest 随机森林
算法
。
算法
思想是
决策树
+boosting.
决策树
采用的是CART分类回归数,通过组合各个
决策树
的弱分类器,构成一个最终的强分类器,在构造
决策树
的时候采取随机数量的样本数和随机的部分属性进行子
决策树
的构建,避免了过分拟合的现象发生。详细介绍链接 KDTree K-Dimension Tree。多维空间划分树,数据在多维空间进行划分与查找。主要用于关键信息的搜索,类似于在空间
中
的二分搜索,大大提高了搜索效率,在寻找目标元素时,使用了DFS深度优先的方式和回溯进行最近点的寻找。详细介绍链接 MS-Apriori 基于多支持度的Apriori
算法
。是Apriori
算法
的升级
算法
,弥补了原先Apriori
算法
的不足,还增加了支持度差别限制以及支持度计数统计方面的优化,无须再次重新扫描整个数据集,产生关联规则的时候可以根据子集的关系避免一些置信度的计算。详细介绍链接 ACO 蚁群
算法
。蚁群
算法
又称为蚂蚁
算法
。同GA遗传
算法
类似,也是运用了大自然规律的
算法
,用于在图
中
寻找最优路径的概率型
算法
。灵感来源于蚂蚁在寻找食物时会散播信息素的发现路径行为。详细介绍链接 BayesNetwork 贝叶斯网络
算法
。弥补了朴素贝叶斯
算法
中
必须要事件独立性的缺点,利用了贝叶斯网络的DAG有向无环图,允许各个事件保留一定的依赖关系,网络结构
中
的每个节点代表一种属性,边代表相应的条件概率值,通过计算从而能得到精准的分类效果。详细介绍链接 TAN 树型朴素贝叶斯
算法
。此
算法
又被称为加强版朴素贝叶斯
算法
。在满足原有朴素贝叶斯条件的基础上,他允许部条件属性直接的关联性。形成树型的结构。详细介绍链接 Viterbi 维特比
算法
。给定一个隐马尔科夫模型以及一个观察序列,求出潜在的状态序列信息,每个潜在状态信息又会受到前一个状态信息的影响。
算法
使用方法 在每个
算法
中
给出了3大类型,主
算法
程序,调用程序,输入数据,调用方法如下: 将需要数据的测试数据转化成与给定的输入格式相同 然后以Client类的测试程序调用方式进行使用。 也可以自行修改
算法
程序,来适用于自己的使用场景
使用
决策树
算法
对测试数据进行分类实战
决策树
算法
实战视频教学课程,案例与
代码
相结合,内容涉及1、
决策树
算法
精讲2、
决策树
算法
的Python实现3、对测试数据进行分类思路4、项目实战:使用
决策树
算法
对测试数据进行分类实战。Python 在机器学习领域应用是非常广泛的,比如,我们可以使用机器学习进行验证码识别,使用机器学习实现计算机视觉项目,或者,我们也可以使用机器学习技术实现网页分类、文本挖掘、情感分析等等各种各样的事情。机器学习的重点在于
算法
,而
算法
的学习相对来说是比较枯燥的,所以,只有在学习的时候让
算法
跟实例结合,才能够让
算法
的学习变得不枯燥,并且也才能够更好的将理论运用与实践。
ID3
决策树
算法
,资源描述本程序采用的是
java
编程
实现,用来解决分类问题
ID3
决策树
算法
,资源描述本程序采用的是
java
编程
实现,用来解决分类问题,使用的
算法
是
数据挖掘
中
的ID3
算法
。该
算法
能够解决一些简单的分类问题,简单易懂,思路比较清晰。.zip
用
决策树
归纳分类
算法
用训练集生成
决策树
然后预测新的数据的分类 属性选择度量使用的是信息增益的选择度量
下载资源悬赏专区
12,891
社区成员
12,444,194
社区内容
发帖
与我相关
我的任务
下载资源悬赏专区
CSDN 下载资源悬赏专区
复制链接
扫一扫
分享
社区描述
CSDN 下载资源悬赏专区
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章