社区
数据库相关
帖子详情
数据挖掘中gsp算法实现
fx050622
2009-05-26 10:28:06
最近要做个gsp相关的东西。但算法太难看懂,不知哪位大哥能给个用C++/C#实现的程序。
...全文
170
2
打赏
收藏
数据挖掘中gsp算法实现
最近要做个gsp相关的东西。但算法太难看懂,不知哪位大哥能给个用C++/C#实现的程序。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
2 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
WorldMobile
2009-05-26
打赏
举报
回复
我觉得你应该发到C++或者C#论坛里更好一些
eviler
2009-05-26
打赏
举报
回复
呵呵 ,这个是真的 ,这边会c++ 的不多
数据挖掘
之序列模式挖掘之
GSP
算法
本
算法
为
数据挖掘
中
序列模式挖掘
中
的
GSP
算法
的基本
实现
,可依托此
算法
进行
算法
的优化操作。
Python
中
的
GSP
(广义序列模式)
算法
_python_代码_下载
python
数据挖掘
模式识别
数据挖掘
算法
普惠制 用法 配置和运行示例位于测试文件夹
gsp
py 文件夹
中
。 要在项目
中
使用它,请将其导入并使用
GSP
类。
Grails实战教程-整合版
现如今,基于Java的网站开发明显过于复杂,远超实际工作需要。在Java领域
中
,大部分的网站开发框架也没有严格的遵循“可重用”原则。动态框架如Rails,Django和TurboGears等的出现,为Java网站开发提供了新思路,Grails就是基于这种新思路构建而成的。Grails大大降低了Java领域
中
网站开发的复杂度,它建立在已有技术如Spring和Hibernate之上。简单理解,Grails是一个框架,特点是整合先进技术,本质是专注抱大腿。哈哈,开个小玩笑,Grails可不是只有那么简单。Grails通过其核心技术及扩展插件使网站开发
中
的很多难题都得以解决,如果非要列一个清单的话,主要应包括:一个基于Hibernate且易于使用的对象关系映射(ORM)层一个被称作
GSP
的页面展示技术一个基于Spring MVC的控制器层一个基于Gradle的交互式命令行环境一个内嵌的且已配置为热部署的Tomcat服务器Spring的依赖注入技术使用Spring的MessageSource
实现
国际化(i18n)一个基于Spring事务抽象的事务层借助功能强大的Groovy编程语言,外加领域专用语言(DSLs)的广泛运用,你会惊喜的发现,做网站竟然也能如此简单。
数据挖掘
18大
算法
实现
以及其他相关经典DM
算法
数据挖掘
算法
算法
目录 18大DM
算法
包名 目录名
算法
名 AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘
算法
AssociationAnalysis DataMining_FPTree FPTree-频繁模式树
算法
BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升
算法
Classification DataMining_CART CART-分类回归树
算法
Classification DataMining_ID3 ID3-决策树分类
算法
Classification DataMining_KNN KNN-k最近邻
算法
工具类 Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯
算法
Clustering DataMining_BIRCH BIRCH-层次聚类
算法
Clustering DataMining_KMeans KMeans-K均值
算法
GraphMining DataMining_
GSp
an
GSp
an-频繁子图挖掘
算法
IntegratedMining DataMining_CBA CBA-基于关联规则的分类
算法
LinkMining DataMining_HITS HITS-链接分析
算法
LinkMining DataMining_PageRank PageRank-网页重要性/排名
算法
RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简
算法
SequentialPatterns DataMining_
GSP
GSP
-序列模式分析
算法
SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析
算法
StatisticalLearning DataMining_EM EM-期望最大化
算法
StatisticalLearning DataMining_SVM SVM-支持向量机
算法
其他经典DM
算法
包名 目录名
算法
名 Others DataMining_ACO ACO-蚁群
算法
Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络
算法
Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类
算法
Others DataMining_Chameleon Chameleon-两阶段合并聚类
算法
Others DataMining_DBSCAN DBSCAN-基于密度的聚类
算法
Others DataMining_GA GA-遗传
算法
Others DataMining_GA_Maze GA_Maze-遗传
算法
在走迷宫游戏
中
的应用
算法
Others DataMining_KDTree KDTree-k维空间关键数据检索
算法
工具类 Others DataMining_MSApriori MSApriori-基于多支持度的Apriori
算法
Others DataMining_RandomForest RandomForest-随机森林
算法
Others DataMining_TAN TAN-树型朴素贝叶斯
算法
Others DataMining_Viterbi Viterbi-维特比
算法
18大经典DM
算法
18大
数据挖掘
的经典
算法
以及代码
实现
,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应
算法
的博文链接,希望能够帮助大家学。 目前追加了其他的一些经典的DM
算法
,在others的包
中
涉及聚类,分类,图
算法
,搜索算等等,没有具体分类。 C4.5 C4.5
算法
与ID3
算法
一样,都是数学分类
算法
,C4.5
算法
是ID3
算法
的一个改进。ID3
算法
采用信息增益进行决策判断,而C4.5采用的是增益率。详细介绍链接 CART CART
算法
的全称是分类回归树
算法
,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成决策树后之后还要进行剪枝,我自己在
实现
整个
算法
的时候采用的是代价复杂度
算法
,详细介绍链接 KNN K最近邻
算法
。给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。近的点的权重大点,远的点自然就小点。详细介绍链接 Naive Bayes 朴素贝叶斯
算法
。朴素贝叶斯
算法
是贝叶斯
算法
里面一种比较简单的分类
算法
,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导。详细介绍链接 SVM 支持向量机
算法
。支持向量机
算法
是一种对线性和非线性数据进行分类的方法,非线性数据进行分类的时候可以通过核函数转为线性的情况再处理。其
中
的一个关键的步骤是搜索最大边缘超平面。详细介绍链接 EM 期望最大化
算法
。期望最大化
算法
,可以拆分为2个
算法
,1个E-Step期望化步骤,和1个M-Step最大化步骤。他是一种
算法
框架,在每次计算结果之后,逼近统计模型参数的最大似然或最大后验估计。详细介绍链接 Apriori Apriori
算法
是关联规则挖掘
算法
,通过连接和剪枝运算挖掘出频繁项集,然后根据频繁项集得到关联规则,关联规则的导出需要满足最小置信度的要求。详细介绍链接 FP-Tree 频繁模式树
算法
。这个
算法
也有被称为FP-growth
算法
,这个
算法
克服了Apriori
算法
的产生过多侯选集的缺点,通过递归的产生频度模式树,然后对树进行挖掘,后面的过程与Apriori
算法
一致。详细介绍链接 PageRank 网页重要性/排名
算法
。PageRank
算法
最早产生于Google,核心思想是通过网页的入链数作为一个网页好快的判定标准,如果1个网页内部包含了多个指向外部的链接,则PR值将会被均分,PageRank
算法
也会遭到LinkSpan攻击。详细介绍链接 HITS HITS
算法
是另外一个链接
算法
,部分原理与PageRank
算法
是比较相似的,HITS
算法
引入了权威值和
中
心值的概念,HITS
算法
是受用户查询条件影响的,他一般用于小规模的数据链接分析,也更容易遭受到攻击。详细介绍链接 K-Means K-Means
算法
是聚类
算法
,k在在这里指的是分类的类型数,所以在开始设定的时候非常关键,
算法
的原理是首先假定k个分类点,然后根据欧式距离计算分类,然后去同分类的均值作为新的聚簇
中
心,循环操作直到收敛。详细介绍链接 BIRCH BIRCH
算法
利用构建CF聚类特征树作为
算法
的核心,通过树的形式,BIRCH
算法
扫描数据库,在内存
中
建立一棵初始的CF-树,可以看做数据的多层压缩。详细介绍链接 AdaBoost AdaBoost
算法
是一种提升
算法
,通过对数据的多次训练得到多个互补的分类器,然后组合多个分类器,构成一个更加准确的分类器。详细介绍链接
GSP
GSP
算法
是序列模式挖掘
算法
。
GSP
算法
也是Apriori类
算法
,在
算法
的过程
中
也会进行连接和剪枝操作,不过在剪枝判断的时候还加上了一些时间上的约束等条件。详细介绍链接 PreFixSpan PreFixSpan
算法
是另一个序列模式挖掘
算法
,在
算法
的过程
中
不会产生候选集,给定初始前缀模式,不断的通过后缀模式
中
的元素转到前缀模式
中
,而不断的递归挖掘下去。详细介绍链接 CBA 基于关联规则分类
算法
。CBA
算法
是一种集成挖掘
算法
,因为他是建立在关联规则挖掘
算法
之上的,在已有的关联规则理论前提下,做分类判断,只是在
算法
的开始时对数据做处理,变成类似于事务的形式。详细介绍链接 RoughSets 粗糙集
算法
。粗糙集理论是一个比较新颖的
数据挖掘
思想。这里使用的是用粗糙集进行属性约简的
算法
,通过上下近似集的判断删除无效的属性,进行规制的输出。详细介绍链接
GSp
an
gSp
an
算法
属于图挖掘
算法
领域。,主要用于频繁子图的挖掘,相较于其他的图
算法
,子图挖掘
算法
是他们的一个前提或基础
算法
。
gSp
an
算法
用到了DFS编码,和Edge五元组,最右路径子图扩展等概念,
算法
比较的抽象和复杂。详细介绍链接 Others目录下的
算法
: GA 遗传
算法
。遗传
算法
运用了生物进化理论的知识来寻找问题最优解的
算法
,
算法
的遗传进化过程分选择,交叉和变异操作,其
中
选择操是非常关键的步骤,把更适应的基于组遗传给下一代。详细介绍链接 DbScan 基于空间密度聚类
算法
。dbScan作为一种特殊聚类
算法
,弥补了其他
算法
的一些不足,基于空间密,
实现
聚类效果,可以发现任意形状的聚簇。详细介绍链接 GA_Maze 遗传
算法
在走迷宫游戏
中
的应用。将走迷宫
中
的搜索出口路径的问题转化为遗传
算法
中
的问题通过构造针对此特定问题的适值函数,基因移动方向的定位,巧的进行问题的求解。详细介绍链接 CABDDCC 基于连通图的分裂聚类
算法
。也是属于层次聚类
算法
主要分为2个阶段,第一阶段构造连通图。第二个阶段是分裂连通图,最终形成聚类结果。详细介绍链接 Chameleon 两阶段聚类
算法
。与CABDDCC
算法
相反,最后是通过对小簇集合的合并,形成最终的结果,在第一阶段主要是通过K近邻的思想形成小规模的连通图,第二阶段通过RI(相对互连性)和RC(相对近似性)来选一个最佳的簇进行合并。详细介绍链接 RandomForest 随机森林
算法
。
算法
思想是决策树+boosting.决策树采用的是CART分类回归数,通过组合各个决策树的弱分类器,构成一个最终的强分类器,在构造决策树的时候采取随机数量的样本数和随机的部分属性进行子决策树的构建,避免了过分拟合的现象发生。详细介绍链接 KDTree K-Dimension Tree。多维空间划分树,数据在多维空间进行划分与查找。主要用于关键信息的搜索,类似于在空间
中
的二分搜索,大大提高了搜索效率,在寻找目标元素时,使用了DFS深度优先的方式和回溯进行最近点的寻找。详细介绍链接 MS-Apriori 基于多支持度的Apriori
算法
。是Apriori
算法
的升级
算法
,弥补了原先Apriori
算法
的不足,还增加了支持度差别限制以及支持度计数统计方面的优化,无须再次重新扫描整个数据集,产生关联规则的时候可以根据子集的关系避免一些置信度的计算。详细介绍链接 ACO 蚁群
算法
。蚁群
算法
又称为蚂蚁
算法
。同GA遗传
算法
类似,也是运用了大自然规律的
算法
,用于在图
中
寻找最优路径的概率型
算法
。灵感来源于蚂蚁在寻找食物时会散播信息素的发现路径行为。详细介绍链接 BayesNetwork 贝叶斯网络
算法
。弥补了朴素贝叶斯
算法
中
必须要事件独立性的缺点,利用了贝叶斯网络的DAG有向无环图,允许各个事件保留一定的依赖关系,网络结构
中
的每个节点代表一种属性,边代表相应的条件概率值,通过计算从而能得到精准的分类效果。详细介绍链接 TAN 树型朴素贝叶斯
算法
。此
算法
又被称为加强版朴素贝叶斯
算法
。在满足原有朴素贝叶斯条件的基础上,他允许部条件属性直接的关联性。形成树型的结构。详细介绍链接 Viterbi 维特比
算法
。给定一个隐马尔科夫模型以及一个观察序列,求出潜在的状态序列信息,每个潜在状态信息又会受到前一个状态信息的影响。
算法
使用方法 在每个
算法
中
给出了3大类型,主
算法
程序,调用程序,输入数据,调用方法如下: 将需要数据的测试数据转化成与给定的输入格式相同 然后以Client类的测试程序调用方式进行使用。 也可以自行修改
算法
程序,来适用于自己的使用场景
GSP
.rar_
GSP
_
Gsp
-Algorithm_
gsp
算法
_prefixspan_
数据挖掘
GSP
数据挖掘
中
的重要
算法
,大家可以根据自己的需要更改参数,连接自己的数据使用
数据库相关
752
社区成员
12,763
社区内容
发帖
与我相关
我的任务
数据库相关
PowerBuilder 数据库相关
复制链接
扫一扫
分享
社区描述
PowerBuilder 数据库相关
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章