oracle的数据挖掘中的聚类

ALVANAN 2014-07-18 10:25:37

最近在看oracle data mining，试着进行了下聚类（clustering），使用的o-cluster算法，要进行聚类的数据表有三千万行记录，在进行聚类的时候，临时表空间增长的很快，中途提示temp不能扩展（聚类之前已经扩展了temp的数据文件），查询的时候发现temp表空间的数据文件有90G左右，聚类还没有完成。我想问下，temp表空间怎么增长这么快，这个问题怎么解决，或者是要进行聚类之前多增加些temp的数据文件吗？但当数据量很大时怎么办？

...全文

289 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

小灰狼W 2014-07-18

打赏
举报

回复

对o-cluster算法不了解，但是看起来应该是聚类操作使得大量数据在临时表空间中进行排序，造成数据文件暴涨。解决的方法，1是尽可能删除垃圾数据，降低数据量，2是了解该算法的工作机制，可能的话，使用适当的索引来缓解临时表空间压力，提高聚类操作的效率。以上方法如果不行，大概就只能准备足够大的临时表空间，待数据万挖掘完成以后，重建临时表空间来回收磁盘空间

对于数据挖掘的初步入门，包含：数据挖掘初探，功能介绍，EXCEL基础，ORACLE数据库安装，数据预处理，预测算法-线性回归，决策树，关联算法-Apriori,聚类算法-kmeans, 最优化求解，SPSS Modeler探索与分析，回归分析...

Fox，GC确定性退火和强大的可扩展数据挖掘技术，用于数据泛滥。在第二届Petascal数据分析国际研讨会论文集：挑战与机遇中（西雅图，美国华盛顿，2011年）。 ACM。可在先决条件操作系统该程序经过了广泛的测试，...

OLAP和KDD又有很多不同的地方 数据挖掘与OLAP不同的地方是，数据挖掘不是用于验证某个假定的模式（模型）的正确性，而是在数据库中自己寻找模型。他在本质上是一个归纳的过程。比如，一个用数据挖掘工具的分析师...

Predictive Analytic Capabilities(预报性分析能力) 数据挖掘可以让分析员更好的理解数据，而预报性分析可以让分析员依据可视化分析和数据挖掘的结果做出一些预报性的推断。 4. Semantic Engines(语义引擎) 我们...

5、开展数据爬取、聚类分析舆情分析、鱼骨图分析、定价策略等领域数据挖掘工作; 任职资格： 1、本科以上学历(持有学士学位)(985，211优先)，计算机相关专业，五年工作经验; 2、二年以上数据挖掘项目经验，完整参与...

17,086

社区成员

55,238

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章