oracle的数据挖掘中的聚类

ALVANAN 2014-07-18 10:25:37
最近在看oracle data mining,试着进行了下聚类(clustering),使用的o-cluster算法,要进行聚类的数据表有三千万行记录,在进行聚类的时候,临时表空间增长的很快,中途提示temp不能扩展(聚类之前已经扩展了temp的数据文件),查询的时候发现temp表空间的数据文件有90G左右,聚类还没有完成。我想问下,temp表空间怎么增长这么快,这个问题怎么解决,或者是要进行聚类之前多增加些temp的数据文件吗?但当数据量很大时怎么办?
...全文
289 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
小灰狼W 2014-07-18
  • 打赏
  • 举报
回复
对o-cluster算法不了解,但是看起来应该是聚类操作使得大量数据在临时表空间中进行排序,造成数据文件暴涨。解决的方法,1是尽可能删除垃圾数据,降低数据量,2是了解该算法的工作机制,可能的话,使用适当的索引来缓解临时表空间压力,提高聚类操作的效率。以上方法如果不行,大概就只能准备足够大的临时表空间,待数据万挖掘完成以后,重建临时表空间来回收磁盘空间

17,086

社区成员

发帖
与我相关
我的任务
社区描述
Oracle开发相关技术讨论
社区管理员
  • 开发
  • Lucifer三思而后行
  • 卖水果的net
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧