Mysql大数据的处理，求大神指导

浪中云 2014-03-04 10:48:24

小弟要从1.4G的文件中提取大约2000W条数据（不一样）
1.现在如果每次提取数据插入数据库的话，要现在数据库中判断数据是否存在在决定是否插入，这样的话，时间非常的慢！
2. 如果我把每条数据的放在hash表中，每次插入的过程，在hash表中进行查找，但是这样比较吃内存，我程序跑了7个小时之后就outofmemory了。

现在小弟不知道咋弄了，在想数据库怎么优化，求大神指导！

...全文

366 7 打赏收藏转发到动态举报

写回复

7 条回复

切换为时间正序

请发表友善的回复…

发表回复

浪中云 2014-03-22

打赏
举报

回复

已解决，把mysql的数据引擎换了，谢谢各位

代码誊写工 2014-03-07

打赏
举报

回复

内存不够那就把hash表建立在数据库的文件系统引擎上。虽然慢一点儿，但比程序崩溃了强。 PS：你的hash表是指你在程序里的hashtable，还是指memroy engine的hash索引？

浪中云 2014-03-05

打赏
举报

回复

引用 1 楼 rucypli 的回复:

用ignore intert into

我刚才试了一下，如果用ignore insert into插入一条数据的话，非常的慢，如果用ignore insert into批处理插入1000条数据的话，会报错（主键唯一，但是插入了重复的数据项）。那现在该怎么处理呢？

浪中云 2014-03-05

打赏
举报

回复

求指导啊，求交流啊！

rucypli 2014-03-05

打赏
举报

回复

用ignore intert into

haha_321 2014-03-05

打赏
举报

回复

建议把数据的引擎设置成MyISAM

浪中云 2014-03-05

打赏
举报

回复

求指导啊！！！

本课程主要是通过对主流数据库oracle11的大数据的处理讲解，包括数据的清洗，数据的整合，数据的导入导出，大数据的建表方式，数据挖掘工程师的工作流程，以及银行项目案例讲解，来使学员成为一名优秀的数据库工程师...

我在Mysql数据库中建了张表，数据量很大，一删除电脑就卡，就显示未响应，求大神指导不要用delete,可以尝试用下列办法 droptabletblname;--彻底删除该表 truncatetabletblname;--快速删除数据，但是保存数据结构更...

在大学里，千万不要老师教什么，你就只学什么，这是远远不够的，对于我们大数据专业，甚至整个计算机专业的同学来说，大学四年最重要的能力就是自学。大学的课程不像高中那么紧，留给我们自学的时间还是比较多的，...

问：哦，你是传统行业的吧，我是搞大数据的。答：…… 发个牢骚，搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司，都需要对数据仓库有一定的重视，而不是谈一句自己是搞大数据的就很厉害...

未来，实时流计算技术必然会成为大数据的主流模式，数据不仅以 “流” 的方式被处理，还以 “流” 的方式被存储。希望这个课，给你切实的帮助。 01-实时流计算的通用架构为什么把本课时作为第一课时呢？因为通过本...

56,677

社区成员

56,708

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章