千万级数据入库问题求解决

雨中的看客 2015-12-29 05:51:34
现每个月有一张EXCEL表,数据量大约在800W行左右,需要按分公司每月导入数据库(有6家分公司,数据加在一起需要导入的有5000万条)。其中还有各种逻辑,需要按记录中的某字段取出比例信息进行计算,计算结果与原表中数据进行对比,如果大于原来的值不更新。。。等等等等。。。。

求高效方法、工具或者思路
...全文
745 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
  • 打赏
  • 举报
回复
引用 3 楼 qeppykqsn 的回复:
[quote=引用 1 楼 sinat_27650399 的回复:] 建议你先看看800W行的数据EXCEL放不放得进去?EXCEL放进去了,什么样的机器能打开这个EXCEL 或许是放在EXCEL本身就是不合理的,是否考虑使用CSV文件存储,然后通过读CSV文件的方式分批LOAD处理呢?这样处理起来就轻松很多了
不好意思,我这边描述有问题,我首先是通过CSV分批导入价格表(Price),然后Price表有800W条记录,现在要用这Price表的数据关联机构表(dept)、品牌表(brand)、品牌价格比例表(BrandRatio,该表中存在三个价格比例)得出三个新的价格与存放有5000万条记录的newPrice表进行关联,从而修改表newPrice中的价格(关联字段有多个 机构编码、产品编码、产品名称、品牌ID)。请问这个怎么分批执行呢?[/quote] 怎么分批要看你具体的业务,根据你的表述,是不是从800W的数据获取,进行逻辑运算,然后保存到newPrice里? 产品表有多少个产品呢?分批处理的方式是,假设你有100W的产品,每次分页取200个产品,进行逻辑运算然后入库,也就是写入1000次数据库,每次批量提交,这样你所谓的大数据一个小时之内肯定是可以处理完的
雨中的看客 2015-12-30
  • 打赏
  • 举报
回复
引用 2 楼 sinat_27650399 的回复:
[quote=引用 1 楼 sinat_27650399 的回复:] 建议你先看看800W行的数据EXCEL放不放得进去?EXCEL放进去了,什么样的机器能打开这个EXCEL 或许是放在EXCEL本身就是不合理的,是否考虑使用CSV文件存储,然后通过读CSV文件的方式分批LOAD处理呢?这样处理起来就轻松很多了
分批读CSV比分批读EXCEL要简单很多[/quote] 不好意思,我这边描述有问题,我首先是通过CSV分批导入价格表(Price),然后Price表有800W条记录,现在要用这Price表的数据关联机构表(dept)、品牌表(brand)、品牌价格比例表(BrandRatio,该表中存在三个价格比例)得出三个新的价格与存放有5000万条记录的newPrice表进行关联,从而修改表newPrice中的价格(关联字段有多个 机构编码、产品编码、产品名称、品牌ID)。请问这个怎么分批执行呢?
雨中的看客 2015-12-30
  • 打赏
  • 举报
回复
引用 1 楼 sinat_27650399 的回复:
建议你先看看800W行的数据EXCEL放不放得进去?EXCEL放进去了,什么样的机器能打开这个EXCEL 或许是放在EXCEL本身就是不合理的,是否考虑使用CSV文件存储,然后通过读CSV文件的方式分批LOAD处理呢?这样处理起来就轻松很多了
不好意思,我这边描述有问题,我首先是通过CSV分批导入价格表(Price),然后Price表有800W条记录,现在要用这Price表的数据关联机构表(dept)、品牌表(brand)、品牌价格比例表(BrandRatio,该表中存在三个价格比例)得出三个新的价格与存放有5000万条记录的newPrice表进行关联,从而修改表newPrice中的价格(关联字段有多个 机构编码、产品编码、产品名称、品牌ID)。请问这个怎么分批执行呢?
  • 打赏
  • 举报
回复
建议你先看看800W行的数据EXCEL放不放得进去?EXCEL放进去了,什么样的机器能打开这个EXCEL 或许是放在EXCEL本身就是不合理的,是否考虑使用CSV文件存储,然后通过读CSV文件的方式分批LOAD处理呢?这样处理起来就轻松很多了
  • 打赏
  • 举报
回复
引用 1 楼 sinat_27650399 的回复:
建议你先看看800W行的数据EXCEL放不放得进去?EXCEL放进去了,什么样的机器能打开这个EXCEL 或许是放在EXCEL本身就是不合理的,是否考虑使用CSV文件存储,然后通过读CSV文件的方式分批LOAD处理呢?这样处理起来就轻松很多了
分批读CSV比分批读EXCEL要简单很多
圣者文章管理系统SWCms 是一个基于PHP Mysql架构的网站内容管理系统,同时也是一个开放的PHP开发平台。SWCms 采用模块化方式开发,功能强大灵活易于扩展,并且完全开放源代码,面向大中型站点提供重量级网站建设解决方案。2年来,凭借 SWCms 团队长期积累的丰富的Web开发及数据库经验和勇于创新追完美的设计理念,使得 SWCcms 得到了很多大中小型网站站长的认可,并且越来越多地被应用到大中型商业网站。 圣者文章管理系统SWCms 主要特性: 1.模块化,开源,可扩展 采用模块化方式开发,提供统一的模块开发接口和底层平台支持,并且完全开源,便于二次开发。 2.负载能力强,支持千万级数据 从缓存技术、数据库设计、代码优化等多个角度入手进行优化,内容可文本存储,让信息和会员数据量支持达到了千万级。 3.前台模板风格方便制作和使用 4.支持生成Html和PHP动态访问,也支持仿静态模式访问 5.后台支持数据库优化和数据库备份和导入,方便把网站做大 6.后台带强大文章在线采集系统,并支持资源本地化 7.后台带在线入库程式,完美地和圣者旗下所有采集器产品结合,瞬息间做大网站 8.后台采集器可以导入和导出,方便用户之间交流采集经验和分享采集规则 9.功能函数和风格标签使用简单,用户可随模板随意调用,方便把网站制作成BLOG、BBS、CMS

25,985

社区成员

发帖
与我相关
我的任务
社区描述
高性能WEB开发
社区管理员
  • 高性能WEB开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧