请教个数据入库的问题，数据量感觉有点大

色郎中 2017-04-12 10:43:55

写段代码，分析文件夹内的文本文件，每秒产生一个文件，每个文件大概500-1000条记录，简单分析一下，将每条记录存入数据库；
按最低记录数算 500条，一天下来也有5000-6000W条记录了：

处理过程：在一个线程里处理文本文件，分析文件后，将500条记录，一次性也在线程里插入数据库，程序跑一段时发现后，感觉本本抗不住，文件夹里很多文件来不及处理；
大概如下的样子；



 json= parsing_files(currentFileName)   //保存处理一个文本后的500条记录

db_handle.write_points( json)//调用库函数，写数据库

分别测试，只分析文件，并生成json（类似一个文件，即将文本文件分析过后的500条记录存一个json里），不做插入数据库操作，发现CPU, 内存，磁盘IO 都变化不大；
但是，调用库接口函数做入库操作，跑一段时间后，发现CPU，内存基本都给占用了

请教一下有啥的办法，分析文本和入库操作分开？处理的结果放队列，然后，开新线程做入库？或者其他

...全文

272 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

色郎中 2017-04-15

打赏
举报

回复

调整后，用个淘来的03年本本，1G 内存哈哈，跑都OK 哈哈

色郎中 2017-04-15

打赏
举报

回复

谢谢各位是数据库的问题，或者说自己对数据库特性不了解，经过再次确认，调整索引值大小后，表现比较平稳了，占用基本变化不大开源的数据库，，仔细看了官方文档，索引值的乘积大于一定数量，占用资源直线上升，最后数据库就挂了

wang_peng_yl 2017-04-13

打赏
举报

回复

按你现在说的，存储都是问题，就算分析插入都没问题，一个月下来多少亿数据啊。建议：分析那不要用转json了，为啥要转呢，数据库可不认识他，插入时还得对json处理。直接形成sql语句跳过转json，存储肯定要分库分表了，具体用什么框架，有很多，我就不推荐了容易误导。

xuggzu 2017-04-12

打赏
举报

回复

数据库操作涉及硬盘IO操作和线程同步问题，而且入库数据量大，更影响时间。建议：使用高速接口硬盘，比如固态甚至M.2固态硬盘，以尽量减小IO操作时间；编码方面尽量采用批量入库方式，减少同步处理和IO交互次数。

by_封爱版主 2017-04-12

打赏
举报

回复

读取解析插入都丢给线程池就行了吧?

stherix 2017-04-12

打赏
举报

回复

1秒钟添加1000条记录理论上应该是可以承受住的还是数据库接口有问题或者数据库本身性能不行吧

songbing774933 2017-04-12

打赏
举报

回复

你不是都测试出来了吗最根本的，还是应该解决入库接口的性能问题

Mooyi_水 2017-04-12

打赏
举报

回复

批量入库正解

引用 4 楼 xuggzu 的回复:

数据库操作涉及硬盘IO操作和线程同步问题，而且入库数据量大，更影响时间。建议：使用高速接口硬盘，比如固态甚至M.2固态硬盘，以尽量减小IO操作时间；编码方面尽量采用批量入库方式，减少同步处理和IO交互次数。

独立按时完成作业，如有不懂的问题可向知道老师及同学请教，不得抄袭别人作业。 4. 实训过程中严格要求自己，高质量完成试验要求的同时，利用网络搜集资料，拓展应用自己所学知识，提高自己解决实际问题的能力。 ...

我们的系统是做信息数据采集的，将所有采集的数据存库，但是数据量是非常大的一天能够达到上千万的数据入库，在处理的过程中数据库连接使用过程中经常会出现一些问题，我使用的是C3P0的连接池，连接数给到20个用到一...

平台中HBase库数据量如何统计呢？1. 什么需求？2. 怎么做？2.1 弯路2.2 接坑3. HyperLogLog基数统计算法是什么？4. HLL验证5. 如何应用到需求中？这是一两年前的任务单了，来得比较突然，就是需要知道一下目前平台...

该楼层疑似违规已被系统折叠隐藏此楼查看此楼这是个定时...有机会获取到上一次插入的数据然后就会重复插入数据请教各位大神这是为什么？？？？加同步和事务都试过了也会有这个问题int statusLocation = 0;try {w...

操作数据库能`批量`就批量，当然要注意数据量 500-1000条/次还是ok的能在本地就在本地跑，一般我们自己的电脑都是16G+，服务器除非是线上，测试环境都很小，我在测试环境开50个线程就挂机了，在本地就不会。

110,536

社区成员

642,578

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章