分析文件后，记录入库请教

色郎中 2017-04-12 10:45:54

写段代码，分析文件夹内的文本文件，每秒产生一个文件，每个文件大概500-1000条记录，简单分析一下，将每条记录存入数据库；
按最低记录数算 500条，一天下来也有5000-6000W条记录了：

处理过程：在一个线程里处理文本文件，分析文件后，将500条记录，一次性也在线程里插入数据库，程序跑一段时发现后，感觉本本抗不住，文件夹里很多文件来不及处理；
大概如下的样子；



 json= parsing_files(currentFileName)   //保存处理一个文本后的500条记录

db_handle.write_points( json)//调用库函数，写数据库

分别测试，只分析文件，并生成json（类似一个文件，即将文本文件分析过后的500条记录存一个json里），不做插入数据库操作，发现CPU, 内存，磁盘IO 都变化不大；
但是，调用库接口函数做入库操作，跑一段时间后，发现CPU，内存基本都给占用了

请教一下有啥的办法，分析文本和入库操作分开？处理的结果放队列，然后，开新线程做入库？或者其他，

...全文

121 3 打赏收藏转发到动态举报

写回复

用AI写文章

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

色郎中 2017-04-15

打赏
举报

哈哈想多了，，是数据库自身原因，或者说，对这个数据库特性不熟悉，influxDB数据库，，tags的值乘积越大越耗内存，调整Tags, 就OK了

wutong9509 2017-04-12

打赏
举报

sqlldr命令就可以解决解析文本然后导入数据库问题。

sanGuo_uu 2017-04-12

打赏
举报

"发现CPU, 内存，磁盘IO 都变化不大" 这个你是怎么看的？启动任务管理器？处理的结果放队列，队列还不是要占内存哈。这样应该没用吧听你的意思，是操作数据库的时候占cpu和内存，那分开后，也还是要写入数据库啊 --------------------------------------------------- 定个临界值，让它只执行固定时间or固定数据。然后手动执行下一次。——这也是一种思路啦。看看是“数据分析”or“入库操作”占资源。如果是“入库操作”的问题，那优化下sql语句？

（3）作业一、二完成后，实训报告交给老师，数据库原文件上传到ftp://192.168.130 .167实训文件夹下。（4）作业上交时间为12月23日最后一节课，逾期不再接收。八、实训成绩评定、考核办法由指导教师根据学生完成...

1、学习通过shell脚本定期采集 cpu、mem、disk 信息，并记录数据到.txt文件中； 2、学习定时导入上一小时产生的数据记录文件到数据库二、实验环境阿里云服务器三、实验要求 1、创建的shell脚本可以采集数据包括 ...

SSM仓储商品库存管理系统的主要使用者分为管理员、和用户，实现功能包括：首页、人员管理（管理员、系统用户）、模块管理（库存信息、商品分类、质检记录、良品记录、不良品记录、入库信息、入库异常、入库记录、...

系统安全绕不开PE文件，PE文件又与恶意样本检测及分析紧密相关。前文作者带领大家逆向分析两个CrackMe程序，包括逆向分析和源码还原。这篇文章主要介绍了PE文件基础知识及恶意样本检测的三种处理知识，手动编写代码...

主要功能有：首页、人员管理（管理员、系统用户）、模块管理（库存信息、商品分类、质检记录、良品记录、不良品记录、入库信息、入库异常、入库记录、出库信息、出库记录、出库异常、库存盘点）、个人管理（个人信息...