社区
高性能计算
帖子详情
多个进程大数据量计算越算越慢
一注擒庄
2017-01-15 03:55:09
在做一个大数据(50G)计算任务,文件有5000多个,每个文件是单独的,计算的时候互不相关,因此考虑多个进程同时计算。在4核电脑上开了3个进程,刚开始3分钟内,计算速度很快,到后面就慢了下来。
会是什么原因,每次调试的时候,都是刚开始的3分钟内计算很快,会不会存在进程计算一段时间后适当休息的问题?或者每个进程只计算3分钟的文件量,后面的重新创建新的进程来继续算?
...全文
177
4
打赏
收藏
多个进程大数据量计算越算越慢
在做一个大数据(50G)计算任务,文件有5000多个,每个文件是单独的,计算的时候互不相关,因此考虑多个进程同时计算。在4核电脑上开了3个进程,刚开始3分钟内,计算速度很快,到后面就慢了下来。 会是什么原因,每次调试的时候,都是刚开始的3分钟内计算很快,会不会存在进程计算一段时间后适当休息的问题?或者每个进程只计算3分钟的文件量,后面的重新创建新的进程来继续算?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
CallMeJacky
2019-07-18
打赏
举报
回复
不是单独,多次,打错了,不好意思
CallMeJacky
2019-07-18
打赏
举报
回复
如果单独创建对象,可能导致gc不停回收对象的问题,就有可能越来越慢,可以考虑一下这个问题
zxbqqx
2017-02-07
打赏
举报
回复
多进程处理?每个进程处理多少文件?单个进程中是否又包含了多线程? 这种情况,多线程处理也可以吧
zxbqqx
2017-02-07
打赏
举报
回复
try看看还能不能回复
Python-多
进程
深入学习多
进程
操作数据
共享内存
大数据
量快速
进程
间通讯
最近在做一个
进程
间频繁,数据量比较大的通讯采用的是共享内存通讯,和生产者消费者模式。调试了几天,记录一些要点结构如下图注意:1、因为是共享,如果
进程
B有
多个
对象要写数据到共享内存,每次写入计数和使用缓冲...
什么?Python的多
进程
居然比单
进程
慢?
很多时候,当我们需要使用Python来处理大量的数据的时候,为了缩短处理的时间,我们会使用多线程或多
进程
来并行处理任务。 由于Python全局解释器锁的存在,导致在执行多线程的时候实际上只有一个线程在运行,这使得...
Mysql 单表适合的最
大数据
量是多少?如何优化其性能?
Mysql 单表适合存储的最
大数据
量,自然不是说能够存储的最
大数据
量,如果是说能够存储的最大量,那么,如果你使用自增 ID,最大就可以存储 2^32 或 2^64 条记录了,这是按自增 ID 的数据类型 int 或 bigint 来计算的...
多线程与多
进程
详细
进程
:就是一个程序在一个数据集上的一次动态执行过程。
进程
一般由程序、数据集、
进程
控制块三部分组成。 程序:我们编写的程序用来描述
进程
要完成哪些功能以及如何完成; 数据集;则是程序在执行过程中所需要...
高性能计算
2,408
社区成员
1,024
社区内容
发帖
与我相关
我的任务
高性能计算
高性能计算
复制链接
扫一扫
分享
社区描述
高性能计算
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章