VxWorks 内存分配效率问题

断点2019 2021-11-13 15:14:06

现象描述:
        SMP下 RTP程序跑在Core 4核的处理器上,测试RTP程序内创建了1000个任务(线程),每个任务会有一些涉及到内存申请(malloc)和释放(free)的操作,如STL vector的操作(任务间无互斥,vector为栈上对象),测试下来查看CPU占用率大概在30%左右,cpu spy查看4核CPU负载,明显地,CPU 0 出现了较高负载现象,其余核心负载较低。Suspend所有任务查看堆栈,发现几乎所有任务都在等待同一个互斥信号量,这个互斥信号量是VxWorks内部Mem Partition Alloc/Free调用的,应该是内存池的同一个分区内出现了大量申请和释放的操作,造成大量互斥现象的。
        同样的测试在Windows上进行,可以发现,Windows的CPU可以达到近乎多核满载的效果。看上去应该是VxWorks本身的内存管理对于多核不太友好(如同一内存区管理只用了一个互斥信号量,没有再做分区,去实现负载平衡),当然实际应用应该尽量避免高频次的内存分配释放去提升CPU的利用率。

那么,针对此现象,目前有三个方向
① 是否参数配置不合理,导致内存分配效率较低,如果不合理,如何改善
② 是否需要建立用户层的内存池,建立多个内存池,针对不同的内存申请释放位置进行优化,避免内存申请释放时阻塞在同一互斥信号量中
③ 减小用户层的malloc/free频次

对此,各位还有什么其他的建议,可以进行优化

...全文
697 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
断点2019 2021-11-14
精选
  • 打赏
  • 举报
回复 1

针对①方向,查阅了相关文档,发现VxWorks,配置中有Memory caching component,该库提供了VxWorks内核堆管理器memPartLib的扩展,以提高经常执行动态内存分配的任务的执行速度。通过将争用减少到堆管理器的关键部分(由互斥信号量序列化)来实现加速。减少这种争用在多核(SMP)系统上尤为重要。该实现依赖于任务私有数据结构,因此任务通常可以分配和释放内存块,而无需使用锁。从概念上讲,这相当于内存块的缓存,可以在需要时快速重用。支持malloc / free的块大小如下:

    编号   块大小         适用块范围大小
    -----   ------------      -----------------------
    0       16 bytes          0 - 16 bytes
    1       32 bytes         17 - 32 bytes
    2       48 bytes         33 - 48 bytes
    3       64 bytes         48 - 64 bytes
    4       80 bytes         65 - 80 bytes
    5       96 bytes         81 - 96 bytes
    6       112 bytes        97 - 112 bytes
    7       128 bytes       113 - 128 bytes
    8       160 bytes       129 - 160 bytes
    9       192 bytes       161 - 192 bytes
    a       224 bytes       193 - 224 bytes
    b       256 bytes       225 - 256 bytes
    c       320 bytes       257 - 320 bytes
    d       384 bytes       321 - 384 bytes
    e       448 bytes       385 - 448 bytes
    f       512 bytes       449 - 512 bytes

最大支持分配512字节空间,每种块最大支持8组,超过这两种限制的任一种情况时,仍会在系统Heap上进行分配。这一点比较可惜,毕竟不同的任务分配需求都有所不同,也许是VxWorks为了方便管理,这一Cache空间的大小,在创建任务时就会分配完成,但是有总比没有强,经过测试,在vector容量小于8时,1000条任务,确实不会再出现争夺互斥信号资源的现象,如果程序中经常使用std::string,或者申请一些堆上的短小资源且数量不多时(即使分组超过,有一部分也会存在在Cache中),可以考虑开启这个功能。会对程序运行效率有提升效果。

断点2019 2021-11-13
精选
  • 打赏
  • 举报
回复

还有一点,测试C++ STL部分的一些实现和Windows的也不太一样,测试代码如下:
vector a;
a.reserve(2000);
a.push_back(1);
a.clear();
printf("reserve capacity is %d\n", a.capacity());

Windows的打印结果是:reserve capacity is 2000
VxWorks的打印结果是:reserve capacity is 0

显然,预分配的内存会被clear删除掉,这一点在做移植的时候,如果程序对预分配做过优化,移植后优化的效果可能也不尽人意

软件编程规范培训实例与练习 软件编程规范培训实例与练习  问题分类 1 逻辑类问题(A类)-指设计、编码中出现的计算正确性和一致性、程序逻辑控制等方面出现的问题,在系统中起关键作用,将导致软件死机、功能正常实现等严重问题; 接口类问题(B类)-指设计、编码中出现的函数和环境、其他函数、全局/局部变量或数据变量之间的数据/控制传输不匹配的问题,在系统中起重要作用,将导致模块间配合失效等严重问题; 维护类问题(C类)-指设计、编码中出现的对软件系统的维护方便程度造成影响的问题,在系统中不起关键作用,但对系统后期维护造成不便或导致维护费用上升; 可测试性问题(D类)-指设计、编码中因考虑不周而导致后期系统可测试性差的问题。  处罚办法 问题发生率: P=D/S D=DA+0.5DB+0.25DC 其中: P -问题发生率 D -1个季度内错误总数 DA -1个季度内A类错误总数 DB -1个季度内B类错误总数 DC -1个季度内C类错误总数 S -1个季度内收到问题报告单总数 1)当D≥3时,如果P≥3%,将进行警告处理,并予以公告; 2)当D≥5时,如果P≥5%,将进行罚款处理,并予以公告。 目 录 一、逻辑类代码问题 第5页 1、变量/指针在使用前就必须初始化 第5页 【案例1.1.1】 第5页 2、防止指针/数组操作越界 第5页 【案例1.2.1】 第5页 【案例1.2.2】 第6页 【案例1.2.3】 第7页 【案例1.2.4】 第8页 3、避免指针的非法引用 第9页 【案例1.3.1】 第9页 4、变量类型定义错误 第10页 【案例1.4.1】 第10页 5、正确使用逻辑与&&、屏蔽&操作符 第17页 【案例1.5.1】 第17页 6、注意数据类型的匹配 第18页 【案例1.6.1】 第18页 【案例1.6.2】 第18页 7、用于控制条件转移的表达式及取值范围是否书写正确 第20页 【案例1.7.1】 第20页 【案例1.7.2】 第21页 【案例1.7.3】 第22页 8、条件分支处理是否有遗漏 第24页 【案例1.8.1】 第24页 9、引用已释放的资源 第26页 【案例1.9.1】 第26页 10、分配资源是否已正确释放 第28页 【案例1.10.1】 第28页 【案例1.10.2】 第29页 【案例1.10.3】 第30页 【案例1.10.4】 第32页 【案例1.10.5】 第33页 【案例1.10.6】 第35页 【案例1.10.7】 第38页 11、防止资源的重复释放 第39页 【案例1.11.1】 第39页 12、公共资源的互斥性和竞用性 第40页 【案例1.12.1】 第40页 【案例1.12.2】 第40页 二、接口类代码问题 第43页 1、对函数参数进行有效性检查 第43页 【案例2.1.1】 第43页 【案例2.1.2】 第43页 【案例2.1.3】 第44页 【案例2.1.4】 第46页 【案例2.1.5】 第47页 【案例2.1.6】 第48页 2、注意多出口函数的处理 第49页 【案例2.2.1】 第49页 三、维护类代码问题 第51页 1、 统一枚举类型的使用 第51页 【案例3.1.1】 第51页 2、 注释量至少占代码总量的20% 第51页 【案例3.2.1】对XXX产品BAM某版本部分代码注释量的统计 第51页 四、产品兼容性问题 第52页 1、系统配置、命令方式 第52页 【案例4.1.1】 第52页 【案例4.1.2】 第53页 2、设备对接 第54页 【案例4.2.1】 第54页 3、其他 第55页 【案例4.3.1】 第55页 五、版本控制问题 第58页 1、新老代码中同一全局变量不一致 第58页 【案例5.1.1】 第58页 六、可测试性代码问题 第59页 1、调试信息/打印信息的正确性 第59页 【案例6.1.1】 第59页 一、逻辑类代码问题 1、变量/指针在使用前就必须初始化 【案例1.1.1】 C语言中最大的特色就是指针。指针的使用具有很强的技巧性和灵活性,但同时也带来了很大的危险性。在XXX的代码中有如下一端对指针的灵活使用: ... ... _UC *puc_card_config_tab; ... ... Get_Config_Table(

2,179

社区成员

发帖
与我相关
我的任务
社区描述
xworks是美国 Wind River System 公司( 以下简称风河公司 ,即 WRS 公司)推出的一个实时操作系统。
社区管理员
  • VxWorks开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧