多线程伪共享 (false sharing) 问题分析

小黄鸭和大树 2012-04-10 10:08:12

加精

在多核的CPU架构中，每一个核心core都会有自己的缓存空间，因此如果一个变量如果同时存在不同的核心缓存空间时，就会出现伪共享（false sharing)的问题。

此时如果一个核心修改了该变量，该修改需要同步到其它核心的缓存。

在linux执行cat /proc/cpuinfo 来查看cpu的缓存的行大小：

cache_alignment : 64，

在目前的Intel处理器中cache是64B对齐的，因此K * 64与(K + 1) * 64 - 1的内存块在同一cache行中。

查看下面一段代码
01.#include
02.#include
03.#include
04.#include
05.#include
06.#include
07.using namespace std;
08.
09.
10.
11.#define NMAX 4096 * 10
12.#define NUM_CORE 4
13.
14.int g_iBuff[NMAX];
15.
16.
17.int main()
18.{
19. int alignPos = 0;
20. for (int i = 0; i < 65; ++i)
21. {
22. if (((int)&g_iBuff[i]) % 64 == 0)
23. {
24. alignPos = i;
25. break;
26. }
27. }
28.
29. for (int pos = 1; pos <= 4096; pos <<= 1)
30. {
31. memset(g_iBuff, 0 , sizeof(g_iBuff));
32. time_t beg = time(0);
33.#pragma omp parallel for num_threads(NUM_CORE)
34. for (int i = 0; i < NUM_CORE; ++i)
35. {
36. int tp = i * pos + alignPos;
37. for (int j = 0; j < 999999999; ++j)
38. {
39. g_iBuff[tp]++;
40. }
41. }
42. time_t end = time(0);
43.
44. cout << "false shareing: step = "<<pos<<" time = "<< end - beg << "s" <<endl;
45. }
46.
47. return 0;
48.}
# g++ XX.cpp -o xx -fopenmp

# ./xx

我们首先来看一下这段代码的输出结果：

false shareing: step = 1 time = 12s
false shareing: step = 2 time = 13s
false shareing: step = 4 time = 13s
false shareing: step = 8 time = 6s
false shareing: step = 16 time = 3s
false shareing: step = 32 time = 3s
false shareing: step = 64 time = 3s
false shareing: step = 128 time = 3s
false shareing: step = 256 time = 3s
false shareing: step = 512 time = 3s
false shareing: step = 1024 time = 3s
false shareing: step = 2048 time = 3s
false shareing: step = 4096 time = 3s

接下来我们来分析一个程序：

01.for (int i = 0; i 16，也不会再存在伪共享。

这样我们就可以解释上程序在不同step上的执行时间问题。

原文地址:http://g.csdn.net/5216086

...全文

1249 21 打赏收藏转发到动态举报

写回复

21 条回复

切换为时间正序

请发表友善的回复…

发表回复

modyaj 2012-05-04

打赏
举报

回复

因此K * 64与(K + 1) * 64 - 1的内存块在同一cache行中

楼主我也是用这个方法解决伪共享的你还有没有其他的方法啊这个思想小数据量可以数据多了是不是会浪费空间？？

maomaoyunyun 2012-04-17

打赏
举报

回复

来看看的，谢谢楼主了

zhujuntao091 2012-04-12

打赏
举报

回复

不是很懂啊

dyw_888 2012-04-11

打赏
举报

回复

为什么每个核的使用频率不一样

liandongliandong 2012-04-11

打赏
举报

回复

看到了

xinfengj7 2012-04-11

打赏
举报

回复

先看看支持一下啊看看看

genieman123 2012-04-11

打赏
举报

回复

谢谢楼主分享

qinzhe009 2012-04-11

打赏
举报

回复

谢谢楼主分享

haining007a 2012-04-10

打赏
举报

回复

来看看的，谢谢楼主了

Shenlody 2012-04-10

打赏
举报

回复

来看看的，谢谢楼主了

Kaile 2012-04-10

打赏
举报

回复

代码复制都没复制全
#include

CPU 中cache line的c++模型

在并发编程过程中，我们大部分的焦点都放在如何控制共享变量的访问控制上（代码层面），但是很少人会关注系统硬件及 JVM 底层相关的影响因素。前段时间学习了一个牛X的高性能异步处理框架 Disruptor，它被誉为“最快的消息框架”，其 LMAX 架构能够在一个线程里每秒处理 6百万订单！在讲到 Disruptor 为什么这么快时，接触到了一个概念——伪共享( false sharing )，其中提...

什么是多线程环境下的伪共享（false sharing）？ 伪共享是多线程系统（每个处理器有自己的局部缓存）中一个众所周知的性能问题。伪共享发生在不同处理器上的线程对变量的修改依赖于相同的缓存行，如下图所示：小知识点: 1.共享就是一个内存区域的数据被多个处理器访问，伪共享就是不是真的共享。这里的共享这个概念是基于逻辑层面的。实际上伪共享与共享在cache line 上

多线程伪共享(false sharing)问题分析在多核的CPU架构中，每一个核心core都会有自己的缓存空间，因此如果一个变量如果同时存在不同的核心缓存空间时，就会出现伪共享（false sharing)的问题。此时如果一个核心修改了该变量，该修改需要同步到其它核心的缓存。在linux执行cat /proc/cpuinfo 来查看cpu的缓存的行大小： cache_alignment

1. 伪共享产生：在SMP架构的系统中，每个CPU核心都有自己的cache，当多个线程在不同的核心上，并且某线程修改了在同一个cache line中的数据时，由于cache一致性原则，其他核心cache中相同cache line会失效，从而产生cache miss，并重新从内存中读入数据到cache line，显然，这样多核心并没有实现真正的共享，称之为伪共享。如下图：cpu0，cpu1中...

英特尔边缘计算技术

567

社区成员

7,024

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章