【关于Linux中判断大端小端的代码问题】

Bill_Hoo 2011-02-12 06:24:08

本问题是通过比较两个用UNION联合体实现的大小端判断方案所产生的
/*
* 注：提出此问题的假设
* 假设数组中的元素依次在大端、小端机器上都是从低字节向高字节依次存储
*/
//=======================================
第一个方案
//---------------------------------------------------------
union
{
int a;
char b;
}EndianTest;
EndianTest.a = 0x00000001;
if( EndianTest.b == 0x01 )
//是小端
else
//是大端
这个方案能够理解，将EndianTest.a直接赋值为1
若是小端机器，那么存储在内存中的数据就是0x01000000
若是大端机器，那么存储在内存中的数据就是0x00000001
这样只要取该数据在内存中低位1个字节，就能够判断出本机是小端还是大端。

//======================================
第二个方案(网上说是linux中的实现)
//----------------------------------------------------------
static union
{
char c[4];
unsigned long l;
}endian_test = { { 'l','?','?','b' } };
#define ENDIANNESS ((char)endian_test.l)
在本问题假设条件成立的情况下，
这个实现方案把数据一个字节一个字节地依次在内存里按低字节到高字节的顺序存放
首先是
endian_test.c[0] = 'l' //即内存低字节（假设为0x00000000）存的'l'
然后
endian_test.c[1] = '?' //即内存0x00000001存的'?'
其次
endian_test.c[2] = '?' //即内存0x00000002存的'?'
最后
endian_test.c[3] = 'b' //即内存0x00000003存的'b'

这样的话，不论大端或是小端，存进内存的16进制数都是 62 3f 3f 6c （'l''?''?''b'）没有区别
那么提取该内存的第一个字节就都相同了，为0x62，也即'l'，这样怎么能够
判别出大小端呢？

按照我的理解，判断大端小端的原理就在于数据存入内存时的顺序，然而Linux这段代码使数据存入的顺序没有任何变化，那不就等于没有起到判断的作用么？

【注：由于本人技术有限，实在琢磨不出其原因，所以还请各位高手多多指教。在我得知所以然之后，会将本博文转成正式的知识性文章，在此先谢谢大家】

...全文

1160 14 打赏收藏转发到动态举报

写回复

用AI写文章

14 条回复

切换为时间正序

请发表友善的回复…

发表回复

moonsunearth 2012-08-06

打赏
举报

lz主要是低地址与低字节没搞清楚，char取的是低字节，＊（char＊）取的是低地址上的字节。

雪域迷影 2012-07-22

打赏
举报

看到这个帖子，终于对大小端基本弄明白了，谢谢各位前辈！！！

jackylongchen 2012-06-28

打赏
举报

来学习
谢谢

Bill_Hoo 2011-02-21

打赏
举报

[Quote=引用 9 楼 gaosifuti 的回复:]
引用 7 楼 bill_hoo 的回复:
截取时是直接从内存截取，那么不论大端小端，截取的那个字节都不会变。

问题出在最后一句。
我想你的意思是：已知c[4]和l是同一块内存，而c[4]不论是大端小端都是“l??b”，那么l所在的内存也就是这个顺序，这是没错的。
但是在从l到char的强制转换时，取的是“低字节”，而低字节在哪里呢？这就要看大端小端了。如果是大端，低字节就是b，反之……
[/Quote]

多谢你的回答！我就是在这里卡住了
也多些各位的帮忙！谢谢^^

hawk198 2011-02-17

打赏
举报

[Quote=引用 9 楼 gaosifuti 的回复:]

不论大端小端，都截取低字节，而低字节是谁，由大端小端决定
[/Quote]
没错，在char*和其它类型进行自动转换的时候是有差别的，因为char*永远是一样的，而超过2个字节才能表示的数据存储方式是根据大小端确定的

gaosifuti 2011-02-17

打赏
举报

[Quote=引用 7 楼 bill_hoo 的回复:]
截取时是直接从内存截取，那么不论大端小端，截取的那个字节都不会变。
[/Quote]

问题出在最后一句。
我想你的意思是：已知c[4]和l是同一块内存，而c[4]不论是大端小端都是“l??b”，那么l所在的内存也就是这个顺序，这是没错的。
但是在从l到char的强制转换时，取的是“低字节”，而低字节在哪里呢？这就要看大端小端了。如果是大端，低字节就是b，反之为l。
所以最后一句应该改为“不论大端小端，都截取低字节，而低字节是谁，由大端小端决定。”

dragonbooker 2011-02-16

打赏
举报

回复 Bill_Hoo：
你好，刚看到你的回复，首先你应该明白联合体（union）数据类型的特性吧-----成员变量c和i公用一段内存，当系统我32位系统时，正好，unsigned long类型占4个字节，char为一个字节

我们假设从左到右内存地址依次增高，那么'l', '?', '?', 'b' 这四个字符在不同的系统将会这样放置：
'l', '?', '?', 'b' ------ 小端（little-endian）系统（低低模式，即低字节放在低地址）
'b','?', '?', 'l' ------ 大端（big-endian）系统（高低模式，即高字节放在低地址）

那么宏中的这条语句（（char)endian_test.l）很明显是取long变量的第一个字节，那么如果返回‘l’，说明是小端，如果返回 'b'。说明是大端。

Rain208 2011-02-14

打赏
举报



static union

{

 char c[4];

 unsigned long l;

}endian_test = { { 'l','?','?','b' } };

#define ENDIANNESS ((char)endian_test.l)



endian_test  初始化的时候是按照char数组初始化的。

所以在内存中endian_test的布局是



高地址

^     b

|     ?

|     ?

|     l

低地址



但是你取endian_test.l的时候，是按照long占的四个字节来取数据的

也就是如果是小端机器 取出来的是b??l

大端机器取出来的是l??b



然后再转换成char, 则去掉3个字节的高位

也就是小段是l 大端是b



完整的程序应该是：



static union

{

 char c[4];

 unsigned long l;

}endian_test = { { 'l','?','?','b' } };



#define ENDIANNESS ((char)endian_test.l)



if (ENDIANNESS == 'b')

{

    printf("big\n");

}

else if(ENDIANNESS == 'l')

{

    printf("little\n");

}

else

{

    printf("error\n");

}

帅得不敢出门 2011-02-14

打赏
举报

你对大小端还没有弄明白。
大端方式将高位存放在低地址，小端方式将低位存放在低地址
提取低8bit值都是一样的，
但是long型的那个值却在大小端中是不一样的。所以可以通过l的值来判断是大还是小端。
你这个例子不完整。

justkk 2011-02-14

打赏
举报

short s=1;
if( s == htons(s) ) 大端;
else 小端;

网络字节序是大端的。

Bill_Hoo 2011-02-14

打赏
举报

[Quote=引用 6 楼 rain208 的回复:]
C/C++ code

static union
{
char c[4];
unsigned long l;
}endian_test = { { 'l','?','?','b' } };
#define ENDIANNESS ((char)endian_test.l)

endian_test 初始化的时候是按照char数组初始化的。
所以在内存中endian_test……
[/Quote]

谢谢你的回答，是不是就是说截取1个字节是先将内存中的数据读取到寄存器（此时就会有大端小端的区别），然后再进行截取？
我产生这个问题的原因也因为我认为截取时是直接从内存截取，那么不论大端小端，截取的那个字节都不会变。

Bill_Hoo 2011-02-13

打赏
举报

[Quote=引用 1 楼 dragonbooker 的回复:]
建议看一下我的博文，若还不懂，再解释~
http://blog.csdn.net/dragonbooker/archive/2011/02/06/6173321.aspx
[/Quote]

你好，看了你的博文，你也仅将Linux的实现代码粘贴了，我希望得到该代码在内存中的具体数据，谢谢你^^

Bill_Hoo 2011-02-12

打赏
举报

[Quote=引用 1 楼 dragonbooker 的回复:]
建议看一下我的博文，若还不懂，再解释~
http://blog.csdn.net/dragonbooker/archive/2011/02/06/6173321.aspx
[/Quote]
感谢你的帮忙，我会认真看的，有什么不懂的还望指教^^

dragonbooker 2011-02-12