汉字在内存里以什么形式存储？

csz_1987 2008-07-27 11:03:09

学校的教学都是用TC/TC++，无法输入/输出汉字。

最近刚开始使用vc，在vc里可以输入、输出、存储汉字。

请问用vc存到内存里的汉字的形式是什么样的？

1、



#include <iostream>

using namespace std;



int main()

{

	char p[100]="汇编语言"; //这四个汉字在内存里怎么表示？

	cout<<p<<endl;

	return 0;

}

2、



#include <iostream>

using namespace std;



int main()

{

	cout<<"汇编语言"<<endl; //直接输出，那这四个汉字是否进驻过内存？

	return 0;

}

...全文

1110 20 打赏收藏转发到动态举报

写回复

用AI写文章

20 条回复

切换为时间正序

请发表友善的回复…

发表回复

legend507 2009-12-06

打赏
举报

不错，学到了

tianxueer 2008-07-29

打赏
举报

其实我觉的你好像问的是底层的东西。

不管是什么编码，放到内存里都是数字，如果不告诉你那是字符的编码，谁也不能区分那一个字节的含义，其实我觉得这都是操作系统和编译器的任务，比如windows编程中，你在一个字符串前面加上L，编译器就把它当成宽字符，也就是unicode编码，按照unicode编码的规则，比如翻译成2个字节，放入内存。

等到输出的时候，还是操作系统，由于ascii和unicode编码规则的不同，操作系统能判断出是什么编码，比如操作系统认为当前用的是unicode编码，那就读出2个字节，然后对照unicode的编码表，查出是哪个字符。如果是ascii编码，就读出一个字符，对照ascii的编码，查出是哪个字符。

有时候网页、邮件出现乱码，就是因为字符集或编码出错了，比如文件的作者是按照x编码保存的，结果浏览的时候用的是y编码解释，虽然内存里的东西都是一样的，但肯定是乱码。这时候如果选择让系统用x编码解释，就能正常显示了。

我说的是我自己的理解，大概意思是这样，可能有细节叙述的不太准确。不知道是不是你想知道的。

tianxueer 2008-07-29

打赏
举报

[Quote=引用 15 楼 csz_1987 的回复:]
引用 8 楼 sitych 的回复:
一个汉字2个字节保存

这个我知道。
可能是我表述的不清楚吧。
我再复述一下我的问题。

我的意思是，像字符、数字之类的在内存里存放是以他们的ascii码的二进制码形式存放于内存的。
那汉字在内存里最终是怎么转换成二进制码从而存放与2bytes的内存空间内呢？
[/Quote]

既然你知道英文字符是转化为ascii码了，
那同样啊，汉字包括所有字符都能用unicode编码表示。

计算机刚开始是美国人发明的，他们只需要那几个字符，所以就用一个字节就能表示他们所需要的所有字符，
但后来计算机需要给全世界人使用，一个字节不能表示所有的字符，所以人们就规定了unicode编码，比如这个范围用来表示英文，这个区间用来表示中文。
这些都是规定好的，就像每一本书编程书封面都有ascii码表的，比如0x41是A，0x42是B...，你去网上能查到unicode的具体编码规则。

其实unicode现在也分好多种，不光有2个字节，还有4个字节的。

iami007 2008-07-29

打赏
举报

在vc中应该用到了宽字符并且这种字符编码的方式就是unicode。存储的实质就是用2字节存储。像汉字之类的unicode是从0x3000到0x9FFF.

csz_1987 2008-07-29

打赏
举报

[Quote=引用 18 楼 tianxueer 的回复:]
其实我觉的你好像问的是底层的东西。

不管是什么编码，放到内存里都是数字，如果不告诉你那是字符的编码，谁也不能区分那一个字节的含义，其实我觉得这都是操作系统和编译器的任务，比如windows编程中，你在一个字符串前面加上L，编译器就把它当成宽字符，也就是unicode编码，按照unicode编码的规则，比如翻译成2个字节，放入内存。

等到输出的时候，还是操作系统，由于ascii和unicode编码规则的不同，操作系统能判断出是…
[/Quote]

十分感谢。了解了。

csz_1987 2008-07-28

打赏
举报

[Quote=引用 8 楼 sitych 的回复:]
一个汉字2个字节保存
[/Quote]

这个我知道。
可能是我表述的不清楚吧。
我再复述一下我的问题。

我的意思是，像字符、数字之类的在内存里存放是以他们的ascii码的二进制码形式存放于内存的。
那汉字在内存里最终是怎么转换成二进制码从而存放与2bytes的内存空间内呢？

richbirdandy 2008-07-28

打赏
举报

跟内存没关系你想问的是怎么编码吧

sitych 2008-07-28

打赏
举报

一个汉字2个字节保存

ForestDB 2008-07-28

打赏
举报

英文字母怎么存？

jameszhanglei 2008-07-28

打赏
举报

#include<graphics.h>
#include<stdio.h>
#include<fcntl.h>
#include<io.h>
#include<stdlib.h>
#include<conio.h>
#define ROW 1 /*纵坐标放大倍数*/
#define COL 2 /*横坐标放大倍数*/
void main()
{
int x,y;
char *s="汉字显示程序";
FILE *fp;
char buffer[32];/*buffer用来存储一个汉字*/
register m,n,i,j,k;
unsigned char qh,wh;
unsigned long offset;
int gd=VGA,gm=VGAHI;
initgraph(&gd,&gm,"");
if((fp=fopen("hzk16","rb"))==NULL)
{printf("Con't open hzk16,Plase add it");getch();closegraph(); exit(0);}
x=20;y=100;
while(*s){
qh=*(s)-0xa0;
wh=*(s+1)-0xa0;
offset=(94*(qh-1)+(wh-1))*32L;
fseek(fp,offset,SEEK_SET);
fread(buffer,32,1,fp);
for(i=0;i<16;i++)
for(n=0;n<ROW;n++)
for(j=0;j<2;j++)
for(k=0;k<8;k++)
for(m=0;m<COL;m++)
if(((buffer[i*2+j]>>(7-k))&0x1)!=NULL) putpixel(x+8*j*COL+k*COL+m,y+i*ROW+n,GREEN);
s+=2;
x+=30;
}
getch();
closegraph