AnsiString和PChar研究手记 (第一篇)

reallike 2004-03-07 10:29:13
AnsiString和PChar研究手记

前言:此文章来源于一次与aiirii的争吵,因为他不知道PChar的机理。而我嘲讽的语气最后造成了问题的不了了之。前几天DreamTheater大哥提到了有关这个方面的问题,我一向对大哥问题比较重视。经过研究,反思之后,其实当初我对这个了解仍旧是浅显的,其实当初给aiirii解释的也是浅显的,还是因为自己的浮躁。所以诞生了这篇文章,来解释AnsiString和PChar。

约定:因为这篇文章就是讨论的AnsiString这种长字符串,而ShortString这种短字符串不在讨论范围之内。WideString是Unicode字符串,机理与AnsiString近似。所以,这里只对AnsiString做讨论。

一:AnsiString与PChar的原理。

首先来说说PChar,PChar的存在,是为了兼容 Win32 API 中所使用的C语言的字符串。C语言中声明一个字符串变量ch是这么声明的:
Char *ch,
当字符串变量建立之后字符串结尾会自动加上NULL字符。所以这种类型可以这么说:以NULL(#0)结尾的字符串指针。
如果强加给PChar一个与C语言类似的Pascal的声明,那就是PChar: ^Char ,实际中这个声明是不会自动加上NULL结尾。所以Delphi把PChar独立成为一种类型。是的,PChar是一个指针,在使用指针变量之前,不可避免的要手动给变量分配内存,在使用完毕后释放这段内存。

再来看看AnsiString,AnsiString是Delphi内建的字符串类型。本质是一个指向堆中字符串结构的指针。

AnsiString有两部分组成,一部分是字符串头结构体,另一部分就是数据存储的部分。而在system.pas中这个头结构体定义如下:
type
PStrRec = ^StrRec;
StrRec = packed record
refCnt: Longint; //引用计数
length: Longint; //字符串长度。
end;

而数据部分,类似一个存储字符的可增长数组,是个简单的顺序表,所以可以虚拟的下一个定义:
type
TCharList = array[1..MaxListSize] of Char;
AnsiString = ^TCharList;

AnsiString的存储就是比PChar多了前面的这两个东西。引用计数和字符串长度。如果画一下简单的图例,保存LIKE这个字符串表示如下:

PChar简图:
------------------------
| L | I | K | E | #0 |
------------------------
AnsiString简图:
----------------------------------------------
| 引用计数位 | 长度位 | L | I | K | E | #0 |
----------------------------------------------

引用计数的意义是:几个字符串可能指向同一个内存地址。所以这个地址就是保存这块内存有几个变量引用了它。
Delphi内存管理使用Copy on write技术,只有在修改了其内容之后,才生成申请新的地址,生成新的串。

...全文
367 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
sunny 2004-03-22
  • 打赏
  • 举报
回复
咳!鄙人学习汇编多年,自认为对于CPU的各种运行模式都很熟悉,没有参加这场讨论(论战)真实可惜撩^_^

5,379

社区成员

发帖
与我相关
我的任务
社区描述
Delphi 开发及应用
社区管理员
  • VCL组件开发及应用社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧