我没有学过php请大家帮我看看这段代码,讲讲它的算法思想行吗?

ljq49 2003-12-31 11:33:23
GB2312->UTF-8 转换函数

以下是一段gb2312 -> UTF-8 的函数,西西,我抄了
unicode -> UTF-8 的算法,所以实际比GB2312->unicode
没多多少东西,请大家注意调用gb2utf8()时不能中英文混用

程序需要的GB2312.txt文件

gb2utf8.php
<?

//Program writen by sadly www.phpx.com

function gb2utf8($gb)
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}
else
{
$gb=substr($gb,1,strlen($gb));
$utf8.=u2utf8(substr($gb,0,1));
}
}

$ret="";
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));

return $ret;
}

function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 | $c>>6);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 | $c>>12);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 | $c>>18);
$str.=(0x80 | $c>>12 & 0x3F);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
return $str;
}
?>



调用举例:通过GD输出 "中国" 两个汉字
example.php

<?
//Header("Content-type: image/gif");
$im = imagecreate(400,300);
$bkg = ImageColorAllocate($im, 0,0,0);
$clr = ImageColorAllocate($im, 255,255,255);
$fnt = "d:/winnt/fonts/simhei.ttf";
include("gb2utf8.php");
$str = gb2utf8("中国");
ImageTTFText($im, 20, 0, 10, 20, $clr, $fnt, $str);
ImageGif($im);
ImageDestroy($im);
?>

...全文
27 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
kurt1983 2004-01-03
  • 打赏
  • 举报
回复
强!
zykj_2000 2004-01-02
  • 打赏
  • 举报
回复
你去看看GB2312与BIG5码的字符表,找一下规律就可以自已导出算法了
xinchangpeng 2004-01-02
  • 打赏
  • 举报
回复
我没弄过gd帮你顶吧
aoenzh 2003-12-31
  • 打赏
  • 举报
回复
up
xuzuning 2003-12-31
  • 打赏
  • 举报
回复
php4.3.x的iconv扩展对汉字支持较好,应尽可能使用他
$text = iconv("GB2312","UTF-8",$text);

如果实在不能使用的话,可以使用楼主贴出的代码。注意请先下载gb2312.txt文件
184779字节,这是一个gb2312到uncode的编码对照表
其中数据组织为
0x2121 0x3000 # IDEOGRAPHIC SPACE
...
实际使用时可删去注释而仅保留前面的十六进制数据部分,以减少载入的时间。
该文件可以自己用page936标准构造

函数gb2utf8($gb) 用于将汉字转换成utf-8编码,其中调用了函数u2utf8($c)
函数u2utf8($c)是uncode编码到utf-8编码转换的标准算法
feyge 2003-12-31
  • 打赏
  • 举报
回复
gd不支持中文该怎么办

按照客户的要求做个图形显示,但是gd不支持中文,很示烦恼.
---------------------------------------------------------------

<?php
/******************************
  如何在PHP图形函数中显示汉字,大家已经问了很久了,但一直没有结果。终于在参考另一篇文章后,我试验出来了!
方法:
  首先,决定要显示哪些汉字,如“计数器”这三个字。
  到Word2000(97不知可不可以)中去,输入这三个字,另存为,选择编码格式,然后再在右边的编码类型里选择unicode utf-8,记住不要选错了。存成一个编码格式的文本文件,比如说文件名叫test.txt。
  用一个16进制的编辑器打开这个文件,这时你会看到,里面有一堆16进制字符,一个汉字占三个字节,所以这里,你应该找到前面9个字节的内容,记下来。
  再开始编辑.php文件,用如chr(0xE6).chr(0x88)的格式写下来,再赋给一个变量,再用ImageTTFText()函数输出。你看到了什么?
  如果你什么都没看到,那么你需要再看一下你的那些16进制代码是否无误,当然,显示汉字所需的字体文件你也要拷到适当的位置哦!我这段程序中用的是windows自带的楷体。
  不过这样还是很麻烦,毕竟还需要用到另外两个工具,如果能有一个函数直接将汉字转换成utf-8编码就更好了。大家再找找资料吧!

  这一串utf-8字串表示的是“我爱你!”,嘻嘻,不要说我恶心哦!
******************************/
$str=chr(0xE6).chr(0x88).chr(0x91).chr(0xE7).chr(0x88).chr(0xB1).chr(0xE4).chr(0xBD).chr(0xA0).chr(0xEF).chr(0xBC).chr(0x81) ;
$cur_count=mb_convert_encoding($str,"UTF-8","ASCII");

Header("Content-type: image/png");
$im = imagecreate(156,116);
$blue = ImageColorAllocate($im, 0,0,255);
$yellow = ImageColorAllocate($im, 255,255,0);
ImageTTFText($im,20,0,4,40,$yellow,"simkai.ttf",$blue);
ImagePNG($im);
ImageDestroy($im);
?>
把simkai.ttf拷到同一目录;
Ok!
借花现佛
---------------------------------------------------------------

首先你需要有一张对照表
然后执行下面的函数:gb2312.txt
function gb2utf8($gb)
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

$ret="";
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
}
else
{
$ret.=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb));
}
}
return $ret;
}

function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 ¦ $c>>6);
$str.=(0x80 ¦ $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 ¦ $c>>12);
$str.=(0x80 ¦ $c>>6 & 0x3F);
$str.=(0x80 ¦ $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 ¦ $c>>18);
$str.=(0x80 ¦ $c>>12 & 0x3F);
$str.=(0x80 ¦ $c>>6 & 0x3F);
$str.=(0x80 ¦ $c & 0x3F);
}
return $str;
}
xuzuning 2003-12-31
  • 打赏
  • 举报
回复
这样啊?!
查表
如果你会c就不会提出这样的问题了,直接套套就是了。
ljq49 2003-12-31
  • 打赏
  • 举报
回复
我要问的是它的具体算法,我想在linux下用c语言实现,而且不使用iconv库函数!

21,886

社区成员

发帖
与我相关
我的任务
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
  • 基础编程社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧