三分钟同时拥有简繁双语版的网站,简繁通V2.5正式版发布!!!
2.5版优化了处理结构和算法,简化了处理方式,性能提升了近3倍,欢迎下载试用!(http://www.xdevelop.net/)
简介
简繁通是安装于服务器端的内码转换服务软件,可以实现中文网站的简繁内码实时动态转换。一个中文简体网站,安装本软件后,立刻就可以同时拥有简繁两个版本,不需要另外建一套繁体网页和数据库。它不仅可以对静态网页数据进行转换,而且支持动态网页内容,如JSP、ASP、CGI等的实时双向转换。
由于历史原因,中国大陆采用GBK内码,而台湾、香港及部分海外华人地区采用的是繁体中文big5码的汉字。虽然中国大陆对繁体字具有一定的辨认能力,但是,对于大多数大陆人来说,阅读繁体字依然存在障碍。台湾人读简体字的障碍就更大了,大部分台湾人或香港人对异型简体字几乎不认识,除了部分是完全同型的之外,其他字结合上下文连蒙带猜也只能读对50%左右。所以大陆网站要面向港台和海外,或港台网站要面向大陆,必须要有相应的简繁体版网站,才可以避免阅读上的障碍。
而传统的办法往往要做两套版本的网站,费时费力不说,更重要的是维护困难,难以保证信息的同步和相互查询,例如,在简体版使用简体汉字搜索,将无法搜索到繁体版上有关这方面的内容。而简繁通将可以很好的解决问题,只需很小的投入和时间,即可获得简繁双语版,而且基本不需后期维护。
主要特点:
1.平台无关性
简繁通使用JAVA实现,可以运行于任何可以支持JAVA的平台,包括NT、LINUX、UNIX、SOLARIS等绝大多数常用操作系统。使用本软件时,需要安装JDK1.3或以上版本,可以从http://java.sun.com/j2se/1.3 免费下载。
2.实时性
网站只需要拥有简体或繁体一种版本,当用户访问时,简繁通将实时转换成合适的内码返回给用户的浏览器。
3.双向性
简繁通不仅对服务器端向客户端发送的数据进行转换,同时也对客户向服务器提交的数据进行反向转换。原网站的程序和数据库只需处理一种内码,不需改变原有程序和数据库。同时对网站的各种服务、查询等问题都能方便的解决,免去两种内码间信息的同步和查询问题。
4.带汉字图片解决方案
由于图片中的汉字是以图像形式存在,所以实现简繁图片的显示需要准备简繁两种字体的两种图片。只要配置相关参数,可以实现简体版时显示简体图片,繁体版时显示繁体图片。
例子(简体->繁体):
1. 在XDEVELOP.PROPERTIES中配置IMG_PREFIX=gbimg_:big5img_
2. 将简繁汉字的图片分别保存成gbimg_XXXXX.jpg(gif)和big5img_XXXXX.jpg(gif)
3. 然后在网页中引用<img src="gbimg_XXXXX.jpg">,当简繁通转换到繁体时,会自动转换成<img src="big5img_XXXXX.jpg">,从而显示繁体图片。
5.多媒体负载转移
简繁通只处理HTML(含JSP、ASP、PHP等)、JS、CSS等文本数据,将图片、FLASH、音视频等数据转移给原WEB服务器处理,极大降低了简繁通处理的负载,提高了性能。
6.处理速度
简繁通尽管使用JAVA实现,但非常注重性能。经过多次优化,编码时尽量避免JAVA处理性能较差的字符串和IO处理,转码的算法尤其是词汇转换算法也经多次改进,同时简繁通巧妙地进行了多媒体负载转移处理,将多媒体数据(如图片、FLASH等)转移给原WEB服务器处理,只处理需要转换文本数据,如HTML、JS、CSS等,极大减轻了简繁通转换处理的负载,使性能得到很大提高。
经测试,在普通PC机上(PIII733E+256M)简繁通的转换速度(用静态网页测试,含词汇转换)可达1.8M/S。大多数网站实际都不到10M带宽,而文本数据往往只占不到20%的带宽,1.8M/S的处理足够通常网站的处理需要,因此只需增加原服务器很小的负载即可满足需要,不会成为瓶颈。
7.多级词汇转换
繁简互转,并不是简单的内码转换,要想翻译的准确并且符合习惯,将是一个非常复杂的工作。根据转换的精确性等级,大概可以分成4个等级:
(1). 字符码表一对一映射。 例如发->?、干->?等。但是简繁转换并不是简单的一对一关系,如干在不同上下文,可以分别对应:乾 干 ?,因此该转换不十分准确。
(2). 对于一对多单字,根据词语识别进行转换。例如:头发->??、出发->出?等。例中的?和?在简体中都是发,但在繁体中却不一样,这样的情况很多,如干、里、秋等。
(3). 对词语表达方式差异的转换。简繁体有不同的表达方式,例如:字节->位元?、光盘->光碟、信息->??等。这些表达方式如果不处理,不易理解,尤其是港台不太习惯大陆的表达方式。
(4). 根据上下文的词汇翻译。例如:在中国大陆的语言习惯中,"文件"可以是通常意义上的"文件",也可以是计算机中存取的"文件"(document)。但是,在繁体语言习惯中,这两个东西就是分别用"文件"和"档案"两个词来表达。该转换是最难最耗资源的,只有WORD能在一定程度上实现,速度很慢。
简繁通可以实现高速的3级转换。
8.绝对URL处理
客户端浏览网页时,如果点击类似:http://www.xdevelop.net/works/index.htm的链接,将直接跳出繁体版,简繁通在转换时对此做了相应处理,可以避免跳出。