ANSI与UTF-8转换的问题

zjh 2003-10-09 02:59:09
请问用VB如何将UTF-8转换成Unicode或者是ASCII的字串呢?
...全文
763 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
超级大笨狼 2003-11-08
  • 打赏
  • 举报
回复
我这个是用纯粹的网页脚本做的,不受限制。如果用组件或者API或者VB都要简单多了。
超级大笨狼 2003-11-08
  • 打赏
  • 举报
回复
<HTML>
<HEAD>
<META name=VI60_defaultClientScript content=VBScript>
<META NAME="GENERATOR" Content="Microsoft Visual Studio 6.0">
<TITLE></TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312"></HEAD>
<BODY><pre>
输入:"http://www.google.com/search?hl=en&ie=UTF-8&oe=UTF-8&q=%E5%85%B3%E9%94%AE%E5%AD%97&btnG=Google+Search"
输出:关键字</pre>
<SCRIPT LANGUAGE=vbscript>
<!--

mystr="http://www.google.com/search?hl=en&ie=UTF-8&oe=UTF-8&q=%E5%85%B3%E9%94%AE%E5%AD%97&btnG=Google+Search"

function getutf8(x)
'这个函数是用来得到%号的部分,
'输入条件是""http://www.google.com/search?hl=en&ie=UTF-8&oe=UTF-8&q=%E5%85%B3%E9%94%AE%E5%AD%97&btnG=Google+Search"
A=split(x,"&")'定义一个临时数组
dim i:i=0'临时的指针
for i=0 to ubound(A)
if instr(A(i),"%")>0 then
B=split(A(i),"=")'靠!再定义一个临时数组,省事,浪费内存比浪费我的生命强
getutf8=B(1)
exit for
end if
next
getutf8=right(getutf8,len(getutf8)-1)'去掉左边的%
end function

msgbox U8toU(getutf8(mystr))

function c16to2(x)
'这个函数是用来转换16进制到2进制的,可以是任何长度的,一般转换UTF-8的时候是两个长度,比如A9
'比如:输入“C2”,转化成“11000010”,其中1100是"c"是10进制的12(1100),那么2(10)不足4位要补齐成(0010)。
dim tempstr
dim i:i=0'临时的指针
for i=1 to len(trim(x))
tempstr= c10to2(cint(int("&h" & mid(x,i,1))))
do while len(tempstr)<4
tempstr="0" & tempstr'如果不足4位那么补齐4位数
loop
c16to2=c16to2 & tempstr
next
end function



'document.write hex(asc("字")) & "<br>"

function U8toU(x)
'输入一堆有%分隔的字符串,先分成数组,根据utf8规则来判断补齐规则
'输入:关 E5 85 B3 键 E9 94 AE 字 E5 AD 97
'输出:关 B9D8 键 BCFC 字 D7D6
dim WeiS'要判断第一个编码的位数
dim Unicode'二进制的Unicode码
dim alpha'定义单个字符
A=split(x,"%")'定义一个临时数组
dim i:i=0'临时的指针
dim j:j=0'临时的指针

for i=0 to ubound(A)
A(i)=c16to2(A(i))'第一次循环,先转换成2进制再说

next

for i=0 to ubound(A)-1
WeiS=instr(A(i),"0")'判断第一次出现0的位置,
'可能是1(单字节),3(3-1字节),4,5,6,7不可能是2和大于7
'理论上到7,实际不会超过3。

Unicode=""
for j=1 to WeiS-1
if j=1 then
A(i)=right(A(i),len(A(i))-WeiS)'第一个去掉最左边的WeiS个
Unicode=Unicode & A(i)

else
i=i+1
A(i)=right(A(i),len(A(i))-2)'其余去掉最左边的两个
Unicode=Unicode & A(i)
end if

next
U8toU=U8toU & chrw(int("&H" & c2to16(Unicode)))'总算完了,妈的!!


next

end function
'msgbox c2to16("11100101")

function c2to16(x)
'2进制到16进制的转换,每4个0或1转换成一个16进制字母,输入长度当然不可能不是4的倍数了

dim i:i=1'临时的指针
for i=1 to len(x) step 4
c2to16=c2to16 & hex(c2to10(mid(x,i,4)))
next
end function

function c2to10(x)
'单纯的2进制到10进制的转换,不考虑转16进制所需要的4位前零补齐。
'因为这个函数很有用!以后也会用到,做过通讯和硬件的人应该知道。
'这里用字符串代表二进制
dim mysign :mysign=sgn(cint(x))'定义mysign这个东西,首先判断正负符号
x=abs(cint(int(x)))
c2to10=0
if x="0" then exit function'如果是0的话直接得0就完事
dim i:i=0'临时的指针
for i= 0 to len(x) -1'否则利用8421码计算,这个从我最开始学计算机的时候就会,好怀念当初教我们的谢道建老先生啊!
if mid(x,len(x)-i,1)="1" then c2to10=c2to10+2^(i)
next
if mysign=-1 then c2to10=-1 * c2to10'加上正负符号
end function


function c10to2(x)'10进制到2进制的转换
'这个函数在计算16位到2位转换时候用到了,
'没有做在16位里面是因为这个函数只是单纯10-2转换,不涉及16进制由4个2进制补齐空位,将来可以用到任何地方
'比如输入2,输出“10”而不是“0010”
'首先判断正负符号
dim mysign:mysign=sgn(x)'定义一个符号标记
x=abs(x)
'然后判断有几位,至少一位
dim WeiS:WeiS=1
do
if x<2^WeiS then
exit do
else
WeiS=WeiS+1
end if
loop
dim tempnum:tempnum=x'定义一个临时的数字
dim i:i=0'临时的指针
for i= WeiS to 1 step-1
if tempnum>=2^(i-1) then
tempnum=tempnum-2^(i-1)
c10to2=c10to2 & "1"
else
c10to2=c10to2 & "0"
end if
next
if mysign=-1 then c10to2="-" & c10to2'加上正负符号
end function


-->
</SCRIPT>
</BODY>
</HTML>
zjh 2003-10-10
  • 打赏
  • 举报
回复
有人知道吗?
或者提供一些资料也行啊!
zjh 2003-10-09
  • 打赏
  • 举报
回复
有人帮忙解答吗?我又加多了10分。
zjh 2003-10-09
  • 打赏
  • 举报
回复
呵呵!但是源字串是UTF-8时,我应该用哪个参数呢?
射天狼 2003-10-09
  • 打赏
  • 举报
回复
StrConv 函数

返回按指定类型转换的 Variant (String)。

语法

StrConv(string, conversion)

StrConv 函数的语法有下面的命名参数:

部分 说明
string 必要参数。要转换的字符串表达式。
conversion 必要参数:Integer。其值的和决定转换的类型。
设置值

conversion 参数的设置值为:

常数 值 说明

vbUpperCase 1 将字符串文字转成大写。
vbLowerCase 2 将字符串文字转成小写。
vbProperCase 3 将字符串中每个字的开头字母转成大写。
vbWide* 4* 将字符串中单字节字符转成双字节字符。
vbNarrow* 8* 将字符串中双字节字符转成单字节字符。
vbKatakana** 16** 将字符串中平假名字符转成片假名字符。
vbHiragana** 32** 将字符串中片假名字符转成平假名字符。
vbUnicode 64 根据系统的缺省码页将字符串转成 Unicode。
vbFromUnicode 128 将字符串由 Unicode 转成系统的缺省码页。
* 应用到远东地区。
** 仅应用到日本。

注意 这些常数是由 VBA 指定的。可以在程序中使用它们来替换真正的值。其中大部分是可以组合的,例如 vbUpperCase + vbWide,互斥的常数不能组合,例如 vbUnicode + vbFromUnicode。当在不适用的区域使用常数 vbWide、vbNarrow、vbKatakana,和 vbHiragana 时,就会导致运行时错误。

下面是一些一般情况下的有效分界符:Null (Chr$(0)),水平制表符 (Chr$(9)),换行 (Chr$(10)),垂直制表符 (Chr$(11)),换页 (Chr$(12)) ,回车 (Chr$(13)),空白 (SBCS) (Chr$(32))。在 DBCS 中,空白的实际值会随国家/地区而不同。

7,759

社区成员

发帖
与我相关
我的任务
社区描述
VB 基础类
社区管理员
  • VB基础类社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧