社区
C#
帖子详情
问一个字符编码的问题
xiezuming
2003-11-29 10:21:08
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容
然后用htmlDocument.body.innerHTML得到了这个页面的内容
但是把它存到文件里的时候,所有的中文都是乱码
但是用editplus打开后 再另存为一个文件就好了
想知道如果用c#怎样把它转换过来?
谢谢
...全文
60
8
打赏
收藏
问一个字符编码的问题
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容 然后用htmlDocument.body.innerHTML得到了这个页面的内容 但是把它存到文件里的时候,所有的中文都是乱码 但是用editplus打开后 再另存为一个文件就好了 想知道如果用c#怎样把它转换过来? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
oop2000
2003-12-01
打赏
举报
回复
using System.IO;
using System.Text;
//解码
private void butEncodeorDecode_Click(object sender, System.EventArgs e)
{
this.Cursor=Cursors.WaitCursor;
try
{
string filename=@"F:\Test.htm";
FileStream Fs = new FileStream(filename, FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)Fs.Length];
int len = Fs.Read(bb, 0, bb.Length);
String str =Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
this.Cursor=Cursors.Default;
MessageBox.Show(str);
}
catch(Exception ex)
{
this.Cursor=Cursors.Default;
MessageBox.Show(ex.Message);
}
}
joachern
2003-12-01
打赏
举报
回复
楼上
gujianxin
2003-12-01
打赏
举报
回复
1, web.config 中加入
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
你的程序就会使用正确的字符集,
2
System.Text.GetEncoding("gb2312").GetString(System.Text.Encoding.GetByte(str))
问题原因:.net 默认字符集是Utf8,而我们的页面一般是gb2312,所以要进行转化,
piziliu2003
2003-12-01
打赏
举报
回复
FileStream fs = new FileStream("filename", FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)fs.Length];
int len = fs.Read(bb, 0, bb.Length);
String str = Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
piziliu2003
2003-12-01
打赏
举报
回复
byte[] array = new byte[2];
string str =textBox2.Text;
string s1 = str.Substring(0,2);
string s2 = str.Substring(2,2);
int t1 = Convert.ToInt32(s1,16);
int t2 = Convert.ToInt32(s2,16);
array[0] = (byte)t1;
array[1] = (byte)t2;
string s = System.Text.Encoding.Default.GetString(array);
textBox1.Text=s;
速马
2003-11-30
打赏
举报
回复
System.Text.Encoding.xxx.GetString(System.Text.Encoding.yyy.GetByte(str))
xxx和yyy是什么要看你的string用什么编码的了
八爪鱼-杭州
2003-11-30
打赏
举报
回复
System.Text.Encoding
xiezuming
2003-11-29
打赏
举报
回复
upup
给定一个字符串,如何转换编码方式啊?
emoji图片和
编码
表
1. **Unicode
编码
**:Unicode是国际通用的
字符
集标准,它为每个
字符
分配了
一个
唯一的数字,称为码点。对于emoji,Unicode
编码
是它们在计算机中存储和传输的基础。例如,笑脸 emoji `` 在Unicode中的码点是 U+1F60A。...
java base64的jar包
Java Base64是
一个
用于处理Base64
编码
的库,它为Java开发者提供了便捷的方式来
编码
和解码Base64数据。Base64是一种在网络上传输二进制数据时常用的
编码
方式,因为HTTP、电子邮件等协议主要处理ASCII
字符
,而Base64...
字库表、
编码
字符
集、
字符
编码
参考文章: 1、十分钟搞清
字符
集和
字符
编码
...
编码
字符
集(coded character set):即用
一个
编码
值 code point 来表示
一个
字符
在字库中的位置,从而来表示
一个
字符
。
字符
编码
:将
编码
字符
集和实际存储数值之间的...
字符
集与
字符
编码
字符
集和
字符
编码
一直是
一个
让人头疼的
问
题
,我们经常在访
问
某些网站或者打开某些文件的时候,会显示乱码。归根到底,就是
字符
编码
的
问
题
。今天,我就跟大家好好聊聊
字符
编码
!
字符
集和
字符
编码
字符
集
字符
集...
java 设置
字符
编码
_java中的
字符
编码
方式
2. 几种
字符
编码
的方式1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为
一个
二进制的
字符
串。每
一个
二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为
一个
字节(byte)。也...
C#
111,112
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章