社区
C#
帖子详情
问一个字符编码的问题
xiezuming
2003-11-29 10:21:08
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容
然后用htmlDocument.body.innerHTML得到了这个页面的内容
但是把它存到文件里的时候,所有的中文都是乱码
但是用editplus打开后 再另存为一个文件就好了
想知道如果用c#怎样把它转换过来?
谢谢
...全文
55
8
打赏
收藏
问一个字符编码的问题
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容 然后用htmlDocument.body.innerHTML得到了这个页面的内容 但是把它存到文件里的时候,所有的中文都是乱码 但是用editplus打开后 再另存为一个文件就好了 想知道如果用c#怎样把它转换过来? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
oop2000
2003-12-01
打赏
举报
回复
using System.IO;
using System.Text;
//解码
private void butEncodeorDecode_Click(object sender, System.EventArgs e)
{
this.Cursor=Cursors.WaitCursor;
try
{
string filename=@"F:\Test.htm";
FileStream Fs = new FileStream(filename, FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)Fs.Length];
int len = Fs.Read(bb, 0, bb.Length);
String str =Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
this.Cursor=Cursors.Default;
MessageBox.Show(str);
}
catch(Exception ex)
{
this.Cursor=Cursors.Default;
MessageBox.Show(ex.Message);
}
}
joachern
2003-12-01
打赏
举报
回复
楼上
gujianxin
2003-12-01
打赏
举报
回复
1, web.config 中加入
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
你的程序就会使用正确的字符集,
2
System.Text.GetEncoding("gb2312").GetString(System.Text.Encoding.GetByte(str))
问题原因:.net 默认字符集是Utf8,而我们的页面一般是gb2312,所以要进行转化,
piziliu2003
2003-12-01
打赏
举报
回复
FileStream fs = new FileStream("filename", FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)fs.Length];
int len = fs.Read(bb, 0, bb.Length);
String str = Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
piziliu2003
2003-12-01
打赏
举报
回复
byte[] array = new byte[2];
string str =textBox2.Text;
string s1 = str.Substring(0,2);
string s2 = str.Substring(2,2);
int t1 = Convert.ToInt32(s1,16);
int t2 = Convert.ToInt32(s2,16);
array[0] = (byte)t1;
array[1] = (byte)t2;
string s = System.Text.Encoding.Default.GetString(array);
textBox1.Text=s;
速马
2003-11-30
打赏
举报
回复
System.Text.Encoding.xxx.GetString(System.Text.Encoding.yyy.GetByte(str))
xxx和yyy是什么要看你的string用什么编码的了
八爪鱼-杭州
2003-11-30
打赏
举报
回复
System.Text.Encoding
xiezuming
2003-11-29
打赏
举报
回复
upup
给定一个字符串,如何转换编码方式啊?
Python 47个
字符
串方法
如果是,来学学本课程吧,本课程以讲解官网文档的方式,讲解 Python 47个
字符
串方法,涉及替换、删除、连接、查找、分割、格式化、
编码
、转换等
字符
串操作,带同学们系统学习 Python
字符
串方法。 &...
字符
集与
字符
编码
字符
集是多个
字符
的集合,可以理解为二进制数,与
字符
的映射关系,唯一的
一个
编号就代表
一个
字。
字符
编码
是计算机中对
字符
的表示方式。
字符
集与
字符
编码
可以这样区分: 1.
字符
集是书写系统字母与符号的集合。 2....
C++与
字符
集、
字符
编码
字符
编码
字符
集与
字符
编码
的关系 多种
字符
编码
存在的意义
字符
编码
的发展历史 活动代码页 c++的多字节
字符
与宽字节
字符
c++的多字节
字符
串与宽字节
字符
串 C++程序输出
字符
串的
编码
字符
串常量 参考文章 ...
字符
编码
。
字符
编码
(Character Encoding):
字符
编码
是指一种映射规则,根据这个映射规则可以将 某个
字符
映射成其他形式的数据以便在计算机中存储和传输。 例如ASCII
字符
编码
规定使用 单字节中低位的7个比特去
编码
所有的
字符
...
常见的
字符
编码
表
常见
字符
编码
表 ASCII码 —ASCII
编码
表由
一个
字节表示,128个
字符
,实际上
一个
字节可以表示256个
字符
。 Unicode—Unicode
编码
表是固定大小的
编码
,使用两个字节来表示
字符
,字母和汉字统一都是占用两个字节,容易...
C#
110,566
社区成员
642,567
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章