社区
C#
帖子详情
问一个字符编码的问题
xiezuming
2003-11-29 10:21:08
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容
然后用htmlDocument.body.innerHTML得到了这个页面的内容
但是把它存到文件里的时候,所有的中文都是乱码
但是用editplus打开后 再另存为一个文件就好了
想知道如果用c#怎样把它转换过来?
谢谢
...全文
70
8
打赏
收藏
问一个字符编码的问题
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容 然后用htmlDocument.body.innerHTML得到了这个页面的内容 但是把它存到文件里的时候,所有的中文都是乱码 但是用editplus打开后 再另存为一个文件就好了 想知道如果用c#怎样把它转换过来? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
oop2000
2003-12-01
打赏
举报
回复
using System.IO;
using System.Text;
//解码
private void butEncodeorDecode_Click(object sender, System.EventArgs e)
{
this.Cursor=Cursors.WaitCursor;
try
{
string filename=@"F:\Test.htm";
FileStream Fs = new FileStream(filename, FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)Fs.Length];
int len = Fs.Read(bb, 0, bb.Length);
String str =Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
this.Cursor=Cursors.Default;
MessageBox.Show(str);
}
catch(Exception ex)
{
this.Cursor=Cursors.Default;
MessageBox.Show(ex.Message);
}
}
joachern
2003-12-01
打赏
举报
回复
楼上
gujianxin
2003-12-01
打赏
举报
回复
1, web.config 中加入
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
你的程序就会使用正确的字符集,
2
System.Text.GetEncoding("gb2312").GetString(System.Text.Encoding.GetByte(str))
问题原因:.net 默认字符集是Utf8,而我们的页面一般是gb2312,所以要进行转化,
piziliu2003
2003-12-01
打赏
举报
回复
FileStream fs = new FileStream("filename", FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)fs.Length];
int len = fs.Read(bb, 0, bb.Length);
String str = Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
piziliu2003
2003-12-01
打赏
举报
回复
byte[] array = new byte[2];
string str =textBox2.Text;
string s1 = str.Substring(0,2);
string s2 = str.Substring(2,2);
int t1 = Convert.ToInt32(s1,16);
int t2 = Convert.ToInt32(s2,16);
array[0] = (byte)t1;
array[1] = (byte)t2;
string s = System.Text.Encoding.Default.GetString(array);
textBox1.Text=s;
速马
2003-11-30
打赏
举报
回复
System.Text.Encoding.xxx.GetString(System.Text.Encoding.yyy.GetByte(str))
xxx和yyy是什么要看你的string用什么编码的了
八爪鱼-杭州
2003-11-30
打赏
举报
回复
System.Text.Encoding
xiezuming
2003-11-29
打赏
举报
回复
upup
给定一个字符串,如何转换编码方式啊?
emoji图片和
编码
表
1. **Unicode
编码
**:Unicode是国际通用的
字符
集标准,它为每个
字符
分配了
一个
唯一的数字,称为码点。对于emoji,Unicode
编码
是它们在计算机中存储和传输的基础。例如,笑脸 emoji `` 在Unicode中的码点是 U+1F60A。...
java base64的jar包
Java Base64是
一个
用于处理Base64
编码
的库,它为Java开发者提供了便捷的方式来
编码
和解码Base64数据。Base64是一种在网络上传输二进制数据时常用的
编码
方式,因为HTTP、电子邮件等协议主要处理ASCII
字符
,而Base64...
C语言
编码
与
字符
转换
多字节
字符
编码
:用
一个
字节表示数字、字母,用多个字节表示其它
字符
(汉字两个字节)。
字符
长度定义:
一个
字节为
一个
字符
长度。 宽字节
字符
编码
(UNICODE):全部用两个字节表示
字符
。
字符
长度定义:两个字节为一...
JS
字符
串
编码
问
题
每个16位的序列都是
一个
码元,表示
一个
字符
。但随着Unicode引入了扩展
字符
集,16位的
字符
编码
便不再够用了(UTF-16 是变长的
字符
编码
方式,有 16 位与 32 位两种情况。 JS 原先使用的则是固定 16 位(双字节)的
字符
...
java获取
字符
的
编码
_java获取文本文件
字符
编码
的方法
java获取文本文件
字符
编码
的方法发布时间:2020-06-16 09:56:08来源:亿速云阅读:386作者:Leah这篇文章将为大家详细讲解有关java获取文本文件
字符
编码
的方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家...
C#
111,124
社区成员
642,537
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章