社区
C#
帖子详情
问一个字符编码的问题
xiezuming
2003-11-29 10:21:08
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容
然后用htmlDocument.body.innerHTML得到了这个页面的内容
但是把它存到文件里的时候,所有的中文都是乱码
但是用editplus打开后 再另存为一个文件就好了
想知道如果用c#怎样把它转换过来?
谢谢
...全文
57
8
打赏
收藏
问一个字符编码的问题
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容 然后用htmlDocument.body.innerHTML得到了这个页面的内容 但是把它存到文件里的时候,所有的中文都是乱码 但是用editplus打开后 再另存为一个文件就好了 想知道如果用c#怎样把它转换过来? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
oop2000
2003-12-01
打赏
举报
回复
using System.IO;
using System.Text;
//解码
private void butEncodeorDecode_Click(object sender, System.EventArgs e)
{
this.Cursor=Cursors.WaitCursor;
try
{
string filename=@"F:\Test.htm";
FileStream Fs = new FileStream(filename, FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)Fs.Length];
int len = Fs.Read(bb, 0, bb.Length);
String str =Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
this.Cursor=Cursors.Default;
MessageBox.Show(str);
}
catch(Exception ex)
{
this.Cursor=Cursors.Default;
MessageBox.Show(ex.Message);
}
}
joachern
2003-12-01
打赏
举报
回复
楼上
gujianxin
2003-12-01
打赏
举报
回复
1, web.config 中加入
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
你的程序就会使用正确的字符集,
2
System.Text.GetEncoding("gb2312").GetString(System.Text.Encoding.GetByte(str))
问题原因:.net 默认字符集是Utf8,而我们的页面一般是gb2312,所以要进行转化,
piziliu2003
2003-12-01
打赏
举报
回复
FileStream fs = new FileStream("filename", FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)fs.Length];
int len = fs.Read(bb, 0, bb.Length);
String str = Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
piziliu2003
2003-12-01
打赏
举报
回复
byte[] array = new byte[2];
string str =textBox2.Text;
string s1 = str.Substring(0,2);
string s2 = str.Substring(2,2);
int t1 = Convert.ToInt32(s1,16);
int t2 = Convert.ToInt32(s2,16);
array[0] = (byte)t1;
array[1] = (byte)t2;
string s = System.Text.Encoding.Default.GetString(array);
textBox1.Text=s;
速马
2003-11-30
打赏
举报
回复
System.Text.Encoding.xxx.GetString(System.Text.Encoding.yyy.GetByte(str))
xxx和yyy是什么要看你的string用什么编码的了
八爪鱼-杭州
2003-11-30
打赏
举报
回复
System.Text.Encoding
xiezuming
2003-11-29
打赏
举报
回复
upup
给定一个字符串,如何转换编码方式啊?
emoji图片和
编码
表
1. **Unicode
编码
**:Unicode是国际通用的
字符
集标准,它为每个
字符
分配了
一个
唯一的数字,称为码点。对于emoji,Unicode
编码
是它们在计算机中存储和传输的基础。例如,笑脸 emoji `` 在Unicode中的码点是 U+1F60A。...
Java Web开发常见
问
题
.pdf
在Java Web开发过程中,中文乱码
问
题
是开发者经常遇到的
一个
挑战。这些
问
题
主要源于Java默认的Unicode
编码
与HTML页面及表单默认的Latin-1
编码
之间的不兼容,以及在不同的环境中(如服务器、数据库、浏览器)使用了...
java base64的jar包
Java Base64是
一个
用于处理Base64
编码
的库,它为Java开发者提供了便捷的方式来
编码
和解码Base64数据。Base64是一种在网络上传输二进制数据时常用的
编码
方式,因为HTTP、电子邮件等协议主要处理ASCII
字符
,而Base64...
java 设置
字符
编码
_java中的
字符
编码
方式
2. 几种
字符
编码
的方式1. ASCII码我们知道,在计算机内部,所有的信息最终都表示为
一个
二进制的
字符
串。每
一个
二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为
一个
字节(byte)。也...
使用Filter过滤器解决
字符
编码
问
题
Java中的
字符
编码
,默认为:ISO-8859-1(西方
编码
)。这种
编码
方式为单字节码,只支持英文、俄文、葡萄牙文等乱七八糟文,不支持中文。因此,我们需要对JSP页面或者Servlet中进行
字符
编码
集的处理,国际
编码
(UTF-8...
C#
111,097
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章