社区
C#
帖子详情
问一个字符编码的问题
xiezuming
2003-11-29 10:21:08
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容
然后用htmlDocument.body.innerHTML得到了这个页面的内容
但是把它存到文件里的时候,所有的中文都是乱码
但是用editplus打开后 再另存为一个文件就好了
想知道如果用c#怎样把它转换过来?
谢谢
...全文
75
8
打赏
收藏
问一个字符编码的问题
我用htmlDocument.createDocumentFromUrl读取了一个URL的内容 然后用htmlDocument.body.innerHTML得到了这个页面的内容 但是把它存到文件里的时候,所有的中文都是乱码 但是用editplus打开后 再另存为一个文件就好了 想知道如果用c#怎样把它转换过来? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
oop2000
2003-12-01
打赏
举报
回复
using System.IO;
using System.Text;
//解码
private void butEncodeorDecode_Click(object sender, System.EventArgs e)
{
this.Cursor=Cursors.WaitCursor;
try
{
string filename=@"F:\Test.htm";
FileStream Fs = new FileStream(filename, FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)Fs.Length];
int len = Fs.Read(bb, 0, bb.Length);
String str =Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
this.Cursor=Cursors.Default;
MessageBox.Show(str);
}
catch(Exception ex)
{
this.Cursor=Cursors.Default;
MessageBox.Show(ex.Message);
}
}
joachern
2003-12-01
打赏
举报
回复
楼上
gujianxin
2003-12-01
打赏
举报
回复
1, web.config 中加入
<globalization requestEncoding="gb2312" responseEncoding="gb2312" />
你的程序就会使用正确的字符集,
2
System.Text.GetEncoding("gb2312").GetString(System.Text.Encoding.GetByte(str))
问题原因:.net 默认字符集是Utf8,而我们的页面一般是gb2312,所以要进行转化,
piziliu2003
2003-12-01
打赏
举报
回复
FileStream fs = new FileStream("filename", FileMode.Open, FileAccess.Read);
byte[] bb = new byte[(int)fs.Length];
int len = fs.Read(bb, 0, bb.Length);
String str = Encoding.GetEncoding("gb2312").GetString(bb, 0, len);
piziliu2003
2003-12-01
打赏
举报
回复
byte[] array = new byte[2];
string str =textBox2.Text;
string s1 = str.Substring(0,2);
string s2 = str.Substring(2,2);
int t1 = Convert.ToInt32(s1,16);
int t2 = Convert.ToInt32(s2,16);
array[0] = (byte)t1;
array[1] = (byte)t2;
string s = System.Text.Encoding.Default.GetString(array);
textBox1.Text=s;
速马
2003-11-30
打赏
举报
回复
System.Text.Encoding.xxx.GetString(System.Text.Encoding.yyy.GetByte(str))
xxx和yyy是什么要看你的string用什么编码的了
八爪鱼-杭州
2003-11-30
打赏
举报
回复
System.Text.Encoding
xiezuming
2003-11-29
打赏
举报
回复
upup
给定一个字符串,如何转换编码方式啊?
字符
编码
问
题
总结(来源网上)
本文深入浅出地介绍了
字符
编码
的发展历程,从最早的ASCII
编码
到Unicode的出现,再到为节省存储空间而诞生的UTF-8
编码
。揭示了不同
编码
方式间的转换机制及应用场景。
通义千
问
3-4B输出乱码?
字符
编码
问
题
排查实战指南
本文针对通义千
问
3-4B模型输出乱码
问
题
,系统梳理
字符
编码
故障的五层定位机制,涵盖Ollama、vLLM及transformers三种主流部署方式的修复方案,并强调终端/IDE
编码
设置、tokenizer正确加载与decode后处理等关键技术点,提供可立即验证的黄金四步排查法。
字符
编码
的
问
题
本文深入探讨了ASCII、GBK、Unicode及UTF-8等常见
字符
编码
格式的起源、区别及应用场景,详细解释了不同
编码
格式产生的原因及它们如何解决乱码
问
题
,同时介绍了计算机系统在内存、传输和保存时的通用
字符
编码
工作方式。
Java中
字符
编码
问
题
的解决方法
本文聚焦Java开发中
字符
编码
问
题
,阐述了平台兼容性、文件读写、网络传输、数据库操作等常见
问
题
导致的乱码现象,详细介绍了统一
编码
格式、设置JVM默认
编码
、正确处理异常、使用第三方库等解决策略,以提升程序兼容性与可靠性。
一个
关于Unicode
字符
编码
的奇怪
问
题
本文解析了Unicode
字符
编码
在不同计算机体系结构中的表现差异,特别是UTF-16
编码
在Little-Endian和Big-Endian体系下的字节顺序及BOM标记的作用。
C#
111,132
社区成员
642,541
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章