.net如何自动判断乱码

xuyl_gc 2014-03-13 11:46:02

我的网站http://www.zykwd.cn/taokejiayuan/post.aspx 自动获取其他网站内容,但是有时候会乱码,挺郁闷
谁能帮我提供下如何判断乱码,乱码之后怎么自动转码的功能,谢谢大家
...全文
217 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
md5e 2014-03-13
  • 打赏
  • 举报
回复
要根据对方网站的编码进行采集
xuyl_gc 2014-03-13
  • 打赏
  • 举报
回复
下面获取后显示乱码的页面 http://www.zykwd.cn/taokejiayuan/186.html
xuyl_gc 2014-03-13
  • 打赏
  • 举报
回复
有这两种格式 <meta charset="gbk"> <meta http-equiv="Content-Type" content="text/html;charset=gbk"/>
xuyl_gc 2014-03-13
  • 打赏
  • 举报
回复
回去试试
md5e 2014-03-13
  • 打赏
  • 举报
回复
// 获取网页的HTML内容,根据网页的charset自动判断Encoding public string GetHtml(string url) { return GetHtml(url, null); }
md5e 2014-03-13
  • 打赏
  • 举报
回复
以前收录的一段代码

        // 获取网页的HTML内容,指定Encoding   
        public string GetHtml(string url, Encoding encoding)   
        {    
            byte[] buf = new WebClient().DownloadData(url);
            if (encoding != null) return encoding.GetString(buf);     
            string html = Encoding.UTF8.GetString(buf);     
            encoding = GetEncoding(html);     
            if (encoding == null || encoding == Encoding.UTF8) return html;     
            return encoding.GetString(buf);   
        }     
        // 根据网页的HTML内容提取网页的Encoding   
        public Encoding GetEncoding(string html)   
        {     
            string pattern = @"(?i)\bcharset=(?<charset>[-a-zA-Z_0-9]+)";     
            string charset = Regex.Match(html, pattern).Groups["charset"].Value;     
            try { 
                return Encoding.GetEncoding(charset);
            }     
            catch (ArgumentException) {
                return null; 
            }   
        } 
M依然 2014-03-13
  • 打赏
  • 举报
回复
一般来说。只能通过 页面 ,meta 的编码来进行操作。自动判断页面内部乱码应该不行

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧