可能是很难的问题, 如何判断一段字符串是否为UTF-8编码的?

bb2003 2005-07-13 04:53:09
请注意是UTF-8, 不是Unicode,
字符串中可能含有几种文字, 如: 英文+西欧语言+中文, 等等
有现成的API判断吗?
...全文
264 9 打赏 收藏 转发到动态 举报
写回复
用AI写文章
9 条回复
切换为时间正序
请发表友善的回复…
发表回复
crystal_heart 2005-07-29
  • 打赏
  • 举报
回复
真是一代不如一代
crystal_heart 2005-07-29
  • 打赏
  • 举报
回复
http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html

A composite approach to language/encoding detection


Shanjian Li (shanjian@netscape.com)
Katsuhiko Momoi (momoi@netscape.com)
Netscape Communications Corp.

[Note: This paper was originally presented at the 19th International Unicode Conference (San Jose). Since then the implementation has gone through a period of real world usage and we made many improvements along the way. A major change is that we now use positive sequences to detect single byte charsets, c.f. Sections 4.7 and 4.7.1. This paper was written when the universal charset detection code was not part of the Mozilla main source. (See Section 8). Since then, the code was checked into the tree. For more updated implementation, see our open source code at Mozilla Source Tree. - The authors. 2002-11-25.]

crystal_heart 2005-07-29
  • 打赏
  • 举报
回复
开玩笑
bb2003 2005-07-28
  • 打赏
  • 举报
回复
up
bb2003 2005-07-15
  • 打赏
  • 举报
回复
up
Kudeet 2005-07-13
  • 打赏
  • 举报
回复
http://community.csdn.net/Expert/FAQ/FAQ_Index.asp?id=191432

GZ
masterz 2005-07-13
  • 打赏
  • 举报
回复
use MultiByteToWideChar(CP_UTF8,MB_ERR_INVALID_CHARS,...);
如果没有出错,就认为这个字符串是UTF8编码
morning550 2005-07-13
  • 打赏
  • 举报
回复
int iswctype(wint_t c, wctype_t category);
The function returns nonzero if c is any character in the category category. The value of category must have been returned by an earlier successful call to wctype.

category 由 wctype(const char *property)函数返回!property中是UTF-8字库!

sky 2005-07-13
  • 打赏
  • 举报
回复
应该没有现在的API,不过,自己写一个也没多难吧。

不就是四个字节了嘛。
数据驱动的两阶段分布鲁棒(1-范数和∞-范数约束)的电热综合能源系统研究(Matlab代码实现)内容概要:本文围绕“数据驱动的两阶段分布鲁棒(1-范数和∞-范数约束)的电热综合能源系统研究”展开,提出了一种结合数据驱动与分布鲁棒优化方法的建模框架,用于解决电热综合能源系统在不确定性环境下的优化调度问题。研究采用两阶段优化结构,第一阶段进行预决策,第二阶段根据实际场景进行调整,通过引入1-范数和∞-范数约束来构建不确定集,有效刻画风电、负荷等不确定性变量的波动特性,提升模型的鲁棒性和实用性。文中提供了完整的Matlab代码实现,便于读者复现和验证算法性能,并结合具体案例分析了不同约束条件下系统运行的经济性与可靠性。; 适合人群:具备一定电力系统、优化理论和Matlab编程基础的研究生、科研人员及工程技术人员,尤其适合从事综合能源系统、鲁棒优化、不确定性建模等相关领域研究的专业人士。; 使用场景及目标:①掌握数据驱动的分布鲁棒优化方法在综合能源系统中的应用;②理解1-范数和∞-范数在构建不确定集中的作用与差异;③学习两阶段鲁棒优化模型的建模思路与Matlab实现技巧,用于科研复现、论文写作或工程项目建模。; 阅读建议:建议读者结合提供的Matlab代码逐段理解算法实现细节,重点关注不确定集构建、两阶段模型结构设计及求解器调用方式,同时可尝试更换数据或调整约束参数以加深对模型鲁棒性的理解。

18,358

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 网络编程
c++c语言开发语言 技术论坛(原bbs)
社区管理员
  • 网络编程
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧