宽字符集的MFC

qq_37834095 2019-05-15 09:06:04

大家好，我有个int[ x]数组，这个数组长度还不确定最长有10个成员，里面的内容是16进制数据；要求把它转换成CString类型的字符串呀，我可以把它遍历出来但是不知道怎么来拼接他们

或者各位有更好的办法，谢谢，指导

...全文

102 6 打赏收藏转发到动态举报

写回复

用AI写文章

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

qq_37834095 2019-05-17

打赏
举报

恩，这个也不错，我用的 _stprintf

Eleven 2019-05-17

打赏
举报

int X[..];
for(size_t i = 0; i != nLength; ++i)
strText.AppendFormat(TEXT("%02X"), X[i]);

zgl7903 2019-05-16

打赏
举报

可以使用CString 的+操作

CString strOut;
for(int i=0; i<Nums; i++)
{
  CString s;
  s.Format(_T("%d,"), dt[i]);
  strOut += s;
}

qq_37834095 2019-05-16

打赏
举报

我有 8个这样的CString的字符串啊，用+的话，会报错啊，说是超过3个重载。。

schlafenhamster 2019-05-16

打赏
举报

CString + ，要保证至少一个是 CString

也可以用 strcat

qq_37834095 2019-05-16

打赏
举报

恩，对的，我后来用了+，但是又很多个组呀，最多只可以用2个+啊

VS2008 opencv MFC 计算米粒的个数及最大米粒的面积及周长有个问题，因为 const char * 和 LPCTSTR 的转换，还是不是很清楚，只生成了debug 版本，Release 不通过。 debug版本中只要如何将LPCTSTR转换为const char * ？？项目--属性--配置属性--字符集 改为使用多字节居然可以这么简单~~~【LPCTSTR 1、在非UNICODE环境下为 const char * 2、在UNICODE环境下为 const unsigned short * so，需要将宽字符转换为多字节】

【分享一下】里面内容很多。。觉得好就下吧 Cmarkup是依据EDOM的，这是这个简单XML分析的关键。EDOM是操作XML元素、属性和数据的简明方法集。当你不需要复杂的XML特性时，它避免你读大量的DOM和SAX文档。如果你希望使用微软的MSXML，CMarkup工程中CmarkupMSXML类全面的演示了通过EDOM来使用MSXML，并且它是以C++ COM语法开始。下面列出了CMarkup的特征：独立：不需要任何外部的XML组件。小：编译到你的工程只是很小的一个类，并且对于文档只维持了一个字符串，以及一个总计小于字符串内存大小的索引数组。快：分析器在相当快的建立索引数组。简单：EDOM方法使创建、导航和修改ＸＭＬ无比的简单。 MSXML：CMarkupMSXML类用EDOM方法包装了微软的XML服务。MSXML编译选项用来演示这个类。 UNICODE（统一字符编码标准）：对于WindowsNT和WindowsCE平台能够被编译成UNICODE，在WindowsNT UNICODE下，XML文档是流到UTF-8文件中，但是内部用宽字符。 UTF-8：对于UTF-8文件，这接受和返回UTF-8字符串（确保_MBCS没有被定义） MBCS：对于双字节数据（定义_MBCS），它不与UTF-8兼容. STL：CMarkupSTL类完全没有使用MFC，它的演示要使用STL编译选项。

创建一个新的XML文档，分析修改现存的XML文档，所有的这些都中可以从一个利用MFC或STL字符串所实现的一个简单类的方法中得到。关于CMarkup，你可以运行Zip文件右边的例子，如果你愿意，你可以通过看源码，几分钟把它加入到你自己的应用中。特征 Cmarkup是依据EDOM的，这是这个简单XML分析的关键。EDOM是操作XML元素、属性和数据的简明方法集。当你不需要复杂的XML特性时，它避免你读大量的DOM和SAX文档。如果你希望使用微软的MSXML，CMarkup工程中CmarkupMSXML类全面的演示了通过EDOM来使用MSXML，并且它是以C++ COM语法开始。下载包（看上面zip文件的链接）中包含了测试对话框工程的源码、Cmarkup类的所有测试和示例、以及编译选项。关于用在商业用途中的详细说明请看文章底部的在Licensing中的注意事项。下面列出了CMarkup的特征：独立：不需要任何外部的XML组件。小：编译到你的工程只是很小的一个类，并且对于文档只维持了一个字符串，以及一个总计小于字符串内存大小的索引数组。快：分析器在相当快的建立索引数组。简单：EDOM方法使创建、导航和修改ＸＭＬ无比的简单。 MSXML：CMarkupMSXML类用EDOM方法包装了微软的XML服务。MSXML编译选项用来演示这个类。 UNICODE（统一字符编码标准）：对于WindowsNT和WindowsCE平台能够被编译成UNICODE，在WindowsNT UNICODE下，XML文档是流到UTF-8文件中，但是内部用宽字符。 UTF-8：对于UTF-8文件，这接受和返回UTF-8字符串（确保_MBCS没有被定义） MBCS：对于双字节数据（定义_MBCS），它不与UTF-8兼容. STL：CMarkupSTL类完全没有使用MFC，它的演示要使用STL编译选项。

本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中，出现的汉字显示字体。Ocr的中文含意是光学字符识别。为什么叫Mini呢？因为现有的识别汉字的商业Ocr软件，动辄二三十兆，而本软件解压后，也不过三兆多，身材比较纤小，再加上本软件主要用于识别字体比较小的汉字，所以叫Mini，中文的发音是“迷你”，中文含义是超小型。既然有了商业Ocr软件，为什么还要开发这个软件？不同于商业Ocr软件，本软件是免费的，可以自由使用。第二个不同之处，本软件的识别对象是屏幕出现的“显示汉字”，而不是针对扫描仪扫出来的“打印汉字”。二者有什么不同呢？最重要的一点：扫描出来的打印汉字的高度和宽度一般都在30多个像素点之上，这是我用画图软件，打开某个商业Ocr的samples\sample1.tif，然后一点一点数出来的。从文件名和目录名的中文含意可以看出，这个点数应该是一个典型值。那么，如果用商业Ocr识别屏幕上出现的小五号字，汉字的高度是12个像素点，会出现什么情况呢？测试方法：用记事本随便写几行汉字，设置字体为小五号字。这大概是看着还算舒服的最小号的汉字字体了（高度是12个像素点），如果再小，字体就很难看了。然后，按拷屏键PrtSc，把屏幕的图像拷贝、粘贴到画图软件中，修剪尺寸后，保存为bmp的格式。然后，我找了两个国内最著名的Ocr软件进行测试，结果让人大吃一惊，识别率几乎为零。把图像放大两倍，再测试，结果仍然很不理想，大概也只有百分之二三十的样子。开发Mini Ocr软件的由来我在开发护花使者反黄图像识别软件的时候，遇到有些图像里,嵌有某些文字，如果能把文字识别出来，图像的含义就很容易让计算机理解了。预算有限，我连扫描仪都舍不得买，就更别想买商业Ocr的开发包了，大概几十万,或者更多，或者别人压根就不卖。况且它们的识别率对小字体几乎为零，不符合我的要求。看来，只好自力更生，重新写一个了。开发Mini Ocr的历程经过三个多月的努力，终于诞生了这款Mini Ocr 软件。第１个月做出了汉字识别的核心模块，第２个月做出了文章段落切分的算法，并加入了对英文，数字，标点的支持，第三个月继续调整英汉混排和汉字切分的算法，并用MFC 做了一个界面。 Mini Ocr的软件架构　　为了让更多的人能使用到这个软件，我在windows系统下，采用VC进行编程，界面当然只好用MFC写了。软件架构是一个SDI框架下的多窗口切分界面，左上角的窗口是一个 CFormView，用来显示常用的按钮；左下角是一个CEditView,用来显示帮助信息；右上角是一个CView,用来显示要识别的图像；右下角是一个CEditView,用来存放识别出来的文字。识别部分采用了工作者线程，以避免显示界面的主线程僵掉。识别部分是整个软件的核心，与操作系统无关，可以单独摘出来放在dos窗口里跑，也可以移植到Linux系统中跑。汉字识别软件的难点所在：英文识别有一些开放源码的软件，我看过的软件，主要采取两种识别方法：基于规则的方法，和采用神经网络方法。而这两种方法，在识别汉字时，都不宜采用。因为汉字数目众多，最常用的国标2312的一级汉字就有3755个。如果借用基于规则的方法，需要对三千多个汉字，逐一人工写出分类规则，工作量太大，我一个人无法完成；如果采用神经网络的方法，这么多汉字，我不敢想象，需要多少层网络和神经节点呀！如果采用网格法，抗位移的效果太差；而采用不变矩法，识别人和入，土和士，相似度又难于控制。除此之外，汉字切分也是一大难题。英文宽度大概只有汉字一半，标点符号大概只有汉字三分之一宽，数字大概只有四分之一的宽度。而汉字本身又有二分字，和三分字。某些字，如“啊”，字体小时可能是独体字，字体大些，变为二分字，字体再大，又变为三分字。加上汉字与汉字之间的粘连、汉字与英文的混排，英文与英文的粘连，造成汉字切分模块的算法，甚至比汉字识别模块的算法还要复杂得多。为了克服这些难点，并加快识别速度，我在算法设计时，采用了一些优化和简化的策略。经过实践检验，证明行之有效。 Mini Ocr进行汉字识别的策略： 1) 采用复合特征的分类方法。 2) 字符集选择3755个一级汉字。 3) 字体选择最常用的宋体。 4) 字号选择从小五号到一号汉字，主要针对20个点之内的小字体。 5) 英汉混排时，汉语优先。 6) 汉字粘连时，进行动态优化切分。展望与下一步的开发计划： 1) 重新优化英文识别的算法； 2) 对英文粘连的切分算法进行调整； 3) 移植进入Linux；选择Ocr软件的建议：

MFC基础之字符集 ANSI字符集 ANSI字符集通常使用0x00~0x7f 范围的1个字节来表示1个英文字符，超出的部分使用 0x80-0xFFFF来编码的。我们在平常使用的C++，char[]就是一种标准的ANSI字符，如果在MFC将字符集设置为了多字节， ...

界面

15,979

社区成员

115,897

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章