100分提问:C++中string中包含中文和英文以及其他文字,怎么可以分出中文字符和英文字符

李亚超 2011-01-12 08:38:38
C++,string中包含中文和英文以及其他语言文字,怎么可以分出中文字符和英文字符。
比如,string s="你好CSDN,我的";
分出的效果为:string t ="你/好/C/S/D/N/,/我/的/";
字符串的类型要为,标准的C++字符类型,string,不能为CString。
给出程序者:60分,顶着有份。
...全文
1328 20 打赏 收藏 转发到动态 举报
写回复
用AI写文章
20 条回复
切换为时间正序
请发表友善的回复…
发表回复
李亚超 2011-01-13
  • 打赏
  • 举报
回复
好的,问题解决了,谢谢大家。14楼的给出来代码,并且可以处理分出藏文。这个程序主要是处理藏文和汉语、英语的。
14楼60分。
ls251544415 2011-01-13
  • 打赏
  • 举报
回复
区分中英文的字符,只有从字符的码值上进行判断了
英文是采用的ASCII编码,其码值在闭区间[0,255]内
中文是采用的Unicode编码,其码值是大于255的

只有逐个从字符串变量里面将字符抽取出来,进行码值的判断
tzg_dzq 2011-01-13
  • 打赏
  • 举报
回复
我的想法:
先把string 转为wstring ,此时就可以从wstring中一个一个地把他们取出来了。
pmars 2011-01-13
  • 打赏
  • 举报
回复
话说,那个汉子的第一个字节应该是小于0的吧?这样就oK了
mtj520 2011-01-13
  • 打赏
  • 举报
回复
[Quote=引用 14 楼 yangglemu 的回复:]
C/C++ code

#include "stdafx.h"
#include <string>
#include <iostream>
using namespace std;

int _tmain(int argc, _TCHAR* argv[])
{
string s = "你好CSDN,我的";
string t;
for(int i=0;……
[/Quote]
+1
  • 打赏
  • 举报
回复

#include "stdafx.h"
#include <string>
#include <iostream>
using namespace std;

int _tmain(int argc, _TCHAR* argv[])
{
string s = "你好CSDN,我的";
string t;
for(int i=0; i<s.length(); i++)
{
if(s[i]<255 && s[i]>0)//扩充的ASCII字符范围为0-255,如是,处理一个字节
{
t.append(s.substr(i,1));
t.append("/");
}
else//<0,>255的是汉字,处理两个字节
{
t.append(s.substr(i,2));
t.append("/");
++i;
}
}
cout << t << endl;//输出符合要求
return 0;
}

luciferisnotsatan 2011-01-13
  • 打赏
  • 举报
回复
用find_first_of 找英文字母
bruceteen 2011-01-13
  • 打赏
  • 举报
回复
<ctype.h>

int isleadbyte(
int c
);
Arcticanimal 2011-01-12
  • 打赏
  • 举报
回复
Win32 API

int MultiByteToWideChar(
UINT CodePage,
DWORD dwFlags,
LPCSTR lpMultiByteStr,
int cbMultiByte,
LPWSTR lpWideCharStr,
int cchWideChar
);

根据string的编码,选用合适的CodePage(控制台或者edit控件输入的字串一般选CP_OEMCP),转为宽字符串,一个宽字符对应一个汉字(字母)

非Win就用9楼的方法吧

shzhfu 2011-01-12
  • 打赏
  • 举报
回复
可以判断每个字符的ASCII码值,小于128的可看做英文字符,大于等于128(严格说是连续2个字节都大于等于128)的可以看成汉字。
libinfei8848 2011-01-12
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 healer_kx 的回复:]
我至少算是顶的了。。。


C/C++ code

void main()
{
wstring a = L"Hello您好CSDN";
wstring r;
r = a[0];
for (int i = 1; i < a.length(); ++i)
{
r += L"/";
r += a[i];
……
[/Quote]

程序中就用string难道不行么?
無_1024 2011-01-12
  • 打赏
  • 举报
回复
wstring,使用的是wchar_t类型,这是宽字符,用于满足非ASCII字符的要求,例如Unicode编码,中文,日文,韩文什么的。对于wchar_t类型,实际上C++中都用与char函数相对应的wchar_t的函数,因为他们都是从同一个模板类似于上面的方式定义的。因此也有wcout, wcin, werr等函数。

实际上string也可以使用中文,但是它将一个汉字写在2个char中。而如果将一个汉字看作一个单位wchar_t的话,那么在wstring中就只占用一个单元,其它的非英文文字和编码也是如此。这样才真正的满足字符串操作的要求,尤其是国际化等工作。

healer_kx 2011-01-12
  • 打赏
  • 举报
回复
我至少算是顶的了。。。


void main()
{
wstring a = L"Hello您好CSDN";
wstring r;
r = a[0];
for (int i = 1; i < a.length(); ++i)
{
r += L"/";
r += a[i];
}
wcout<<r;
}

healer_kx 2011-01-12
  • 打赏
  • 举报
回复
你用wstring好了,也是标准库的类型。

【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)内容概要:本文研究了基于非支配排序的蜣螂优化算法(NSDBO)在微电网多目标优化调度的应用,并提供了Matlab代码实现。该方法结合智能优化算法与电力系统调度需求,针对微电网运行的多重目标(如经济性、环保性、稳定性等)进行协同优化,有效提升了调度方案的综合性能。文详细阐述了NSDBO算法的设计原理、非支配排序机制及其在求解多目标问题上的优势,并通过仿真实验验证了其相较于传统算法在收敛性和多样性方面的优越表现。; 适合人群:具备一定电力系统基础知识和Matlab编程能力的研究生、科研人员及从事微电网优化、智能优化算法研究的相关工程技术人员。; 使用场景及目标:①用于解决微电网多目标、多约束的优化调度问题,如成本最小化与碳排放最低的平衡;②为智能优化算法在能源系统的应用提供可复现的技术路径和代码参考,支持学术研究与实际项目开发; 阅读建议:建议读者结合Matlab代码深入理解算法实现细节,重点关注非支配排序与蜣螂行为模拟的融合机制,同时可尝试将其迁移至其他多目标优化问题进行拓展研究。

65,209

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧