有關文本處理

kakalov 2005-06-22 11:18:03
現有文本文件,裏面有各種字符,英文、中文。要對其作格式處理。幾個問題請教。

字符指針處理:

1.遇到.、!、?可能作換行。但是如果遇到......該如何?(其實和第2個問題解決了,這個也就不存在問題了)

2.如何抓取特殊字串?比如"III"、"*"這種,我肯定要把這個之前的句子換行處理。因为可能它們之前沒有“."、"?"、"!”等這樣的句子結束符號。

3.還有該用什麽類型指針? 我用兩個指針控制讀取,char aaa[65535];char bbb[65535];這樣的話遇到中文是不是有問題?一個中文字讀一位的時候就是“?”,與前面提到的以?做句子結尾衝突?還是該用WCHAR?
C++數據類型比較困擾。


...全文
79 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
kakalov 2005-06-23
  • 打赏
  • 举报
回复
多谢vcmute

大家如果有空帮忙看一下这个问题:
http://community.csdn.net/Expert/topic/4101/4101276.xml?temp=.9031793
vcmute 2005-06-22
  • 打赏
  • 举报
回复
1,2 char* p指针移动,判断*p
3判断高位是否为0 & 0x80
kakalov 2005-06-22
  • 打赏
  • 举报
回复
盼回復。
vcmute 2005-06-22
  • 打赏
  • 举报
回复
*p可以判断一个,*(p+1)不就是第二个么
或者可以strncmp(*p,"...",3)==0

英文一般是小等于0x7F,中韩日文等高位为89ABCDEF,
如0xA0,一般后面有下个字节的,判断方法就是&0x80
kakalov 2005-06-22
  • 打赏
  • 举报
回复
kakalov 2005-06-22
  • 打赏
  • 举报
回复
有热心人没有啊?
ironfist 2005-06-22
  • 打赏
  • 举报
回复
关注。
kakalov 2005-06-22
  • 打赏
  • 举报
回复
有沒有人再指點我一下?
kakalov 2005-06-22
  • 打赏
  • 举报
回复
頂。
kakalov 2005-06-22
  • 打赏
  • 举报
回复
多謝vcmute。
怎麽判斷高位?

還有char* p指針處理,如何判斷"......"是行結束符?文本中很多地方是"."作爲行結束符的。
像"I"、"II"、“III”這樣的我又該如何判斷?

16,551

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Creator Browser
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧