怎样将多级文件夹下的所有xml文件批量去掉标签,并转成txt格式?

 晓 2019-07-03 09:11:43
怎样将多级文件夹下的所有xml文件批量去掉标签,并转成txt格式?最好能都转换在同一个txt文件中。(注:该主目录下的所有子文件夹中的所有文件都是xml格式,具体如图所示)

最近在写毕业论文,这个问题的解决关乎单语语料库的构建,时间紧迫,希望大牛们多多指教,感激不尽呢!!
...全文
315 3 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
Magic丶旭 2019-08-14
  • 打赏
  • 举报
回复
引用 2 楼 Magic丶旭 的回复:
这个涉及到: 1、文件夹遍历。 2、文件IO。 遍历的话如果不考虑堆栈溢出的话可以直接使用递归的方式来遍历。如果不希望堆栈溢出,可以使用容器思想,每遇到一个文件夹就将文件夹路径放到容器中,每遍历完一个文件夹就将该文件夹路径从容器中取出。 至于去除标签的话,你得学会从字符串中识别标签,识别标签中的内容,然后只将标签内容写入到txt文件。
读xml文件也有专门的工具。
Magic丶旭 2019-08-14
  • 打赏
  • 举报
回复
这个涉及到: 1、文件夹遍历。 2、文件IO。 遍历的话如果不考虑堆栈溢出的话可以直接使用递归的方式来遍历。如果不希望堆栈溢出,可以使用容器思想,每遇到一个文件夹就将文件夹路径放到容器中,每遍历完一个文件夹就将该文件夹路径从容器中取出。 至于去除标签的话,你得学会从字符串中识别标签,识别标签中的内容,然后只将标签内容写入到txt文件。
tiger波波 2019-07-19
  • 打赏
  • 举报
回复
(1)百度搜索:VC 文件查找或 VC 文件遍历,找到所有.xml文件

(2)百度搜索:VC xml文件读写,读取xml文件,将xml文件的内容(不包括标签)写人txt

3,055

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC HTML/XML
社区管理员
  • HTML/XML社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧