文本编辑器怎么判断这是一个文本文件

emberfarkas 2014-03-12 11:10:49
在网上看了很多,感觉还是得不到答案,有些人说文本文件会留几个字节用来标识这时文本文件,也看到判断文本文件是用来判断是否有'\0'字符。用十六进制编辑器看都是一样,就可能多个FF、EF,难道文本文件是用这个来识别的。
...全文
157 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
赵4老师 2014-03-12
  • 打赏
  • 举报
回复
电脑内存或文件内容只是一个一维二进制字节数组及其对应的二进制地址; 人脑才将电脑内存或文件内容中的这个一维二进制字节数组及其对应的二进制地址的某些部分看成是整数、有符号数/无符号数、浮点数、复数、英文字母、阿拉伯数字、中文/韩文/法文……字符/字符串、汇编指令、函数、函数参数、堆、栈、数组、指针、数组指针、指针数组、数组的数组、指针的指针、二维数组、字符点阵、字符笔画的坐标、黑白二值图片、灰度图片、彩色图片、录音、视频、指纹信息、身份证信息…… 推荐使用WinHex软件查看硬盘或文件或内存中的原始字节内容。
赵4老师 2014-03-12
  • 打赏
  • 举报
回复
谁能识别只有一个字节的文件到底是不是文本文件?
图灵狗 2014-03-12
  • 打赏
  • 举报
回复
参考我的博文(http://blog.csdn.net/turingo/article/details/8136644) 你可以去研究uchardet的源代码。
引用 楼主 Emberfarkas 的回复:
在网上看了很多,感觉还是得不到答案,有些人说文本文件会留几个字节用来标识这时文本文件,也看到判断文本文件是用来判断是否有'\0'字符。用十六进制编辑器看都是一样,就可能多个FF、EF,难道文本文件是用这个来识别的。

64,651

社区成员

发帖
与我相关
我的任务
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++ 技术论坛(原bbs)
社区管理员
  • C++ 语言社区
  • encoderlee
  • paschen
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
  1. 请不要发布与C++技术无关的贴子
  2. 请不要发布与技术无关的招聘、广告的帖子
  3. 请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下

试试用AI创作助手写篇文章吧