社区
一般软件使用
帖子详情
请教:记事本保存同样文本后大小为什么不同
huantianhuoyan
2010-04-25 06:31:11
系统:XP
实验1:
在记事本中输入一个汉字:汉
保存为unicode格式,通过右键属性查看,大小为4个字节
实验2:
在记事本中输入一个汉字:汉
保存为utf-8格式,通过右键属性查看,大小为6个字节
问题:
1、unicode为双字节编码,本身加上控制字符 汉+LF(换行)+CR(回车)=6字节, 怎么等于4个字节?
2、utf-8编码中,“汉”字占有3个字节,控制字符各占1个字节 汉+LF(换行)+CR(回车)=5字节, 怎么等于6个字节?
...全文
399
8
打赏
收藏
请教:记事本保存同样文本后大小为什么不同
系统:XP 实验1: 在记事本中输入一个汉字:汉 保存为unicode格式,通过右键属性查看,大小为4个字节 实验2: 在记事本中输入一个汉字:汉 保存为utf-8格式,通过右键属性查看,大小为6个字节 问题: 1、unicode为双字节编码,本身加上控制字符 汉+LF(换行)+CR(回车)=6字节, 怎么等于4个字节? 2、utf-8编码中,“汉”字占有3个字节,控制字符各占1个字节 汉+LF(换行)+CR(回车)=5字节, 怎么等于6个字节?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
纠结的程序猿
2010-04-27
打赏
举报
回复
没有哪个工具可以明确告诉你这个文本文件是GB2312或ANSI或其它某种字符集。
用PilotEdit可以查看文件类型是ANSI, UTF-8, UTF-16或UTF-16 big endian,同时可以查看十六进制编码,PilotEdit判断得比其他文本编辑器更准确。
http://topic.csdn.net/u/20100327/22/0b5656cb-f2c7-49c5-931c-1bd639ace04d.html
huantianhuoyan
2010-04-26
打赏
举报
回复
晕~ 答案不同啊
控制字符是不显示出来的,如果计算大小,那么怎么算啊?
huantianhuoyan
2010-04-26
打赏
举报
回复
总结一下:
在记事本中输入“汉”字,并按下回车键,保存时分别选择不同的字符集格式
1、ANSI格式 大小:4字节
2、UNICODE格式 大小:8字节
3、UTF-8格式 大小:8字节
“汉”的ANSI 编码是 占位 2个字节 + \r\n 占2个字节 = 4个字节
“汉”的UNICODE编码是 “FF FE 49 6C” 占位 4个字节 + \r\n 占4个字节 = 8个字节
“汉”的UTF-8 编码是 “EF BB BF E6 B1 89 占位 6个字节 + \r\n 占2个字节 = 8个字节
非常感谢pilotedit
另外,有什么工具可以直接查看其不同字符集的编码么?我用UE好像只能看UTF16的,GB2312就看不了
纠结的程序猿
2010-04-26
打赏
举报
回复
[Quote=引用 2 楼 huantianhuoyan 的回复:]
谢谢pilotedit!
另外,Windows在记事本中每行后面不是自动添加两个控制字符(回车+换行)么,这两个控制字符是否计入文件的大小中?
[/Quote]
记事本不会在每行后面自动添加两个控制字符(回车+换行)。除非是你手工添加。
我用记事本在一个新建的文件中输入“汉”字,然后保存,重新打开后没有回车换行符。
ccbccb
2010-04-26
打赏
举报
回复
是的,计入的。
[Quote=引用 2 楼 huantianhuoyan 的回复:]
谢谢pilotedit!
另外,Windows在记事本中每行后面不是自动添加两个控制字符(回车+换行)么,这两个控制字符是否计入文件的大小中?
[/Quote]
纠结的程序猿
2010-04-26
打赏
举报
回复
如果有回车换行符,那么回车换行符也会记入文件的大小。具体回车换行符大小由文件类型决定。
如果文件类型是UNIX + UTF16,回车换行符是\n,占用两个字节,编码是 “0A 00 ”
如果文件类型是DOS + UTF16,回车换行符是\r\n,占用四个字节,编码是 “0D 00 0A 00 ”
如果文件类型是UNIX + UTF8,回车换行符是\n,占用一个字节,编码是 “0A ”
如果文件类型是DOS + UTF8,回车换行符是\r\n,占用两个字节,编码是 “0D 0A ”
huantianhuoyan
2010-04-25
打赏
举报
回复
谢谢pilotedit!
另外,Windows在记事本中每行后面不是自动添加两个控制字符(回车+换行)么,这两个控制字符是否计入文件的大小中?
纠结的程序猿
2010-04-25
打赏
举报
回复
“汉的”unicode编码是“FF FE 49 6C”
其中“FF FE”是UTF-16的文件头(BOM)
“汉的”的UTF-8编码是“EF BB BF E6 B1 89”
其中“EF BB BF”是UTF-8的文件头(BOM)
C++中Txt文件读取和写入
C++中Txt文件读取和写入 一、ASCII 输出 为了使用下面的方法, 你必须包含头文件(译者注:在标准C++中,已经使用取代,所有的C++标准头文件都是无后缀的。)。这是 的一个扩展集, 提供有缓冲的文件输入输出操作. 事实上, 已经被包含了, 所以你不必包含所有这两个文件, 如果你想显式包含他们,那随便你。我们从文件操作类的设计开始, 我会讲解如何进行ASCII I/O操作。如果你猜是
C++中Txt文件读取和写入(方法汇总)
一、ASCII 输出 为了使用下面的方法, 你必须包含头文件
(译者注:在标准C++中,已经使用取代< fstream.h>,所有的C++标准头文件都是无后缀的。)这是
的一个扩展集, 提供有缓冲的文件输入输出操作. 事实上,
已经被
包含了, 所以你不必包含所有这两个文件,
新手入门
请教
html(一)
xins HTML简介 HTML(HyperText Mark-up Language)即超
文本
标记语言或超
文本
链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。设计HTML语言的目的是为了能把存放在一台电脑中的
文本
或图形与另一台电脑中的
文本
或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。我们只需使用鼠标在某一
flash常见问题集锦,很适合新手哦[二]
怎样用
文本
控制链接 我用flashmx做了一个导航菜单,可是在今后修改链接很麻烦,近日听说可以用
文本
来控制链接,想请问如何用
文本
文件来控制flash里的链接?在此先谢谢回答问题的各位了! 这个分2个步骤来:1.新建一个
文本
文件,文件名为:1.txt,打开
文本
输入:a=http://www.km169.net,
保存
2.打开你的Flash原文件,新建一个层,在这个层里加代码:loadVaria
TowardsDataScience 2023 博客中文翻译(六十)
原文:towardsdatascience.com/building-a-cross-platform-tfidf-text-summarizer-in-rust-7b05938f4507?开始吧 ➡️
文本
总结一直是自然语言处理(NLP)中长期研究的问题。从
文本
中提取重要信息并生成
文本
摘要是
文本
总结器需要解决的核心问题。解决方案分为两类,即提取式总结和抽象式总结。## 理解自动
文本
摘要-1: 抽取方法在抽取式
文本
总结中,短语或句子直接从句子中提取。
一般软件使用
4,170
社区成员
38,473
社区内容
发帖
与我相关
我的任务
一般软件使用
Windows专区 一般软件使用
复制链接
扫一扫
分享
社区描述
Windows专区 一般软件使用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章