如何区分GB字节流和UTF8字节流?
我用记事本试验了一下,没有加BOM的情况下保存的UTF8的文本,内容是“汉汉”,如果按GB码来识别的话就会是“姹夋眽”,不过记事本还是认成“汉汉”,说明记事本是默认先识别UTF8码的,如果我在里面加了非UTF8的编码,比如CCCC,也就是“烫”,VC里未初始化的数据都是这个,记事本就会认成“姹夋眽烫”,也就是说记事本是扫描整个文件的内容如果都符合UTF8的格式就认为是UNICODE的字符,否则就认为是GB码。不知道是不是如此。这样的话,如果没有指定的话,我怎么识别一个字节流是GB字节流还是UTF8字节流?难道要把整个字节流全部按UTF8格式识别一遍,发现有不符合UTF8格式的字节就认为其是GB的吗?