问一个有关套接字输出编码的问题
JAVA servlet 属于JAVA,所以,它的源程序代码用Uinicode编码,并且,当它读取本地文件时,总是先转换成Uinicode编码,然后再读取,当往本地输出的时候,总是将Uinicode编码的字符串转换成本地编码,然后再输出,我说的对吗?
那麽,当用套接字连接了另一台主机,输出字符串的时候,也是将Uinicode编码转换成本地编码然后再输出?还是用统一的ISO-8859-1方式编玛输出?
书上说,可以在http首部中用charset来指定编码方式,这正是我产生疑问的地方 :
"charset"也是包含在http首部中用套接字输出的,在编码方式未知时,客户端浏览器如何知道"charset"中的信息,以何种方式来解读收到的一系列字节? 我知道各种编码方式均为字母A
~Z编码,可字母A~Z在各种编码方式中的值并不是完全相同吧?况且有的是双字节编码,有的是单字节编码.
还是从http状态码,到http首部完节,只能用ISO-8859-1方式编玛,到正文内容才可以用各种编码方式?
请指教.