关于InputStreamReader(in,charsetName)的一个问题

若鱼1919 2010-04-06 03:01:15

有一个1.txt,
里面的内容是：
aa
bb
cc
dd
ee
ff
文件，另存为，选择编码方式是utf-8，另存为2.txt
读取2.txt这个文件的内容的时候，多出来一个"?"，不知道为什么？



public static void main(String[] args)throws Exception {

		// TODO Auto-generated method stub

		InputStream in=TestFile.class.getResourceAsStream("2.txt");

		BufferedReader br=new BufferedReader(new InputStreamReader(in,"UTF-8"));

		String line="";

		while((line=br.readLine())!=null){

			System.out.println(line);

		}

		in.close();

		br.close();

	}

/*输出结果是：

?aa

bb

cc

dd

ee

ff

*/

//为什么多出来一个"?"啊？非常不解！

...全文

651 3 打赏收藏转发到动态举报

写回复

3 条回复

切换为时间正序

请发表友善的回复…

发表回复

wakeUpDoNottLazy 2010-04-07

打赏
举报

回复

这是 notepad 的问题，为了标识 notepad 中的字符编码格式为 utf-8 notepad 需要在文档内容前加几个字节进行标识。是哪几个字节我忘记了，你可以查下

纠结的程序猿 2010-04-07

打赏
举报

回复

对的，这是UltraEdit的问题。有的UltraEdit版本会在HEX模式中，把原文件转换成UTF-16来显示。
你可以用PilotEdit来查看原文件的HEX编码，PilotEdit显示的是实际的HEX内容不会转换。
http://topic.csdn.net/u/20100405/17/e86b8de1-3e61-4b6c-bb19-bbfe472b5a25.html

若鱼1919 2010-04-06

打赏
举报

回复

原来存在一个叫做Bom头的东西用来表示文件的编码类型。
Unicode的txt前两个字节是ff fe，
Unicode big endian的txt前两个字节是fe ff
UTF-8的txt前三个字节是ef bb bf
ANSI的txt是直接开始内容的。
因此，在读取的时候需要跳过这些标识字符就可以了。
我用UltraEdit打开另存好的utf的txt文件，但是前两个字节是：FF FE，
但是用代码读出来却是：ef bb bf。不知道是不是UltraEdit的问题。
InputStream in=TestFile.class.getResourceAsStream("2.txt");
in.skip(3);//跳过三个字节
BufferedReader br=new BufferedReader(new InputStreamReader(in,"UTF-8"));
这样读出来就没有错了。
也就是说要根据Bom头来判断文件的编码类型，然后选择需要跳过的字节数，就可以正确无误的读出文件的内容

本文通过示例代码给大家解析了Java中的InputStreamReader和OutputStreamWriter知识，需要的的朋友参考下吧

主要介绍了InputStreamReader和BufferedReader用法及实例讲解的相关资料,需要的朋友可以参考下

/** * 一、BufferedReader类 public class BufferedReader extends Reader * 从字符输入流中读取文本，缓冲各个字符，从而实现字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值足够大。 * 通常，Reader 所作的每个读取请求都会导致对底层字符或字节流进行相应的读取请求。因此，建议用 BufferedReader包装所有其 read() * 操作可能开销很高的 Reader（如 FileReader和 InputStreamReader）。 * BufferedReader流能够读取文本行,通过向BufferedReader传递一个Reader对象 * ,来创建一个BufferedReader对象,之所以这样做是因为FileReader没有提供读取文本行的功能. * * 二、InputStreamReader类 * * InputStreamReader 将字节流转换为字符流。是字节流通向字符流的桥梁。如果不指定字符集编码，该解码过程将使用平台默认的字符编码，如：GBK。 * * 构造方法： * * InputStreamReader isr = new InputStreamReader(InputStream * in);//构造一个默认编码集的InputStreamReader类 * * InputStreamReader isr = new InputStreamReader(InputStream in,String * charsetName);//构造一个指定编码集的InputStreamReader类。 * * 参数 in对象通过 InputStream in = System.in;获得。//读取键盘上的数据。 * * 或者 InputStream in = new FileInputStream(String fileName);//读取文件中的数据。可以看出 * FileInputStream 为InputStream的子类。 * * 主要方法：int read();//读取单个字符。 int read(char []cbuf);//将读取到的字符存到数组中。返回读取的字符数。 * * 三、FileWriter（少量文字）和 BufferedWriter（大量文字）实现简单文件写操作 * @author hulk */

完整版：https://download.csdn.net/download/qq_27595745/89522468 【课程大纲】 1-1 什么是java 1-2 认识java语言 1-3 java平台的体系结构 1-4 java SE环境安装和配置 2-1 java程序简介 2-2 计算机中的程序 2-3 java程序 2-4 java类库组织结构和文档 2-5 java虚拟机简介 2-6 java的垃圾回收器 2-7 java上机练习 3-1 java语言基础入门 3-2 数据的分类 3-3 标识符、关键字和常量 3-4 运算符 3-5 表达式 3-6 顺序结构和选择结构 3-7 循环语句 3-8 跳转语句 3-9 MyEclipse工具介绍 3-10 java基础知识章节练习 4-1 一维数组 4-2 数组应用 4-3 多维数组 4-4 排序算法 4-5 增强for循环 4-6 数组和排序算法章节练习 5-0 抽象和封装 5-1 面向过程的设计思想 5-2 面向对象的设计思想 5-3 抽象 5-4 封装 5-5 属性 5-6 方法的定义 5-7 this关键字 5-8 javaBean 5-9 包 package 5-10 抽象和封装章节练习 6-0 继承和多态 6-1 继承 6-2 object类 6-3 多态 6-4 访问修饰符 6-5 static修饰符 6-6 final修饰符 6-7 abstract修饰符 6-8 接口 6-9 继承和多态章节练习 7-1 面向对象的分析与设计简介 7-2 对象模型建立 7-3 类之间的关系 7-4 软件的可维护与复用设计原则 7-5 面向对象的设计与分析章节练习 8-1 内部类与包装器 8-2 对象包装器 8-3 装箱和拆箱 8-4 练习题 9-1 常用类介绍 9-2 StringBuffer和String Builder类 9-3 Rintime类的使用 9-4 日期类简介 9-5 java程序国际化的实现 9-6 Random类和Math类 9-7 枚举 9-8 练习题 10-1 java异常处理 10-2 认识异常 10-3 使用try和catch捕获异常 10-4 使用throw和throws引发异常 10-5 finally关键字 10-6 getMessage和printStackTrace方法 10-7 异常分类 10-8 自定义异常类 10-9 练习题 11-1 Java集合框架和泛型机制 11-2 Collection接口 11-3 Set接口实现类 11-4 List接口实现类 11-5 Map接口 11-6 Collections类 11-7 泛型概述 11-8 练习题 12-1 多线程 12-2 线程的生命周期 12-3 线程的调度和优先级 12-4 线程的同步 12-5 集合类的同步问题 12-6 用Timer类调度任务 12-7 练习题 13-1 Java IO 13-2 Java IO原理 13-3 流类的结构 13-4 文件流 13-5 缓冲流 13-6 转换流 13-7 数据流 13-8 打印流 13-9 对象流 13-10 随机存取文件流 13-11 zip文件流 13-12 练习题 14-1 图形用户界面设计 14-2 事件处理机制 14-3 AWT常用组件 14-4 swing简介 14-5 可视化开发swing组件 14-6 声音的播放和处理 14-7 2D图形的绘制 14-8 练习题 15-1 反射 15-2 使用Java反射机制 15-3 反射与动态代理 15-4 练习题 16-1 Java标注 16-2 JDK内置的基本标注类型 16-3 自定义标注类型 16-4 对标注进行标注 16-5 利用反射获取标注信息 16-6 练习题 17-1 顶目实战1-单机版五子棋游戏 17-2 总体设计 17-3 代码实现 17-4 程序的运行与发布 17-5 手动生成可执行JAR文件 17-6 练习题 18-1 Java数据库编程 18-2 JDBC类和接口 18-3 JDBC操作SQL 18-4 JDBC基本示例 18-5 JDBC应用示例 18-6 练习题 19-1 。。。

IO流： Input Output 输入输出流自己去扩展： 1. 对象序列化和反序列化生成一个 2. 流的种类： io包下扩展nio包下 1. IO分类：输入流输出流字节流 InputStream（抽象类） OutputStream（抽象类）字符流 Reader （抽象类） Writer（抽象类） 2.字节流：（重点） * 使用场景： * 1.字节流处理除了文本、文字相关所有的流问题，如，png/jpg/avi/map4/mp3/exe * 2.字符流只处理文本、文字相关（编码乱码问题） * * 1.输入流 abstract class InputStream:这个抽象类是表示输入字节流的所有类的超类。 * | * FileInputStream 子类:文件字节输入流 * 1. 构造方法 * FileInputStream(String name) name：表示(绝对路径、相对路径)文件名 * FileInputStream(File file) * * 2. 普通方法： //1. int read(byte[] b) 从输入流读取一些字节数，并将它们存储到缓冲区 b 。最常用 * //2. int read() 从输入流读取数据的下一个字节。 //3. int read(byte[] b, int off, int len) 从输入流读取最多 len字节的数据到一个字节数组。 * 2.输出流 abstract class OutputStream:这个抽象类是表示输出字节流的所有类的超类。 * | * FileOutputStream 子类:文件字节输出流 * 1. 构造方法 FileOutputStream(String name) name：表示(绝对路径、相对路径)文件名 FileOutputStream(String name, boolean append) append：表示是否在该文件末尾追加数据，如果为true，表示追加，false，表示从头开始覆盖 * FileOutputStream(File file) FileOutputStream(File file, boolean append) * * 2. 普通方法： //1. void write(byte[] b, int off, int len) 将 len字节从位于偏移量 off的指定字节数组写入此文件输出流。最常用 * //2. void write(byte[] b)将 b.length个字节从指定的字节数组写入此文件输出流。 //3. void write(int b) 将指定的字节写入此文件输出流。 3. 注意事项： 1. 必须要关闭IO流，节约资源开销 2. 关闭IO流原则，先开后关 3. IO流工具类的抽取，将所有的关流（字节流和字符流）方法抽取出来，优化代码 4. 字符流：（重点） * 使用场景：使用于处理文本相关的文件 * * Reader 抽象类： * |子类 * InputStreamReader（转换流） * |子类 * FileReader：适用于读取字符相关的文件 * 1. 构造方法： * 1.FileReader(File file) 2.FileReader(String fileName) fileName：文件名（相对路径/绝对路径） * * 2. 读取方法： * 3. int read(char[] c)读取字符到char数组中最常用 * 2. int read()读取一个字符 * 3. int read(char[] c,int start,int length)读取制定长度的字符到char数组中 * * Writer 抽象类： * |子类 * OutputStreamWriter（转换流） * |子类 * FileWriter：适用于写出字符相关的文件 * 1. 构造方法： * 1.FileWriter(File file) 默认是false 2.FileWriter(File file, boolean append) append：表示是在文件末尾追加还是从头覆盖，如果true追加，false覆盖，默认是false 3.FileWriter(String fileName) 默认是false 4.FileWriter(String fileName, boolean append) fileName：文件名（相对路径/绝对路径） * 2. 写出方法： * 1. public Writer append(CharSequence csq,int start,int end) * 2. public Writer append(char c) * 3. public Writer append(CharSequence csq) * 4. public void write(char[] c) * 5. public void write(String str) * 6. public void write(String str,int start,int end) 5. 乱码问题：（掌握） GBK: 中文2个字节英文、数字：1字节 UTF-8：中文3~6个字节英文、数字：1字节编码：将字符串转换为字节 * 1. byte[] getBytes() 根据默认字符集将当前字符串转换为字节数组 * 2. byte[] getBytes(String charsetName) UTF-8/GBK * 按照指定的字符集将将当前字符串转换为字节数组 * * 解码：将字节转换为字符 * 1.String(byte[] bytes, int offset, int length) * 根据默认字符集将字节数组中从指定下标开始到指定长度结束的数据转换为字符串 * * 2.String(byte[] bytes, int offset, int length, String charsetName) * 根据指定字符集将字节数组中从指定下标开始到指定长度结束的数据转换为字符串 * charsetName：字符集名例如： "GBK"、"UTF-8" 、"ISO-8859-1" * * 不常用 * 3.String(byte[] bytes) 根据默认字符集将字节数组转换为字符串 * 4.String(byte[] bytes, String charsetName) * 根据默认字符集将字节数组转换为字符串 * * 这里会有乱码问题： * 产生的原因： * 1、因为字符集不统一，即编码和解码new String(b,0,read,"gbk")字符集不一致 * 2、因为字节流读取汉字的时候，字节数组长度不够，将一个汉字拆开了 * 解决： * 1. 用字符流用统一的字符集（最常用） * * 浏览器： UTF-8 * 前台： * HTML ：UTF-8 * CSS ：UTF-8 * JS、JSP ：UTF-8 * * 后台： * java ：UTF-8 * * 数据库： * mysql、oracle、DB2 ：UTF-8 * * 开发工具：UTF-8 * 2. 文本文件用统一的字符集且用字符流读取和写出文本相关文件（最常用） * 3. 用一个大的字节数组（一般不用） 6. 转换流：（重点）目前唯一一个可以设置字符集的流（简单的理解为包装流，就是将字节流包装以下，方便操作文本相关的文件） * 使用场景： * 别人给提供了字节流，而需要处理文本文件，这时候，就需要用转换流转换一下，更方便处理文本文件 * * 作用：就是一字符流的方式读取或写出文本相关的数据 * * InputStreamReader：将字节输入流包装一下,让其更适合读取文本文件 * 构造方法： * 1.InputStreamReader(InputStream in) 创建一个使用默认字符集的InputStreamReader。 * 2.InputStreamReader(InputStream in, String charsetName) 创建一个使用指定字符集的InputStreamReader。 * 普通方法： * public int read(char[] cbuf) * int read(char[] cbuf, int offset, int length) * OutputStreamWriter：将字节输出流包装一下,让其更适合写出文本文件 * 构造方法： * 1. OutputStreamWriter(OutputStream out) 创建一个使用默认字符编码的OutputStreamWriter。 * 2. OutputStreamWriter(OutputStream out, String charsetName) 创建一个使用指定字符集的OutputStreamWriter。普通方法： void write(char[] cbuf, int off, int len) append(CharSequence csq,int start,int end) 只有转换流可以设置字符集 7. jdk7关流的新方式：用新结构可以自动关流前提：该流必须是实现了一个接口 AutoCloseable 语法： try( //只能写创建流的操作，不能写其他业务操作 ){ //可能有异常的代码 }catch(异常类型1 e){ }...不需要finally关流了 8. 缓冲流：（重点）包装流 * 1.概念：提高读取和写出效率的流 * 2.作用：提高效率 3.使用场景：以后一律都要使用，以提高效率建议以后都是用字节或者字符数组的方式复制文件，这样效率最高 * 4. * BufferedInputStream * 字节输入缓冲流构造方法： 1.BufferedInputStream(InputStream

62,622

社区成员

307,257

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章