java读取doc文件内容的问题

tjzero_sapce 2016-05-19 10:27:52
小弟是用poi读取doc的
public static String docString(String filePath) {
File file = new File(filePath);
String result = "";
try {
FileInputStream fis = new FileInputStream(file);
HWPFDocument doc = new HWPFDocument(fis);
Range rang = doc.getRange();
result += rang.text();
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
return result;
}

但是读取出来的内容会这样的 TOC \o "1-3" \h \z \u HYPERLINK \l "_Toc440010147"一、一般要求 PAGEREF _Toc440010147 \h 4,带有TOC \o "1-3" \h \z \u HYPERLINK \l "_Toc440010147"这些我不需要的东西 请问是我读取的方法不对吗?或者该怎么去掉这些多余的字符
...全文
390 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
tjzero_sapce 2016-06-01
  • 打赏
  • 举报
回复
引用 5 楼 napoay 的回复:
[quote=引用 4 楼 tjzero_sapce 的回复:] [quote=引用 3 楼 napoay 的回复:] 我写的一个例子,读取word文档没有问题。

public class ReadWord {
	public static void main(String[] args) {

		File doc1 = new File("doc/2012年秋季期末试题.doc");
		if (doc1.exists()) {
			System.out.println("文件存在!");
		} else {
			System.out.println("文件不存在!");
		}
		
		try {
			InputStream is=new FileInputStream(doc1);
			WordExtractor we=new WordExtractor(is);
			System.out.println(we.getText());
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}


你这个是针对word03还是 word07的?[/quote] 03的[/quote]感谢,非常管用! 我在你的代码中又加了个 is.close();
esc_ai 2016-05-31
  • 打赏
  • 举报
回复
引用 4 楼 tjzero_sapce 的回复:
[quote=引用 3 楼 napoay 的回复:] 我写的一个例子,读取word文档没有问题。

public class ReadWord {
	public static void main(String[] args) {

		File doc1 = new File("doc/2012年秋季期末试题.doc");
		if (doc1.exists()) {
			System.out.println("文件存在!");
		} else {
			System.out.println("文件不存在!");
		}
		
		try {
			InputStream is=new FileInputStream(doc1);
			WordExtractor we=new WordExtractor(is);
			System.out.println(we.getText());
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}


你这个是针对word03还是 word07的?[/quote] 03的
tjzero_sapce 2016-05-31
  • 打赏
  • 举报
回复
引用 3 楼 napoay 的回复:
我写的一个例子,读取word文档没有问题。

public class ReadWord {
	public static void main(String[] args) {

		File doc1 = new File("doc/2012年秋季期末试题.doc");
		if (doc1.exists()) {
			System.out.println("文件存在!");
		} else {
			System.out.println("文件不存在!");
		}
		
		try {
			InputStream is=new FileInputStream(doc1);
			WordExtractor we=new WordExtractor(is);
			System.out.println(we.getText());
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}


你这个是针对word03还是 word07的?
esc_ai 2016-05-21
  • 打赏
  • 举报
回复
我写的一个例子,读取word文档没有问题。

public class ReadWord {
	public static void main(String[] args) {

		File doc1 = new File("doc/2012年秋季期末试题.doc");
		if (doc1.exists()) {
			System.out.println("文件存在!");
		} else {
			System.out.println("文件不存在!");
		}
		
		try {
			InputStream is=new FileInputStream(doc1);
			WordExtractor we=new WordExtractor(is);
			System.out.println(we.getText());
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}


tjzero_sapce 2016-05-19
  • 打赏
  • 举报
回复
引用 1 楼 ylz2007 的回复:
poi转txt,读取文本
能用代码示例吗?没看明白
  • 打赏
  • 举报
回复
poi转txt,读取文本

67,512

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧