如何读取word文档?

qiyongjun2003 2004-04-28 11:59:20
我在d:\test下有很多word文件(.doc格式),我想把它们内容放到表里去,但是我在读取时,print页面出现的都是乱码(还没做到插数据一块),word文件字体可能不同,源码如下:
<%@ page contentType="text/html;charset=gb2312" import="java.io.*"%>
<html>
<head >
<title>文件测试</title>
<META http-equiv=Content-Type content="text/html; charset=GBK">
</head>
<body>
<%
//取得目录
String path ="d:\\test\\";
// request.getRealPath("d:\note\");
File d = new File(path);
File list[] = d.listFiles();
//out.println("在目录"+path+"下的文件有:<ul>");
for(int i =0;i<list.length;i++){
// out.println("<li>"+list[i].getName()+"<br>");
File file=new File(path+list[i].getName());
FileInputStream fins=new FileInputStream(file);
int n;
n=fins.available();
byte temp[]=new byte[n];
int kk=fins.read(temp);
String art=new String(temp,0);
out.print(art);
fins.close();
}
%>

</body>
</html>
不知道该如何解决?解决给分。
...全文
455 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
pengpong 2004-08-10
  • 打赏
  • 举报
回复
up
zhouziqiang 2004-06-17
  • 打赏
  • 举报
回复
这种方法可以:
<%@ page import="java.io.*,org.textmining.text.extraction.WordExtractor" contentType="text/html;charset=GBK"%>
<%
FileInputStream in = new FileInputStream ("H:\\webapps\\ch10\\file.doc");//根据自己文档的实际路径来写
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
out.println(str);
%>
lixilin 2004-06-16
  • 打赏
  • 举报
回复
UP
qiyongjun2003 2004-06-15
  • 打赏
  • 举报
回复
up
raymond323 2004-06-12
  • 打赏
  • 举报
回复
顶呀!
bengan 2004-06-09
  • 打赏
  • 举报
回复
顶呀!
qiyongjun2003 2004-06-09
  • 打赏
  • 举报
回复
顶呀!
fuzuyuan 2004-05-14
  • 打赏
  • 举报
回复
我不知道你到底要读取多大的文档,有1M吗?我没读那么大的,我只试了一个100K的,读取的很正常啊,你不要大在System.out这里面读,因为这是有限制的,你读取到网页面上吧,下面是代码!
<%@ page import="java.io.*,org.textmining.text.extraction.WordExtractor" contentType="text/html;charset=GBK"%>
<%
FileInputStream in = new FileInputStream ("H:\\webapps\\ch10\\file.doc");//根据自己文档的实际路径来写
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
out.println(str);
%>
dragonsdg3 2004-05-13
  • 打赏
  • 举报
回复
guan zhu
qiyongjun2003 2004-05-13
  • 打赏
  • 举报
回复
fuzuyuan(happyboy):
我按你的办法,能读出中文来了,可只能读一部分,后面的就读不出来了,文章很长。
qiyongjun2003 2004-05-13
  • 打赏
  • 举报
回复
大家帮忙呀。
fuzuyuan 2004-04-30
  • 打赏
  • 举报
回复
http://expert.csdn.net/Expert/topic/3019/3019927.xml?temp=.2557032

这个网页,记录了我解决的办法,我经过测试。希望对你有用
lugoal 2004-04-30
  • 打赏
  • 举报
回复
我们共同进步,我没分可提问了,借您的光,在这里发布一个问题,请多包涵,谢谢!

我的工作环境:
windows2000,JDK1.4,tomcat 5,sqlserver200


从数据库里读取的简体中文,如何转换成繁体在jsp页面上显示啊?

求解决方案?

谢谢了!我的email: lugoal@163.com
qishiniandai 2004-04-30
  • 打赏
  • 举报
回复
charset=gb2312改成charset=GBK 再试试,如果再不行,
String str=new String(art.getBytes("ISO8859-1","GBK"));

如果还是不可以,那么我就不知道了!
qiyongjun2003 2004-04-30
  • 打赏
  • 举报
回复
大家帮忙呀。

81,092

社区成员

发帖
与我相关
我的任务
社区描述
Java Web 开发
社区管理员
  • Web 开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧