英语音标读取乱码

endual 2012-04-28 10:33:42
我想把英语的音标读取出来存入到数据库中,然后做一个小词典,练习用。
但是现在sqlite中存放不了英语的音标,我用到金山的开放词库,用他们的
词的字体 Ksphonet.ttf ,但是读取乱码了。


import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {

public static String readDoc(String doc) throws Exception {
// 创建输入流读取doc文件
FileInputStream in = new FileInputStream(new File(doc));


WordExtractor extractor = null;
String text = null;
// 创建WordExtractor
extractor = new WordExtractor();
// 对doc文件进行提取
text = extractor.extractText(in);



return new String(text.getBytes(), "Ksphonet.ttf");
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try{
String text = WordReader.readDoc("docfile//word1.doc");
System.out.println(text);
}catch(Exception ex){
ex.printStackTrace();
}
}
}


上面的是代码,导入的是tm-extractors-0.4.jar 这个jar包
这个是读取doc文件的

抱歉这个论坛 金山的那个字体也不支持

-----------------------
金山词库
absurd
[] a. 荒谬的,荒诞的,荒唐可笑的;不合理的
abundance
[] n. 丰富,充裕,大量
abundant
[] a. 大量(充足)的;(in)丰富(富裕)的
abuse
[]
[] vt. 滥用;辱骂;诋毁
n. 滥用;恶习;弊端
academic
[] a. 学院的,大学的;学术性的;理论的
academy
[] n. (高等)专科院校;学术社团,协会,研究院
accelerate
[] v. 使加速,使增速,促进
vi. 加快,增加
accent
[]
[] n. 口音,腔调;重音(符号)
vt. 重读

accept
[]
vt. 接受,领受;认可,同意
vi. 同意,认可
acceptance
[] n. 接受,接收,验收,接纳;承认,认可
access
[] n. 进入;接入;到达;享用权;入口
vi. 存取

...全文
308 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
endual 2012-06-13
  • 打赏
  • 举报
回复
问题解决了,如需帮助,可加QQ 1019990976 注明来意即可
endual 2012-04-28
  • 打赏
  • 举报
回复
哎。论坛也不支持这个字体
叮当你去哪了 2012-04-28
  • 打赏
  • 举报
回复
没遇到过这样的问题~试试改变数据库设置字符类型吧

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧