请教一个JAVA IO问题

tylovexuejian 2009-09-23 10:44:47

import java.io.FileInputStream;

import java.io.*;



public class Test {

	public static void main(String[] args) throws IOException{

		FileInputStream dwt = new FileInputStream("dwt.txt");

		System.out.println(dwt.read());

		System.out.println(dwt.read());



	}



}

dwt.txt只有一个婷字；
为什么输出为230
195
而不是 90
119

...全文

94 8 打赏收藏转发到动态举报

写回复

8 条回复

切换为时间正序

请发表友善的回复…

发表回复

zhongyucai 2009-09-23

打赏
举报

回复

输出的是汉字的内码。这是当然的啦。。

pywepe 2009-09-23

打赏
举报

回复

[Quote=引用楼主 tylovexuejian 的回复:]
Java codeimport java.io.FileInputStream;import java.io.*;publicclass Test {publicstaticvoid main(String[] args)throws IOException{
FileInputStream dwt=new FileInputStream("dwt.txt");
System.out.println(dwt.read());
System.out.println(dwt.read());

}

}
dwt.txt只有一个婷字；
为什么输出为230
195
而不是 90
119

[/Quote]

你用的是字节流
读一个一个字节

gzbtiantian 2009-09-23

打赏
举报

回复

学习了

menjianguo 2009-09-23

打赏
举报

回复

跟文件的编码格式有关。
ANSI应该就是230，195

xyq002444 2009-09-23

打赏
举报

回复

同上

nxyc_twz 2009-09-23

打赏
举报

回复

取的是汉字内码，当然不会<128了

magicbu 2009-09-23

打赏
举报

回复

这个要看你文件保存时的编码格式的，ANSI的话应该就是230，195了

tylovexuejian 2009-09-23

打赏
举报

回复

感谢各位的回答，特别是阿布。愿热心的大家天天好心情。

最近一直在研究爬虫和Lucene，虽然开始决定选用Heritrix来执行爬虫操作，但是后来发现用它来做还是存在一定的问题，比如需要程序生成相应的XML文件，对于同一个Job，怎样才能保证重复运行该Job时文件夹始终是同一个（Heritrix为Job创建文件夹的规则是“Job名称-时间戳”）等等，都是需要考虑的问题，最终还是将其搁浅。　　后来google了一下，找到了一个简单爬虫的程序代码（http://www.blogjava.net/Jack2007/archive/2008/03/24/188138.html），随即试验了一下，发现确实能得到网页的内容，在这里还是要谢谢代码的提供者——Jack.Wang。　　虽然试验成功，但是在随后的大数据量试验时，还是出现了问题。最初试验时，我只是让程序去抓取10个URL链接，当我将URL链接数改为100个时，问题出现了——URL中存在重复，而且非常容易的就变成死循环。举个例子来说，比如我首先爬的是A.html，在A.html中有两个链接：B.html，C.html，等爬完A.html以后，程序会爬B.html，这时如果B.html中的所有链接中有A.html这个页面的链接，那么程序又会去爬A.html这个页面，如此一来就形成了一个死循环，永远也不能停止。　　跟踪程序发现，原来是在添加要抓取的网页的链接列表中，没有将已经抓取过的URL去除，所以才造成了死循环。现在虽然加上了这个判断，但是从我运行程序的效果来看，也不是很理想，总是感觉有些慢，800个页面要一两分钟才能爬完，这个我觉得有点说不过去。　　这个产品，做到现在，我遇到了这么几个情况，有和大家分享的，也有向大家请教，求助的。　　 1.关于对应关系数据的保存方式　　在创建索引的时候，需要将网页的URL和网页的内容传到相应的方法中，当然URL和内容是要对应的，也许是经验太少吧，我采取的是通过构建一个JavaBean的方式来传递的，不知道大家有没有更好的方法　　　　 2.关于要创建索引的内容的保存方式　　最初的想法是不创建文件，直接将内容保存到变量中，然后创建索引，即先抓取网页的内容，然后将网页的内容和URL保存到自己构建的JavaBean对象中，接着将这个对象放到一个list列表中，等所有网页抓取完毕以后，将这个列表传到创建索引的方法中。这种做法看似不错，可是当URL数量很大时，会导致内存不够用，所以还是创建文件比较稳妥。　　 3.关于网页编码问题　　遇到这个问题也是一个巧合，本来我抓取的是客户的一个网站，后来同事说如果客户看访问日志，这个月的数据会和平常的数据不一样，所以我就抓取公司的网站，结果，问题出现了。原先公司的网站是用GB2312编码做的页面，现在采用的是UTF-8的编码，虽然我已经判断了页面的编码，可是依然不能解决保存的文件中文乱码的问题，不知道大家有什么好办法没有。错误信息为：java.io.UnsupportedEncodingException 　　附件为爬虫代码本文出自 “徘徊在c＃，java，php之间” 博客，请务必保留此出处http://jerrysun.blog.51cto.com/745955/221879

# 边牧智力开发计划活动并使用Java设计学习方案 ## 简介边牧智力开发计划活动旨在帮助边牧犬发掘其潜在的智力和天赋，让其在训练中获得更好的成长和发展。本文将介绍如何使用Java设计学习方案，帮助边牧犬更好地参与智力开发计划活动。 ## 学习方案 ### 目标通过学习Java编程，帮助边牧犬掌握基础的编程知识和技能，为其参与智力开发计划活动打下基础。 ### 内容 1. Java基础知识：数据类型、变量、运算符、流程控制语句、数组等。 2. 面向对象编程：类、对象、继承、封装、多态等。 3. Java API：常用类的使用、IO流操作、异常处理等。 4. Java GUI编程：Swing组件、事件处理等。 ### 方法 1. 自学：通过在线课程、视频教程等自学Java编程。 2. 实践：通过编写简单的程序、小游戏等进行练习和实践。 3. 辅导：请教Java专业人士或其他有经验的程序员进行辅导和指导。 ## 活动设计 ### 目标通过Java编程训练，帮助边牧犬提高智力和动手能力，让其更好地参与智力开发计划活动。 ### 内容 1. Java编程训练：

java8 源码关于 JavaGuide 的相关介绍请看：准备面试的小伙伴可以考虑面试专版：，欢迎加入获取更多实用干货。阿里云最近在做活动，服务器不到 10 元/月，小伙伴们搭建一个网站提高简历质量。支持国内开源做的比较好的公司！项目的发展离不开你的支持，如果 JavaGuide 帮助到了你找到自己满意的 offer，那就:hot_beverage:！我会继续将项目完善下去！加油！《JavaGuide 面试突击版》PDF 版本+3 本 PDF Java 学习手册，在公众号后台回复“面试突击”即可获取。如果 Github 访问速度比较慢或者图片无法刷新出来的话，可以转移到查看，或者。如果你要提交 issue 或者 pr 的话请到提交。如要进群或者请教问题，请（备注来自 Github。请直入问题，工作时间不回复）。开始阅读之前必看：。 Sponsor 目录 Java 基础基础知识系统总结：重要知识点详解：（很重要的一个数据结构，用好枚举真的没有那么简单！）其他：容器源码分析：、、、并发面试题总结：面试常问知识点：线程池：、 JVM 其他 Linux IO ： I

importjava.io.*;publicclassTestTransForm{publicstaticvoidmain(String[]args){try{OutputStreamWriterosr=newOutputStreamWriter(newFileOutputStream("C:/java/A/b/lol.txt"));os...import java.io.*;public cla...

关于IntelliJ IDEA的一个新手易被坑之处——java.io.FileNotFoundException: jdbc.properties (系统找不到指定的文件。) 不知道有没有新手在IDEA中遇到过类似**java.io.FileNotFoundException: jdbc.properties (系统找不到指定的文件。)**这样的错误。这个东西可困扰了我好几天，某度，某吧都找不到答案，最后请教了一个大佬才知道了问题的答案。通常的找不到文件可能是路径写错了，或者一些配置的问题，这些网上可

62,614

社区成员

307,327

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章