Linux解决乱码问题以及查看文件编码方式

Static-AJ 2012-07-24 06:09:19
在linux下操作windows下的文件,经常遇到文件乱码,现在就是不知道能不能改变linux系统的编码,就不要再对文件进行编码转换了。求大神指教~

下面是昨天看的一点资料

---------------------------------------------------------------------------------------------------------------------------------


如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。

查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8

文件名编码转换:
从Linux 往 windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。
首先看一下你的系统上是否安装了convmv,如果没安装的话用:
yum -y install convmv
安装。

下面看一下convmv的具体用法:

convmv -f 源编码 -t 新编码 [选项] 文件名

常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:

convmv -f UTF-8 -t GBK --notest utf8编码的文件名
这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)
...全文
1694 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
SunnyCoffee 2012-07-31
  • 打赏
  • 举报
回复
额,惭愧啊。
我是说在图形界面下可以用某些软件的。什么软件忘了。好像是ubuntu下的
Static-AJ 2012-07-31
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 的回复:]

用vi打开文件,然后输入:set fileencoding
[/Quote]

恩恩 这个知道~
Static-AJ 2012-07-31
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 的回复:]

额,惭愧啊。
我是说在图形界面下可以用某些软件的。什么软件忘了。好像是ubuntu下的
[/Quote]

额 呵呵 好吧~~
stormiest 2012-07-31
  • 打赏
  • 举报
回复
用vi打开文件,然后输入:set fileencoding
Linux-Torvalds 2012-07-25
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 的回复:]

引用 1 楼 的回复:

locale当中的LC_ALL设置为zh_CN.GBK,不过这样子会带来一些问题。还是用utf8比较好,乱码的解决方式还是推荐使用这篇文章所说的。




也就是说还是最好每次都改变文件的编码?
[/Quote]不是改变,你看到你推荐的那个文章,是让它可以正常显示。
Static-AJ 2012-07-25
  • 打赏
  • 举报
回复
[Quote=引用 1 楼 的回复:]

locale当中的LC_ALL设置为zh_CN.GBK,不过这样子会带来一些问题。还是用utf8比较好,乱码的解决方式还是推荐使用这篇文章所说的。
[/Quote]



也就是说还是最好每次都改变文件的编码?
Static-AJ 2012-07-25
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 的回复:]

linux下的配置文件编码格式默认也是UTF-8,如果更改系统的语言环境,估计系统也不好维护了。
如果用图形的话,还是有好多其他软件可以用的。
[/Quote]



如果用图形的话,还是有好多其他软件可以用的。 什么意思呀~
SunnyCoffee 2012-07-25
  • 打赏
  • 举报
回复
linux下的配置文件编码格式默认也是UTF-8,如果更改系统的语言环境,估计系统也不好维护了。
如果用图形的话,还是有好多其他软件可以用的。
Static-AJ 2012-07-25
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 的回复:]

引用 2 楼 的回复:

引用 1 楼 的回复:

locale当中的LC_ALL设置为zh_CN.GBK,不过这样子会带来一些问题。还是用utf8比较好,乱码的解决方式还是推荐使用这篇文章所说的。




也就是说还是最好每次都改变文件的编码?
不是改变,你看到你推荐的那个文章,是让它可以正常显示。
[/Quote]


好吧~~
Linux-Torvalds 2012-07-24
  • 打赏
  • 举报
回复
locale当中的LC_ALL设置为zh_CN.GBK,不过这样子会带来一些问题。还是用utf8比较好,乱码的解决方式还是推荐使用这篇文章所说的。

19,611

社区成员

发帖
与我相关
我的任务
社区描述
系统使用、管理、维护问题。可以是Ubuntu, Fedora, Unix等等
社区管理员
  • 系统维护与使用区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧