使用enca进行字符集转码

在linux进行开发与运维的时候,我们经常遇到字符编码的问题,系统字符设置、vimrc fileencoding设置、终端设置往往搞的晕头转向,当一个文件出现乱码的时候,我们通常不能识别它是什么编码的,而从不知道如果正确解码。

今天使用enca这个字符集编解码工具,感觉比incov好用很多,安装:

1)下载enca工具
  wget http://dl.cihar.com/enca/enca-1.13.tar.gz
2)tar -zxvf enca-1.13.tar.gz
3)./configure –prefix=/your/path

4)make
5)make install

用法:enca有几个地方比incov好的地方:

1) 直接识别字符集,eg:

enca -L zh_CN test.cpp

Simplified Chinese National Standard; GB2312

2) 转换命令简单,eg:

enca -L zh_CN -x UTF-8 test.cpp or enca -L zh_CN -x GB2312 test.cpp

如果想改文件编码,直接将转换结果写回了test.cpp,不用指定输入文件再mv回去。

3) 支持批量输入:

enca -L zh_CN -x UTF-8 test.cpp test.h