乱码的转换

方法1：

Linux往windows拷贝文件或者从windows往linux拷贝文件，或者linux系统（字符集若不同）间互相拷贝文件，有时候会出现中文文件名乱码的情况，主要原因就是，windows的文件名中文编码默认是GBK，而Linux默认中文文件名编码为UTF-8，由于编码不一致，所以导致了文件名出现中文乱码问题。
在这次招聘中心应用对应的简历文件迁移时，就发生这个问题，因为原先的简历对应的文件名的字符集是GBK，而拷贝过去的linux系统，其字符集是UTF-8，为了解决这个乱码，需要对文件名进行转码，具体如下：

前提保证已安装了convmv；

具体convmv的用法：

Convmv –f 源编码 –t 新编码 [选项] 文件名
一般常用参数：
-r 递归处理子目录
--notest 真正进行操作，默认情况下是不对文件进行真实操作的，只是一个预览
--list 显示所有支持的编码
--unescap 可以做一个转义

比如我们有一个utf8的文件名，要求转换成gbk编码，命令如下：
1
Convmv –f utf-8 –t gbk –notest 文件名

方法2：

linux下最好用的编码转换工具：iconv

例子：将GBK编码的文件转换成UTF－8

1	iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt

批量转换方法：

生成相应的目录结构：
1
find origin -type d -exec mkdir out{} \;
根据origin下的目录结构，生成相应的目录结构到outorigin下；
转换匹配的文件编码：
1
find origin -type f -name '*.java' -exec iconv -f GBK -t UTF-8 {} -o out{} \;
将origin目录下后缀为java的文件编码从GBK转换成UTF-8，并保存在outorigin目录下。注意，先确定源文件的编码格式，选择相应的编码（这里是GBK的），否则转换出来的还是乱码。

还可以继续转换其它匹配的文件：
如：转换HTML文件

1	find origin -type f -name '*.html' -exec iconv -f GBK -t UTF-8 {} -o out{} \;

via.Linux文件名乱码的转换

天德池

这里不是洗澡的地方

Linux文件名乱码的转换

乱码的转换

方法1：

方法2：