Linux下将UTF8编码批量转换成GB2312编码的方法-巨人网络通讯

Linux下将UTF8编码批量转换成GB2312编码的方法

　　UTF8编码和GB2312编码是有区别的，在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误，这时就需要将UTF8编码转换成GB2312编码，可是一个个的转换十分麻烦，下面小编就教你如何在Linux下将UTF8编码批量转换成GB2312编码。

　　背景

　　本人在使用oracle的sqlplus批量导入UTF8编码的sql脚本时，由于不了解如何设置让sqlplus识别UTF8格式，导致出现乱码、错行等错误，而使工作无法继续，在google无果的情况下只好想办法转换编码。

　　由于文件较多，手动转换太麻烦，于是想到用脚本批量转换，幸好网上相关脚本比较多，实现起来唯一的麻烦是UTF8的BOM标记。

　　内容：

　　代码如下：

　　#！/bin/bash

　　for loop in `find 。 -type f -name “*.sql” -print`do

　　echo $loop

　　mv -f $loop $loop.tmp

　　dos2unix $loop.tmp

　　file_check_utf8=‘file_check_utf8.log’

　　sed -n ‘1l’ $loop.tmp 》$file_check_utf810. if grep ‘^\\357\\273\\277’ $file_check_utf8 》/dev/null 2》111. then

　　echo ‘UTF-8 BOM’

　　sed -n -e ‘1s/^.。。//’ -e ‘w intermediate.txt’ $loop.tmp14. iconv -f UTF-8 -t GB2312 -o $loop intermediate.txt15. rm -rf intermediate.txt

　　rm -rf $loop.tmp

　　elif iconv -f UTF-8 -t GB2312 $loop.tmp 》/dev/null 2》118. then

　　echo ‘UTF-8’

　　iconv -f UTF-8 -t GB2312 -o $loop $loop.tmp21. rm -rf $loop.tmp

　　else

　　echo ‘ANSI’

　　mv -f $loop.tmp $loop

　　rm -rf $file_check_utf8

　　#模拟unix2dos，要求文本文件最后一行必须有换行符28. sed -n -e ‘s/$/\r/g’ -e ‘w ’$loop.tmp $loop29. mv -f $loop.tmp $loop

　　done

　　#！/bin/bash

　　for loop in `find 。 -type f -name “*.sql” -print`do

　　echo $loop

　　mv -f $loop $loop.tmp

　　dos2unix $loop.tmp

　　file_check_utf8=‘file_check_utf8.log’

　　sed -n ‘1l’ $loop.tmp 》$file_check_utf810. if grep ‘^\\357\\273\\277’ $file_check_utf8 》/dev/null 2》111. then

　　echo ‘UTF-8 BOM’

　　sed -n -e ‘1s/^.。。//’ -e ‘w intermediate.txt’ $loop.tmp14. iconv -f UTF-8 -t GB2312 -o $loop intermediate.txt15. rm -rf intermediate.txt

　　rm -rf $loop.tmp

　　elif iconv -f UTF-8 -t GB2312 $loop.tmp 》/dev/null 2》118. then

　　echo ‘UTF-8’

　　iconv -f UTF-8 -t GB2312 -o $loop $loop.tmp21. rm -rf $loop.tmp

　　else

　　echo ‘ANSI’

　　mv -f $loop.tmp $loop

　　rm -rf $file_check_utf8

　　#模拟unix2dos，要求文本文件最后一行必须有换行符28. sed -n -e ‘s/$/\r/g’ -e ‘w ’$loop.tmp $loop29. mv -f $loop.tmp $loop

　　done

　　解释

　　1.处理UTF8的BOM，本人没有找到好的办法，最后用sed＋grep判断了一下，如果前三个字节是\\357\\273\\277，则文件必定是UTF8，用sed去掉这三个字节再转换

　　2.为了避免重复或者遗漏，脚本中用iconv对没有BOM的文件尝试转换了一把，转换成功说明文件是UTF8，否则说明是ANSI也就是GB2312

　　3.关于最后的sed命令，那是因为本人的系统上没有unix2dos命令，所以进行了模拟，目的是为了方便自己在windows下查看和编辑

　　以上就是Linux下将UTF8编码批量转换成GB2312编码的方法介绍了，转换后就能解决乱码等问题，可使用命令镜像批量转换，你学会了吗？

上一篇：Linux下利用PC机进行路由转发将Linux变成一台路由器
下一篇：Linux下清除文件中的隐私数据以保护个人隐私

Linux下将UTF8编码批量转换成GB2312编码的方法

UTF8编码和GB2312编码是有区别的，在sqlplus中导入UTF8编码的sql脚本就会出现乱码错误，这时就需要将UTF8编码转换成GB2312编码，可是一个个的转换十分麻烦，下面小编就教你如何在Linux下将Linux,下将,UTF8,编码,批量,...

韶关电话销售防封软件咨询

电话销售防封软件高效防封，接通率高，提高工作效率，降低企业营销成本。 Sapphi...

苹果地图标注在179城加入共享单车

3月13日上午音讯，苹果公司与数据整合商Ito World签署了协作协议，将在苹果地图中上增...

Win10 Dev预览版Build 20221正式推送(附更新内容)

大家都知道，微软今天在 Dev 开发频道发布了 Windows 10 预览版 Build 20221，带来了两个新...

夏季达沃斯论坛展现5G智慧生活新图景

从手术机器人到安保智能眼镜，在2019年夏季达沃斯论坛会场，一大批依托5G技术的科技...

公司地图标注地址怎么修改？地图标注公司和地址怎么修

百度地图标注怎么修改地址？ 1、百度地图搜索地址，在需要修改的地址下面点击“纠...

清远市电话机器人维修点（清远家电上门维修电话）

本文目录一览：1、扫地机器人哪里维修2、库卡机器人(广东)有限公司电话是多少?3、扫...

客服外呼系统哪个好（外呼客服是）

本文目录一览： 1、在线客服体系哪个好2、现在有哪些外呼体系比较靠谱？3、手机外呼...

AI智能营销系统大咖共议“人工智能生态链”

AI智能营销系统大咖共议“人工智能生态链”深圳市数心科技有限公司历经多年的技术...

南通智能外呼系统预算的简单介绍

本篇文章给我们谈谈南通智能外呼体系预算，以及对应的常识点，期望对各位有所协助...

圆通客服电话机器人（圆通在线客服是机器人吗）

本文目录一览： 1、圆通快递电话95554怎样转人工服务?2、95554是机器人怎样转人工?3、圆...

外呼系统打电话开场白（外呼开场白多种常用话术）

本文目次一览： 1、德律风营销的收场白如何说本领招惹人 2、发售打德律风该怎样说...

400电话申请贵吗东莞400电话办理流程及费用

在申请400电话时，也会产生相应的成本，但需要注意的是，这里的成本可以分为两部分...

根据不同的渠道作出符合该渠道受众的文案

本文所分享的文案写作方法论是针对渠道而言，希望大家有所收获！很多刚入门的文案...

轻扫云电销机器人（电销智能机器人）

本文目次一览： 1、有谁用过电销呆板人？作用如何样？ 2、电销呆板人功能有哪些呢？...

IBM称菲律宾取代印度在全球商务外包业排名第一

据菲律宾《星报》12月2日报道，根据IBM公司的一份报告，菲律宾已取代印度，在全球共...

Linux下将UTF8编码批量转换成GB2312编码的方法

全 部 栏 目

全部栏目