ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法-巨人网络通讯

ASP+FSO生成的网页文件默认编码格式以及转换成UTF-8编码方法

具体特征如下：
1、通过模板实现俄文正常。
2、通过后台数据库生成的静态俄文信息，后台显示正常，前台乱码。
3、英文正常。
和该主题相关的类似或不同表达
FSO写UTF-8编码文件
FSO怎么才能生成utf-8编码的文件
FSO生成的文件默认是什么编码格式
如何转换成UTF-8编码
FSO生成静态网页的问题
ASP中用FSO生成文件代码如下

复制代码代码如下:

 
function createfile(sfilename,scontent) 
set fso=server.CreateObject("scripting.filesystemobject") 
set f1=fso.opentextfile(sfilename,2,true,-1) 
f1.write(scontent) 
f1.close 
set fso=nothing 
end function 

fso.opentextfile(sfilename,2,true,-1) 最后一个参数-1是指定编码格式为Unicode，编码格式为Unicode在网页显示的是UTF-16 little-endian。
OpenTextFile方法
创建指定文件并返回TextStream对象，该对象可用于读或写创建的文件。
object.OpenTextFile(filename[, iomode[, create[, format]]])
参数 object，必选项。应为FileSystemObjec或Folder对象的名称。这里是fso。
filename，必选项。字符串表达式，指明要创建的文件。这里是sfilename。
iomode，可选参数，表示该文件是被用来读、写还是追加，默认为1表示读，2表示写操作，8表示追加操作。
create，可选参数，如果文件不存在是否创建，默认为false，如果希望进行创建，则设置为true。
format，参数可为下列设置之一，默认为ASCII格式，并没有我们要的utf-8：
TristateUseDefault -2 以系统默认格式打开文件。
TristateTrue -1 以Unicode格式打开文件。
TristateFalse 0 以ASCII格式打开文件。
FSO的编码属性只有三种，系统默认，Unicode，ASCII，并没有我们要的utf-8，所以一般中文系统上使用FSO组件生成的文件都是gb2312编码格式。
解决方法一
GB2312编码包含俄语字母，如果页面设置为简体中文GB2312，那么俄文能够正常显示，但由于中文默认“宋体”显示，在 “宋体”中俄语会显示为全角字符，很难看，所以要采用外文字体，如“新罗马”或“Arial”等。中国客户那里可以交差，但真正的俄国人浏览页面时，就需要下载和安装中文，很不理想，很可能导致放弃浏览网页。
解决方法二
ASP由于是一种古老的语言，它的一些功能对UTF-8支持非常差。FSO不支持直接生成UTF-8格式的文件，因为它无法指定需要的文件格式，比如，想生成一个UTF-8格式的文件，使用常用的Scripting.FileSystemObject对象就不行。必须换一种思路，用Adodb.Stream，当前一些blog程序就是这样实现的，如zblog。
Scripting.FileSystemObject 对象创建文件的函数，是下面方式：
FileSystemObject.CreateTextFile(filename[,overwrite[,unicode]])
其中的unicode属性是这样描述的：
可选项。Boolean值指明是否以Unicode或ASCII文件格式创建文件。如果以Unicode文件格式创建文件，则该值为True；如果以ASCII文件格式创建文件，则该值为False。如果省略此部分，则假定创建ASCII文件。
鲜然，无法用这个函数来创建UTF-8格式文件。
使用ADODB.Stream对象，使用方法见下面：

复制代码代码如下:

 
Set objStream = Server.CreateObject("ADODB.Stream") 
With objStream 
.Open 
.Charset = "utf-8" 
.Position = objStream.Size 
.WriteText=str 
.SaveToFile server.mappath("/sitemap.xml"),2 
.Close 
End With 
Set objStream = Nothing 

附录：ASCII、Unicode、UTF-8介绍
ASCII是一种字符集，包括大小写的英文字母、数字、控制字符等，它用一个字节表示，范围是0-127。
由于ASCII表示的字符非常有限，各个国家或者地区在此基础上提出了自己的字符集，比如在中国应用非常广泛的GB2312，它为汉字提供了编码，用两个字节表示。
这些字符集之间互不兼容，相同的数字可能表示不同的字符，为信息交流带来了麻烦。
Unicode是一种字符集，它将世界上的所有字符映射成一个唯一的数字(code point)，比如字母a对应的数字0x0041。目前Unicode还处于发展中，它所包容的字符越来越多。
在将Unicode表示的字符进行存储时，还需要一定的编码方式，比如UCS-2，它用两个字节来表示Unicode编码的字符。而UTF-8是Unicode字符集的另外一种编码方式，它是变长度的，最多6个字节，小于127的字符用一个字节表示，与ASCII字符集的结果一样，因而具有非常好的兼容性，ASCII编码下的英语文本不需要修改就可以当作UTF-8编码进行处理，应用非常广泛。

您可能感兴趣的文章: