其中上述代码中的第三行,被我加了注释。这是由于,在2003所带的IIS6当中,不支持这条命令。所以麻烦就来了:在本地用XP调试程序,就得把这条注释去掉,在上传到2003服务器上之前还得再把注释加上。
PHP:header('Content-Type:text/html;charset=GB2312');ASP:Response.Charset("GB2312")JSP:response.setHeader("Charset","GB2312");
方法一:
function gb2utf8(data) ... { var glbEncode = []; gb2utf8_data = data; execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(....{2})(....{2})/g,"%$2%$1").replace(/%([A-Z].)%(....{2})/g,"@$1$2"); t=t.split("@"); var i=0,j=t.length,k; while(++i<j) ...{ k=t[i].substring(0,4); if(!glbEncode[k]) ...{ gb2utf8_char = eval("0x"+k); execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript"); glbEncode[k]=escape(gb2utf8_char).substring(1,6); } t[i]=glbEncode[k]+t[i].substring(4); } gb2utf8_data = gb2utf8_char = null; return unescape(t.join("%")); }使用时:xxx.innerHTML=gb2utf8(req.responseBody); 方法二.
Function bytes2BSTR_GB2312(vIn)strReturn = "" For i = 1 To LenB(vIn)ThisCharCode = AscB(MidB(vIn,i, 1 )) If ThisCharCode < & H80 Then strReturn = strReturn & Chr (ThisCharCode) Else NextCharCode = AscB(MidB(vIn,i + 1 , 1 ))strReturn = strReturn & Chr ( CLng (ThisCharCode) * & H100 + CInt (NextCharCode))i = i + 1 End If Next bytes2BSTR_GB2312 = strReturn End Function方法三:
< script language = " JavaScript " > <!-- function utf8(wide) ... {var c, s;var enc = "";var i = 0;while(i<wide.length) ...{c= wide.charCodeAt(i++);// handle UTF-16 surrogatesif (c>=0xDC00 && c<0xE000) continue;if (c>=0xD800 && c<0xDC00) ...{if (i>=wide.length) continue;s= wide.charCodeAt(i++);if (s<0xDC00 || c>=0xDE00) continue;c= ((c-0xD800)<<10)+(s-0xDC00)+0x10000;}// output valueif (c<0x80) enc += String.fromCharCode(c);else if (c<0x800) enc += String.fromCharCode(0xC0+(c>>6),0x80+(c&0x3F));else if (c<0x10000) enc += String.fromCharCode(0xE0+(c>>12),0x80+(c>>6&0x3F),0x80+(c&0x3F));else enc += String.fromCharCode(0xF0+(c>>18),0x80+(c>>12&0x3F),0x80+(c>>6&0x3F),0x80+(c&0x3F));}return enc;} var hexchars = " 0123456789ABCDEF " ; function toHex(n) ... {return hexchars.charAt(n>>4)+hexchars.charAt(n & 0xF);} var okURIchars = " ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_- " ; function encodeURIComponentNew(s) ... {var s = utf8(s);var c;var enc = "";for (var i= 0; i<s.length; i++) ...{if (okURIchars.indexOf(s.charAt(i))==-1)enc += "%"+toHex(s.charCodeAt(i));elseenc += s.charAt(i);}return enc;} alert(encodeURIComponentNew( " 中文 " ))alert(decodeURIComponent(encodeURIComponentNew( " 中文 " ))) // --> </ script >可是当使用XMLHttpRequest读取中文网页内容时, 如果服务端的程序没有设置Content-Type Response Header,或者Header没有设置编码类型,那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页:
xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(xmlhttp.responseText);};xmlhttp.send(null);纵使yahoo中国这样专业的网站,对web标准的支持还很不彻底,弹出的html源码中充斥不符合web标准的html标签,当然还有已预见的乱码。
同样遗憾的是,FireFox 和 IE 的解决方法也是南辕北辙
FireFox
FireFox 的XMLHttpRequest对象支持overrideMimeType方法,可以指定返回数据的编码类型,利用该方法可以解决中文乱码,前面的代码修改如下:
xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(xmlhttp.responseText);};xmlhttp.send(null);Internet Explorer
IE不支持overrideMimeType方法,并且只能用一种很蹩脚的方法来解决,此时需要引入一个杂交的函数:
function gb2utf8(data){ var glbEncode = []; gb2utf8_data = data; execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2"); t=t.split("@"); var i=0,j=t.length,k; while(++i<j) { k=t[i].substring(0,4); if(!glbEncode[k]) { gb2utf8_char = eval("0x"+k); execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript"); glbEncode[k]=escape(gb2utf8_char).substring(1,6); } t[i]=glbEncode[k]+t[i].substring(4); } gb2utf8_data = gb2utf8_char = null; return unescape(t.join("%"));}xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody};xmlhttp.send(null);
gb2utf8函数直接解析XMLHttpRequest返回的二进制数据,其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢blueidea论坛 提供的算法。
虽然有了解决的办法,但形式丑陋,而且不符合web标准。所以应该在编程中尽量避免,如果是开发web应用,应尽量使用UTF-8编码,或者在服务端设置正确的编码信息。至于以上范例,有盗取其他网站内容的嫌疑,更是不为提倡。