用Javascript读取中文COOKIE的解决办法

在cookie的使用中，我们发现这样一个问题：如果写入cookie的内容是中文（如用户称呼），用服务器端程序（如ASP或PHP）读出完全正确，但是用一般的javascript或VBscript的读cookie函数取出的却是一堆乱码。这是一个棘手的问题，因为在有些情况下，cookie的内容需要在客户机端用脚本语言读取。如果你写入了中文，得到了一堆乱码，是不是感觉很别扭呢？解决这个问题，还要从cookie的存取方式说起。
　　我们知道，写入cookie内容前需要进行escape（十六进制编码），编码时又是以字节为单位的，这就是问题的关键所在：任何一个汉字都会被拆成两个字节分别编码；而在读cookie时，unescape又以字节单位解码，因此最后每个汉字都变成了两个字节的乱码。怎么办呢？ASP或PHP方式能够正确读出，应该是在unescape解码后，又按照unicode编码把其中的汉字拼了出来。如果这样的话，能不能找到一种变通的方法解决这个问题呢？仔细研究后发现，只要在十六进制codec（编解码）过程中能够保存汉字信息就行了，因而我们需要再外包一层codec过程，方案如下：

　　1.在escape编码前，把cookie字符串中的每个字符转换为unicode码的字符串形式（用一特殊字符作为字串的分隔符）。

　　2.在unescape解码后，先把所有unicode字串提取出来，再用对应的函数转换为原字符。

复制代码代码如下:

VBscript版程序如下：

复制代码代码如下:

例如你要写入的cookie内容是"一顶abc"，经过Codecookie变为"99a98a97a－31029a26432a"（基于安全考虑，将字符串反转），再经过escape编码后变为"99a98a97a%2D31029a26432a"（escape编码将除字母和数字以外的字符转换为十六进制%XX的形式），注意分隔符不能选%，D和数字。当然，如果有类似密码的重要信息，还需要在加密上再强化一下。因为写入cookie的一般都是短信息，编码后增加的一些字节可忽略不计。下面的javascript读写cookie函数中就加入了以上的中文支持。

function Setcookie(name,value,expires)
{
　var exp=new Date();
　exp.setTime(exp.getTime()+expires*60*1000);
　documents.cookie=name+"="+escape(Codecookie(value))+" ; expires="+exp.toGMTString()+" ; path=/";
}

function Getcookie (name)
{
　var strArg=name+"=";
　var nArgLen=strArg.length;
　var ncookieLen=documents.cookie.length;
　var nEnd;
　var i=0;
　var j;

while (i{
　j=i+nArgLen;
　if (documents.cookie.substring(i,j)==strArg)
{
　nEnd=documents.cookie.indexOf (";",j);
　if (nEnd==-1) nEnd=documents.cookie.length;
　return Decodecookie(unescape(documents.cookie.substring(j,nEnd)));
}
　i=documents.cookie.indexOf(" ",i)+1;
　if (i==0) break;
}
　return null;
}

如果用CGI程序写入中文cookie，客户端读取。如在ASP里，可以先使用前述的编码函数后，再用response写入，例如：response.cookies("Name")=Codecookie("张三")至此，中文cookie的问题基本解决。

用Javascript读取中文COOKIE的解决办法

JavaScript相关栏目本月热门文章