Solaris上开发J2EE应用时中文问题的解决

    技术2022-05-11  63

    关于JSP和J2EE的中文问题和处理方法,网上已经有很多文章。一般在中文内核的操作系统(如中文NT,windows2000)上,该问题不是很突出,而在其他一些系统(如linux,Solaris)中就比较明显了。近日在Solaris上开发一个J2EE的应用系统,环境是Solaris 2.7+minij2ee+mySQL。系统在windows和linux下均没有出现中文处理的问题,但部署到Solaris上面后所有中文显示为“?”。

    后来经过分析,发现原因出在系统编码上。由于安装Solaris时默认的系统编码为ASCII,因此以默认的系统编码处理字符串时汉字高位信息丢失。下面一段简单的jsp程序说明了这个问题:

    在浏览器中输入foo.jsp?i=中文,结果显示为??。如果将byte[] b=str.getBytes();换成上面注释掉的byte[] b=str.getBytes("iso-8859-1");,则正常显示出“中文”二字。查阅了mySQL JDBC的驱动程序,问题相同。

    考虑解决的方法有两个,一个是修改JDBC驱动程序,另一个是将汉字编码成7位,从实现方便的角度选择了后者。不过后者的缺点是字符串长度增加,并且无法直接通过SQL工具来修改数据库了。网上有一种汉字编码的方法,是将汉字高位去1,英文则补一个0表示。这种方法有缺陷,因为特定的汉字编码后会出现“'”等SQL语句中有歧义的字符,导致SQL失败。我摘取了minij2ee中uniString的编码方法,该方法将字节表示为其16进制编码,下面是源代码:

    public String encode() { try { StringBuffer sb=new StringBuffer(); byte[] bytes=m_enc.compareTo("")==0m_str.getBytes():m_str.getBytes(m_enc); for(int i =0;i { char ch; ch=Character.forDigit((bytes[i]>>4)&0xF,16); sb.append(ch); ch=Character.forDigit(bytes[i]&0xF,16); sb.append(ch); }

    return sb.toString(); } catch(java.io.UnsupportedEncodingException e) { throw new RuntimeException("Unsupported encoding type."); } }

    public void decode(String encodestr) { StringBuffer sb=new StringBuffer(); int i=0;

    while(i!=encodestr.length()) { sb.append((char)Integer.parseInt(encodestr.substring(i,i+2),16)); i+=2; }

    m_str=new uniString(sb.toString(),"iso-8859-1").cvt(m_enc); } 

    使用编码后,问题解决。

    另外提一下,minij2ee最新版本中提供了一个uniString类,解决了在所有操作系统上的中文问题。使用uniString对象,无需关心字符串本身编码,使用时只要调用函数来获得需要的编码即可,如在jsp里调用uniString.gb()即可以以gb2312输出字符串,在数据库存储时调用uniString.iso()即可以以iso-8859-1编码输出字符串,无论在中文内核还是英文内核的操作系统上均通用。

     

    更多精彩,点击http://sun.csdn.net/solaris/

     

    最新回复(0)