Tomcat的中文处理(二)

    技术2022-05-11  66

    Tomcat的中文處理(二)

     

    上篇我们介绍了tomcat是怎么对接收到字符进行编码的,现在我们来看当向客户端写html文档的时候到底发生了什么?

     

    tomcate在向客户端写出数据的時候,使用的是response输出流來实现的。但是jsp是怎樣使用response流的呢?

    在使用JSP内含對象out輸出的時候,out是一個JspWriter实现类的对象实例,JspWriterImpl(ServletResponse response, int sz, boolean autoFlush)是一个该类的构造函数其使用到了response,在JspWriterImpl内部还有一个java.io.Writer对象实例的引用,在使用JspWriter(JSPout对象)写出数据的时候,会调用如下的函数来初始化

    protected void initOut() throws IOException

        {

            if(out == null)

            {

                out = response.getWriter();/初始化 java.io.Writer對象

            }

        }来初始化该内部对象的。

    然后jspWriter各个输出数据的函数的实现中就是調用上面的java.io.Writer對象的方法的。

        所以不论jsp或者是servlet,对客户端写出html的時候,都是通过response.getWriter();得到的字符流或者由getOutputStream()得到2进制流的。

       一個response存在一個字符流,也存在一個2進制流,但是在同一時刻只能打開使用一個流的。至於兩者的關係,我們在後面介紹。Jspout對象就是response的字符流的。

      同樣的request也存在一個字符流和一個2進制流,但是在同一時刻只能打開使用一個流的。

    response两个流的关系

        我们来考察response实现类getOutputStream()getWriter函数的实现

    public ServletOutputStream getOutputStream()        throws IOException

        {

          。。。。。。。。。。。。。。。。。。。。。

                stream = createOutputStream();///创建response2进制输出流

       。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

            return stream;

        }

    public PrintWriter getWriter()        throws IOException

     {

         。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

               ResponseStream newStream = (ResponseStream)createOutputStream();创建2进制

    。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

                OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());

                writer = new ResponseWriter(osr, newStream);///得到response的字符输出

     。。。。。。。。。。。。。。。。。。。。。。。。。。

            }

        }

    显然我们的字符流就是从2进制转化而来的

        还有两个函数要注意:

    public String getCharacterEncoding()//response编码默认是ISO-8859-1

        {

            if(encoding == null)//如果没有指定编码

            {

                return "ISO-8859-1";

            } else

            {

                return encoding;

            }

        }

    public void setContentType(String type)设置response类型和编码

        {

          。。。。。。。。。。。。。

                encoding = RequestUtil.parseCharacterEncoding(type);得到指定的编码

                if(encoding == null)

                {

                    encoding = "ISO-8859-1";//如果沒有指定编码方式

                }

            } else

            if(encoding != null)

            {

                contentType = type + ";charset=" + encoding;

            }

        }

    好了,现在我们知道了在写出字符的时候使用的response的字符流(不管是jsp或者servlet),也就是使用的OutputStreamWriter osr = new OutputStreamWriter(newStream, getCharacterEncoding());

    注意的是newStreamresponse2进制流的实现

    所以我们还得看看OutputStreamWriter实现

    考察OutputStreamWriter的源代碼,他一個StreamEncoder 类型的对象,就是依靠他來转换编码的;

    StreamEncoder是由sun公司提供的,它有一个

    public static StreamEncoder forOutputStreamWriter(OutputStream outputstream, Object obj, String s)來得到StreamEncoder对象实例

    对于jsp,servlet来说在构造他的时候 outputstream参数response2进制流objOutputStreamWriter对象s就是编码方式的名字其实得到是一個StreamEncoder子类的对象实例

         return new CharsetSE(outputstream, obj, Charset.forName(s1)); CharsetSEStreamEncoder子类。

    他有一个如下的函数来实现编码转换的

    void implWrite(char ac[], int i, int j)throws IOException /// ac是要輸出Stringchar數組

     {

              CharBuffer charbuffer = CharBuffer.wrap(ac, i, j);

              。。。。。。。。。。。。。。。。。。。。。。。

              CoderResult coderresult = encoder.encode(charbuffer, bb, false);/bbByteBuffer,存放编码后的byte缓冲区

          。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

    writeBytes();///bb转化byte数组写入response2进制流中

          。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

     }

     

    至此,我们了解了tomcat背后的编码转换过程

     

     


    最新回复(0)