tomcat乱码问题

    技术2022-05-11  93

    解決 Tomcat 5.0.19 中文參數傳遞問題 [精華] 精靈 發文: 73 積分: 7 於 2004-04-14 02:07     收藏文章? ||
    實際運用 Tomcat 5.0.19,我們了解在不修改 Tomcat 原始碼的狀況下,使用者透過 Form submit 的資料將一律以 ISO8859-1 處理,程式設計師必須自行將字串將轉換為 Big5(繁體中文) or GB2312/GBK(簡體中文),我們在應用程式中,對所有的 request.getParameter("xx"); 作了 toBig5String() 的處理,理論上,所有的中文問題應該不會出現才對,結果,還是發現某些狀況下,中文還是變成亂碼! 經過分析整理,我們發現問題出在 QueryString 的解析,以前在 Tomcat 4.x 時代,無論 SUBMIT 時採用 GET or POST,Tomcat server 對 parameters 的處理都採用相同的編碼,但在 Tomcat 5.x 版,不知何故,卻將 QueryString 的解析獨立出來,目前確認,Form 的 Method 採用 GET 及直接將參數寫在 URL 上的中文,上傳到 Tomcat 時,無論如何轉碼,都會變成亂碼,那怕你事先作過 URLEncode 也一樣。 網站上,有人針對這個問題,建議將所有中文改採用 base64 編碼,到了 server 上,程式將自行土 base64 decode 回來,確保中文不會發生問題。這樣作法當然可以解決這個問題,但是所有網頁變成限定要採用 POST,且程式設計師要隨時分清楚,那個參數是採用 GET 上傳,那個參數是採用 POST 上傳,然後再針對不同的方式採用不同的解析,這樣的程式一點兒移植性都沒有,更別提跨平台、跨國際語言了。 研究 Tomcat 的文件及原始碼,我們找到了問題所在及解決的方法,只有按著以下的作法,才能使 Form submit 的資料完全按著 ISO8859-1 的編碼,當然,若是全照著 Tomcat 的文件說明去作,肯定還是不行,你還是得加上這個參數到 server.xml 中才行。 解決方案 請先研究 $TOMCAT_HOME/webapps/tomcat-docs/config/http.html 這個說明檔,擷錄重點如下: URIEncoding:This specifies the character encoding used to decode the URI bytes, after %xx decoding the URL. If not specified, ISO-8859-1 will be used. useBodyEncodingForURI:This specifies if the encoding specified in contentType should be used for URI query parameters, instead of using the URIEncoding. This setting is present for compatibility with Tomcat 4.1.x, where the encoding specified in the contentType, or explicitely set using Request.setCharacterEncoding method was also used for the parameters from the URL. The default value is false. 上述二個 Tomcat 參數,是設定在 server.xml 中的 http <Connector /> 區塊,要解決 QueryString 中文變成亂碼的問題,你必須至少設定這二個參數其中之一。 URIEncoding 請設定為 URIEncoding="ISO-8859-1" 指定為 "ISO-8859-1" 編碼,讓 QueryString 的字元編碼與 post body 相同。 useBodyEncodingForURI 這是用來相容 Tomcat 4.x 版的,設定的值是 "true" or "false",意思是指 "要不要讓 QueryString 與 POST BODY 採用相同的字元編碼 ?",若是設成 true,那也可達到 "ISO-8859-1" 編碼的需求。 建議,採用 URIEncoding 的設定,畢竟 useBodyEncodingForURI 的作法是為了相容 Tomcat 4.X。不過若照原文的說明,理論上這二個參數都不設,Tomcat 也該採用 "ISO-8859-1" 的編碼,那為什麼還是會有問題呢 ? 我們由 Tomcat Source Code 來看就清楚了。 1234567891011121314151617181920212223242526272829 // 這一段碼是 Tomcat 用來解 QueryString 的程式, // 在 org.apache.tomcat.util.http.Parameters 這個 class 裡。 private String urlDecode(ByteChunk bc, String enc) throws IOException { if( urlDec==null ) { urlDec=new UDecoder(); } urlDec.convert(bc); String result = null; if (enc != null) { bc.setEncoding(enc); result = bc.toString(); } else { CharChunk cc = tmpNameC; cc.allocate(bc.getLength(), -1); // Default encoding: fast conversion byte[] bbuf = bc.getBuffer(); char[] cbuf = cc.getBuffer(); int start = bc.getStart(); for (int i = 0; i < bc.getLength(); i++) { cbuf[i] = (char) (bbuf[i + start] & 0xff); } cc.setChars(cbuf, 0, bc.getLength()); result = cc.toString(); cc.recycle(); } return result; } 請特別注意紅色區塊,當 Tomcat 發現 QueryString 並沒有設定 encode 時,並非像文件中所說預設採用 ISO-8859-1 的編碼,而是用一段 fast conversion 來處理,才會造成中文問題,所以,還是必須在 Server.xml 中,加上 URLEncoding 的參數設定才行哦。 Connector 的設定範例: 123456789101112131415 <Connector debug="0" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" port="80" redirectPort="8443" enableLookups="false" minSpareThreads="25" maxSpareThreads="75" maxThreads="150" maxPostSize="0" URIEncoding="ISO-8859-1" > </Connector> browser edited on 2004-04-14 02:22 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] browser 戀香 版主 發文: 3510 積分: 1 於 2004-04-14 02:40     收藏文章? ||
    太好了 .... 十分感謝 精靈 兄整理的這份資料 ... 這份文件是 Tomcat 5.0.19 中文參數傳遞的正解 ... 原本當初也想在書中特別提出來介紹的,但是當時己經進入排版階段 .. 在這邊我做幾項補充 ... 一般說來,我們在使用 Tomcat 4 透過 GET or POST 的方式傳參數時,通常都是使用 Filter 的方式來解決中文傳參數的問題。 但是到了 Tomcat 5.0.19 之後,解決中文傳遞參數時,就必須考慮是使用 GET or POST,兩種解決的方式不一樣。 如果是使用 GET 的方式傳遞時,就如同 精靈 兄 的文章所述,或者使用 1 String name = new String((request.getParameter("name")).getBytes("ISO-8859-1"),"Big5"); ;若是使用 POST 的方式時,就延用傳統一般解決中文的方式 1 request.setCharacterEncoding("Big5"); 不過當初我最後的做法是使用 Filter 的方式 Filter 的做法就是:先判斷是使用那種傳遞方式( GET or POST),假若是用 GET 的方式就採用第一種 code;若使用POST 方式,就採用第二種 code。 browser edited on 2005-03-16 15:15
    作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] 發條盒子 問問題的麻煩傢伙 發文: 120 積分: 0 於 2004-04-16 01:05     收藏文章? ||
    request.setCharacterEncoding("Big5"); 我用這一行可以解決get和post的問題,這是為什麼呢? 反而我去設定了URIEncoding="ISO-8859-1"卻沒有什麼用也 環境tomcat5.0.16+j2sdk1.4.2_03+windows xp browser edited on 2004-04-16 01:07
    如果我能學好jsp就好了我是新手,希望大家體諒我問的問題太白痴^^買書買到沒有錢錢 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] jan 發文: 47 積分: 0 於 2004-05-07 16:04     收藏文章? ||
    我在server.xml中依照精靈前輩所說的這個設定修改了Connector Tag 1234567891011121314 <Connector debug="0" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" port="80" redirectPort="8443" enableLookups="false" minSpareThreads="25" maxSpareThreads="75" maxThreads="150" maxPostSize="0" URIEncoding="ISO-8859-1"> </Connector> SUBMIT中文時採用GET的方式依然結取到亂碼耶~~ 請問還有要注意什麼嗎? 我的平台: OS : Windows2003 Server SDK : Sun SDK 1.4.2_03-b02 Tomcat 5.0.19 jan edited on 2004-05-07 16:20 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:jan] browser 戀香 版主 發文: 3510 積分: 1 於 2004-05-07 16:25     收藏文章? ||
    jan wrote: 我在server.xml中依照精靈前輩所說的這個設定修改了Connector Tag 1234567891011121314 <Connector debug="0" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" port="80" redirectPort="8443" enableLookups="false" minSpareThreads="25" maxSpareThreads="75" maxThreads="150" maxPostSize="0" URIEncoding="ISO-8859-1"> </Connector> SUBMIT中文時採用GET的方式依然結取到亂碼耶~~ 請問還有要注意什麼嗎? 我的平台: OS : Windows2003 Server SDK : Sun SDK 1.4.2_03-b02 Tomcat 5.0.19 我是使用 URIEncoding="Big5"
    作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] plutotw 井底蛙 發文: 358 積分: 2 於 2004-05-09 17:43     收藏文章? ||
    我們老師提的解決方案,用 1 URIEncoding="MS950" 測試結果在 windows 上是正常的 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] senshaw 發文: 1 積分: 0 於 2004-06-12 18:55     收藏文章? ||
    感謝~我發現tomcat 5中文參數問題後,遲遲不敢升級,現在見到曙光了 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:browser] sindylee 發文: 1 積分: 0 於 2004-07-14 17:21     收藏文章? ||
    請問若是在filter判斷是否為GET 或 POST 的話, 那麼 若是 POST method, 則可直接用 request.setCharacterEncoding 做掉, 若是 GET method, 該如何將處理完的結果存回 request , 然後傳送到 JSP 中呢? 因為不想在每支JSP 中去判斷及處理 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] hcl 發文: 6 積分: 0 於 2004-07-16 13:09     收藏文章? ||
    想請教各位先進,小弟我依照上述方式改了設定,但是圖檔連結的檔名 是中文,那在TOMCAT5.0.19上面無法顯示,想請問一下該如何處理呢? 1 <img src="中文檔名" /> 環境: WINDOWS 2000 SP4 + TOMCAT5.0.19 + IIS 5.0 hcl edited on 2004-07-16 15:47 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] prf 發文: 1 積分: 0 於 2004-08-16 11:05     收藏文章? ||
    好贴。 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:hcl] Jill_Yeh 眾裡尋他千百度 發文: 89 積分: 0 於 2004-09-02 13:45     收藏文章? ||
    hcl wrote: 想請教各位先進,小弟我依照上述方式改了設定,但是圖檔連結的檔名 是中文,那在TOMCAT5.0.19上面無法顯示,想請問一下該如何處理呢? 1 <img src="中文檔名" /> 環境: WINDOWS 2000 SP4 + TOMCAT5.0.19 + IIS 5.0 若是搭配 IIS 的話, 不是 JAVA 的皆是由 IIS 來處理 所以你這個 <IMG> 基本上是透過 IIS 在傳遞 接下來就是中文的問題, IIS 理論上沒這個問題, 問題應該出在瀏覽器這端 若是你使用 IE, 則去選項設定那邊查看是否有開啟「永遠將 URL 傳送成 UTF8....」 這是我之前的經驗, 有錯誤請指正 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] shirley_wang 發文: 3 積分: 0 於 2004-09-21 15:39     收藏文章? ||
    如果是普通的form,用ISO-8859-1讀取沒問題。可是當form的enctype是multipart/form-data的時候,再用ISO-8859-1讀取字符串就出現問題。 那位大蝦能幫忙解決一下?萬分感謝! BR/Shirley 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] rawhead 發文: 42 積分: 0 於 2005-01-15 21:24     收藏文章? ||
    <Connector debug="0" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" port="80" redirectPort="8443" enableLookups="false" minSpareThreads="25" maxSpareThreads="75" maxThreads="150" maxPostSize="0" URIEncoding="ISO-8859-1"> </Connector> 我的Tomcat預設的port是8080 那我是要在 port是8080的<Connector.../> 直接加入URIEncoding="ISO-8859-1"就好 還是要把整段都寫進去? 作者Re:解決 Tomcat 5.0.19 中文參數傳遞問題 [Re:精靈] Sovina 發文: 3 積分: 0 於 2005-02-06 01:26     收藏文章? ||
    請問如果用URL來傳遞中文參數,應如何處理? 例如: URL --> http://127.0.0.1:8080/test/test.jsp?keyword=正常 因URL 不能傳遞中文, 所以我用了 1 java.net.URLEncoder.encode("正常","Big5") 來把中文ENCODE. 轉換后的URL --> http://127.0.0.1:8080/test/test.jsp?keyword=
    转载请注明原文地址: https://ibbs.8miu.com/read-9257.html

    最新回复(0)