今天在用URL傳遞中文參數時發生亂碼問題,原來是要在Tomcat那兒設置一下。搜索到這篇文章學習一下~
自從接觸Java和JSP以來,就不斷與Java的中文亂碼問題打交道,現在終于得到了徹底的解決,現將我們的解決心得與大家共享。
一、Java中文問題的由來
Java的內核和class文件是基于unicode的,這使Java程序具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP文件本身編譯時產生的亂碼問題和Java程序于其他媒介交互產生的亂碼問題。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字節流的,如果Java和JSP編譯成class文件過程中,使用的編碼方式與源文件的編碼不一致,就會出現亂碼。基于這種亂碼,建議在Java文件中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關系),如果必須寫的話,盡量手動帶參數-ecoding GBK或-ecoding gb2312編譯;對于JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。
本文要重點討論的是第二類亂碼,即Java程序與其他存儲媒介交互時產生的亂碼。很多存儲媒介,如數據庫,文件,流等的存儲方式都是基于字節流的,Java程序與這些媒介交互時就會發生字符(char)與字節(byte)之間的轉換,例如從頁面提交表單中提交的數據在Java程序里顯示亂碼等情況。
如果在以上轉換過程中使用的編碼方式與字節原有的編碼不一致,很可能就會出現亂碼。
二、解決方法
對于流行的Tomcat來說,有以下兩種解決方法:
1) 更改 D:\Tomcat\conf\server.xml,指定瀏覽器的編碼格式為“簡體中文”:
方法是找到 server.xml 中的
????<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
????enableLookups="false" redirectPort="8443" acceptCount="100"
????connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' />
標記,粗體字是我添加的。
可以這樣驗證你的更改是否成功:在更改前,在你出現亂碼的頁面的IE瀏覽器,點擊菜單“查看|編碼”,會發現“西歐(ISO)”處于選中狀態。而更改后,點擊菜單“查看|編碼”,會發現“簡體中文(GB2312)”處于選中狀態。
b)更該 Java 程序,我的程序是這樣的:
public class ThreeParams extends HttpServlet {
??public void doGet(HttpServletRequest request, HttpServletResponse response)
?? throws ServletException, IOException {
?????? response.setContentType("text/html; charset=GBK");
??????...
??}??
}
粗體字是必需要有的,它的作用是讓瀏覽器把Unicode字符轉換為GBK字符。這樣頁面的內容和瀏覽器的顯示模式都設成了GBK,就不會亂碼了。
自從接觸Java和JSP以來,就不斷與Java的中文亂碼問題打交道,現在終于得到了徹底的解決,現將我們的解決心得與大家共享。
一、Java中文問題的由來
Java的內核和class文件是基于unicode的,這使Java程序具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP文件本身編譯時產生的亂碼問題和Java程序于其他媒介交互產生的亂碼問題。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字節流的,如果Java和JSP編譯成class文件過程中,使用的編碼方式與源文件的編碼不一致,就會出現亂碼。基于這種亂碼,建議在Java文件中盡量不要寫中文(注釋部分不參與編譯,寫中文沒關系),如果必須寫的話,盡量手動帶參數-ecoding GBK或-ecoding gb2312編譯;對于JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。
本文要重點討論的是第二類亂碼,即Java程序與其他存儲媒介交互時產生的亂碼。很多存儲媒介,如數據庫,文件,流等的存儲方式都是基于字節流的,Java程序與這些媒介交互時就會發生字符(char)與字節(byte)之間的轉換,例如從頁面提交表單中提交的數據在Java程序里顯示亂碼等情況。
如果在以上轉換過程中使用的編碼方式與字節原有的編碼不一致,很可能就會出現亂碼。
二、解決方法
對于流行的Tomcat來說,有以下兩種解決方法:
1) 更改 D:\Tomcat\conf\server.xml,指定瀏覽器的編碼格式為“簡體中文”:
方法是找到 server.xml 中的
????<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
????enableLookups="false" redirectPort="8443" acceptCount="100"
????connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' />
標記,粗體字是我添加的。
可以這樣驗證你的更改是否成功:在更改前,在你出現亂碼的頁面的IE瀏覽器,點擊菜單“查看|編碼”,會發現“西歐(ISO)”處于選中狀態。而更改后,點擊菜單“查看|編碼”,會發現“簡體中文(GB2312)”處于選中狀態。
b)更該 Java 程序,我的程序是這樣的:
public class ThreeParams extends HttpServlet {
??public void doGet(HttpServletRequest request, HttpServletResponse response)
?? throws ServletException, IOException {
?????? response.setContentType("text/html; charset=GBK");
??????...
??}??
}
粗體字是必需要有的,它的作用是讓瀏覽器把Unicode字符轉換為GBK字符。這樣頁面的內容和瀏覽器的顯示模式都設成了GBK,就不會亂碼了。
因為考慮到字符兼容性的問題,現在都流行用UTF-8編碼了。因此建議在Tomcat和工程中都采用標準的UTF-8。在Tomcat的 server.xml的Connector段加上
URIEncoding='UTF-8'
即可
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
