數據庫版本號:Oracle 10g
字符集:SIMPLIFIED CHINESE_CHINA.US7ASCII
JDK:1.6.0_45
Oracle驅動:ojdbc14.jar
使用JDBC操作數據庫,獲取連接、運行SQL沒有問題。可是,查詢出來的結果中,全部漢字,均顯示為亂碼。
debug查看到在數據從數據庫中獲取出來的時候,就已經是亂碼,而使用PL/SQL等工具,均顯示正常。
不知是否Oracle的驅動,在進行漢字處理的時候,使用了系統默認的字符集?此時,本著死馬當活馬醫的理念,使用下對漢字的強制轉碼,ASCII碼是標準的ISO-8859-1的子集,或許使用這個ISO-8859-1能夠獲取到正常的漢字?于是,首先測試使用new String(fieldValue.getBytes("ISO-8859-1"));輸出依舊亂碼!想想應該是將這東西進行轉碼,而不不過依照這個格式獲取,于是調整為:new String(fieldValue.getBytes("ISO-8859-1"), "GBK"),測試下,搞定!不過,全部用到漢字的地方,均須要這么搞一下,有點麻煩。
據說,能夠使用第二種方式:改Oracle的字符集!
1、須要改動注冊表:HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\HOME0\NLS_LANG 的值為SIMPLIFIED CHINESE_CHINA.ZHS16GBK
2、改動一個系統變量NLS_LANG.
以上兩種,第二種方式試過,能夠。第一種,未在現有環境下做過測試。
另外,將獲取到的漢字,寫入另外一個oracle 11g的數據庫中,發現:漢字不是依照一個漢字兩個字節來存放的;而是一個漢字3個字節!
查了一下,發現:字符集是AL32UTF8,這個字符集一般都默認中文是3個字節。于是,須要將目標數據庫表的字段長度進行擴充。實際對于漢字的問題,oralce以及較新的sqlserver,都支持nvarchar的格式,對于使用nvarchar的字段,不管漢字還是數字、字符、英文字母,均每一個字符占用1位。
假設不確定當前一個漢字占用幾個字符,能夠使用select length('汗') from dual;進行查看。
對于US7ASCII的字符集,眼下來看,新上的系統使用的較少了,而對于一些較老的遺留系統,可能會存在這樣的情況。詳細還需注意!
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
