1. <ul id="0c1fb"></ul>

      <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
      <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区

      RELATEED CONSULTING
      相關(guān)咨詢
      選擇下列產(chǎn)品馬上在線溝通
      服務(wù)時間:8:30-17:00
      你可能遇到了下面的問題
      關(guān)閉右側(cè)工具欄

      新聞中心

      這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
      java獲取文本文件字符編碼的方法

      這篇文章將為大家詳細(xì)講解有關(guān)java獲取文本文件字符編碼的方法,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

      專注于為中小企業(yè)提供成都網(wǎng)站制作、成都網(wǎng)站設(shè)計、外貿(mào)營銷網(wǎng)站建設(shè)服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)平谷免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了上1000+企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。

      一、認(rèn)識字符編碼:

      1、Java中String的默認(rèn)編碼為UTF-8,可以使用以下語句獲取:Charset.defaultCharset();

      2、Windows操作系統(tǒng)下,文本文件的默認(rèn)編碼為ANSI,對中文Windows來說即為GBK。例如我們使用記事本程序新建一個文本文檔,其默認(rèn)字符編碼即為ANSI。

      3、Text文本文檔有四種編碼選項:ANSI、Unicode(含Unicode Big Endian和Unicode Little Endian)、UTF-8、UTF-16

      4、因此我們讀取txt文件可能有時候并不知道其編碼格式,所以需要用程序動態(tài)判斷獲取txt文件編碼。

      ANSI     :無格式定義,對中文操作系統(tǒng)為GBK或GB2312

      UTF-8   :前三個字節(jié)為:0xE59B9E(UTF-8)、0xEFBBBF(UTF-8含BOM)

      UTF-16 :前兩字節(jié)為:0xFEFF

      Unicode:前兩個字節(jié)為:0xFFFE

      例如:Unicode文檔以0xFFFE開頭,用程序取出前幾個字節(jié)并進(jìn)行判斷即可。

      5、Java編碼與Text文本編碼對應(yīng)關(guān)系:

      java獲取文本文件字符編碼的方法

      Java讀取Text文件,如果編碼格式不匹配,就會出現(xiàn)亂碼現(xiàn)象。所以讀取文本文件的時候需要設(shè)置正確字符編碼。Text文檔編碼格式都是寫在文件頭的,在程序中需要先解析文件的編碼格式,獲得編碼格式后,再以此格式讀取文件就不會產(chǎn)生亂碼了。

      二、舉個例子:

      有一個文本文件:test.txt

      java獲取文本文件字符編碼的方法

      測試代碼:

      /**
       * 文件名:CharsetCodeTest.java
       * 功能描述:文件字符編碼測試
       */
       
      import java.io.*;
       
      public class CharsetCodeTest {
          public static void main(String[] args) throws Exception {
              String filePath = "test.txt";
              String content = readTxt(filePath);
              System.out.println(content);
          }
       
       
      public static String readTxt(String path) {
              StringBuilder content = new StringBuilder("");
              try {
                  String fileCharsetName = getFileCharsetName(path);
                  System.out.println("文件的編碼格式為:"+fileCharsetName);
       
                  InputStream is = new FileInputStream(path);
                  InputStreamReader isr = new InputStreamReader(is, fileCharsetName);
                  BufferedReader br = new BufferedReader(isr);
       
                  String str = "";
                  boolean isFirst = true;
                  while (null != (str = br.readLine())) {
                      if (!isFirst)
                          content.append(System.lineSeparator());
                          //System.getProperty("line.separator");
                      else
                          isFirst = false;
                      content.append(str);
                  }
                  br.close();
              } catch (Exception e) {
                  e.printStackTrace();
                  System.err.println("讀取文件:" + path + "失敗!");
              }
              return content.toString();
          }
       
       
          public static String getFileCharsetName(String fileName) throws IOException {
              InputStream inputStream = new FileInputStream(fileName);
              byte[] head = new byte[3];
              inputStream.read(head);
       
              String charsetName = "GBK";//或GB2312,即ANSI
              if (head[0] == -1 && head[1] == -2 ) //0xFFFE
                  charsetName = "UTF-16";
              else if (head[0] == -2 && head[1] == -1 ) //0xFEFF
                  charsetName = "Unicode";//包含兩種編碼格式:UCS2-Big-Endian和UCS2-Little-Endian
              else if(head[0]==-27 && head[1]==-101 && head[2] ==-98)
                  charsetName = "UTF-8"; //UTF-8(不含BOM)
              else if(head[0]==-17 && head[1]==-69 && head[2] ==-65)
                  charsetName = "UTF-8"; //UTF-8-BOM
       
              inputStream.close();
       
              //System.out.println(code);
              return charsetName;
          }
      }

      運(yùn)行結(jié)果:

      java獲取文本文件字符編碼的方法

      以上就是java獲取文本文件字符編碼的方法,詳細(xì)使用情況還需要大家自己親自動手使用過才能領(lǐng)會。如果想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!


      當(dāng)前題目:java獲取文本文件字符編碼的方法
      分享網(wǎng)址:http://ef60e0e.cn/article/gpcsod.html
      99热在线精品一区二区三区_国产伦精品一区二区三区女破破_亚洲一区二区三区无码_精品国产欧美日韩另类一区
      1. <ul id="0c1fb"></ul>

        <noscript id="0c1fb"><video id="0c1fb"></video></noscript>
        <noscript id="0c1fb"><listing id="0c1fb"><thead id="0c1fb"></thead></listing></noscript>

        鄯善县| 巴彦县| 托克托县| 华安县| 泊头市| 石渠县| 且末县| 涿鹿县| 济南市| 岳阳县| 江陵县| 湖北省| 五原县| 顺昌县| 广昌县| 侯马市| 桐梓县| 敖汉旗| 社会| 剑河县| 海阳市| 同江市| 玉溪市| 大方县| 漾濞| 寿阳县| 恩平市| 登封市| 西贡区| 文昌市| 汾西县| 乐亭县| 沁源县| 大埔区| 上林县| 历史| 榆树市| 西华县| 连州市| 津市市| 泰州市|