2025-02-09

在工作中遇到瞭一個特浪費時間的事,為瞭讀取txt文檔的時候不出現亂碼,所以需要對txt文檔進行編碼轉換。將txt文檔打開另存為需要的編碼格式。如果txt文檔小,這樣轉換還不算太慢,但是如果文檔太大,打開的時候就會出現程序假死現象,很不方便。所以就想到能不能用程序寫一個轉換工具,不需要打開文檔,點ok就可以自動轉換?於是就用c#寫瞭一個程序。

現在開始做java,閑暇無聊,就想用java能不能也做一個類似的程序呢?

首先對java中得編碼格式進行瞭研究。發現在java中

 

java編碼與txt編碼對應

java

txt

unicode

unicode big endian

utf-8

utf-8

utf-16

unicode

gb2312

ANSI

java讀取txt文件,如果編碼格式不匹配,就會出現亂碼現象。所以讀取txt文件的時候需要設置讀取編碼。txt文檔編碼格式都是寫在文件頭的,在程序中需要先解析文件的編碼格式,獲得編碼格式後,在按此格式讀取文件就不會產生亂碼瞭。

  1. InputStream inputStream = new FileInputStream("E:/1.txt");  
  2.         byte[] head = new byte[3];  
  3.         inputStream.read(head);   
  4.         String code = "";  
  5.    
  6.             code = "gb2312";  
  7.         if (head[0] == -1 && head[1] == -2 )  
  8.             code = "UTF-16";  
  9.         if (head[0] == -2 && head[1] == -1 )  
  10.             code = "Unicode";  
  11.         if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
  12.             code = "UTF-8";  
  13.           
  14.         System.out.println(code); 

這樣就獲得瞭txt的編碼格式瞭。

本文出自  “TinyKing”
 

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *