在工作中遇到瞭一個特浪費時間的事,為瞭讀取txt文檔的時候不出現亂碼,所以需要對txt文檔進行編碼轉換。將txt文檔打開另存為需要的編碼格式。如果txt文檔小,這樣轉換還不算太慢,但是如果文檔太大,打開的時候就會出現程序假死現象,很不方便。所以就想到能不能用程序寫一個轉換工具,不需要打開文檔,點ok就可以自動轉換?於是就用c#寫瞭一個程序。
現在開始做java,閑暇無聊,就想用java能不能也做一個類似的程序呢?
首先對java中得編碼格式進行瞭研究。發現在java中
java編碼與txt編碼對應 |
|
java |
txt |
unicode |
unicode big endian |
utf-8 |
utf-8 |
utf-16 |
unicode |
gb2312 |
ANSI |
java讀取txt文件,如果編碼格式不匹配,就會出現亂碼現象。所以讀取txt文件的時候需要設置讀取編碼。txt文檔編碼格式都是寫在文件頭的,在程序中需要先解析文件的編碼格式,獲得編碼格式後,在按此格式讀取文件就不會產生亂碼瞭。
- InputStream inputStream = new FileInputStream("E:/1.txt");
- byte[] head = new byte[3];
- inputStream.read(head);
- String code = "";
- code = "gb2312";
- if (head[0] == -1 && head[1] == -2 )
- code = "UTF-16";
- if (head[0] == -2 && head[1] == -1 )
- code = "Unicode";
- if(head[0]==-17 && head[1]==-69 && head[2] ==-65)
- code = "UTF-8";
- System.out.println(code);
這樣就獲得瞭txt的編碼格式瞭。
本文出自 “TinyKing”