蓋蓋的家: Net Framework 讀取檔案變亂碼的處理方式

今天因為做長榮的案子，壓根沒想到 Microsoft .Net Framework 讀取檔案竟然會出現亂碼，以前用 VB 都鮮少遇過這種事。

重點還是在於如何解決，因為從 Windows 2000 之後的作業系統在檔案處理採用Unicode ，所以 .Net 的檔案處理也是預設為 Unicode ，但是文字檔大多還是以 ANSI 儲存，而且裡面的編碼還是用 Big5，所以才會造成中文亂碼的狀況，也就是在讀取檔案的時候就要指定編碼的樣式。
本來會造成亂碼的語法如下:
Dim reader As StreamReader = New StreamReader(FileName)
但是問題來了，System.Text.Encoding 裡面一堆，ASCII、UTF-8 等等的，要選哪個好?
其實很簡單，用 System.Text.Encoding.Default 告訴 StreamReader 目前作業系統的編碼即可。
[VB .Net] 的寫法
Dim reader As StreamReader = _New StreamReader(FileName, System.Text.Encoding.Default)
[C# .Net] 的寫法
StreamReader reader = _New StreamReader(FileName, System.Text.Encoding.Default)
結果如下:
System.Text.Encoding 可參考 MSDN:http://msdn.microsoft.com/library/en-us/cpref/html/frlrfsystemtextencodingclasstopic.asp

===========================================================

謝謝站長的技術分享，解決了小弟一個讀檔的問題。因為小弟需要從ANSI文字檔中取得某個起訖位罝的中文字元因為文字檔是ANSI格式->中文碼為兩碼，.net為unicode- 每個字都是一碼，先轉為byte格式，取出ANSI格式之資料(中文字算兩碼) 正確所在，再轉回unicode格式
Dim sendBytes As [Byte]() = System.Text.Encoding.Default.GetBytes(line)
Dim strValue As String = System.Text.Encoding.Default.GetChars(sendBytes, startPos, endPos - startPos)

蓋蓋的家

文章分類

獨照一

文件歷史

我是誰

Monday, November 3, 2008

Net Framework 讀取檔案變亂碼的處理方式

No comments: