Python 判斷檔案的語系編碼 UTF-8、Big5

Python3 要開啟、讀取檔案時，若不是 UTF-8，會需要輸入檔案的語系編碼，Python 會自動都轉換成 UTF-8 做操作。

如下範例：(現在會遇到 Big5 的，大多數都是 Windows 的 CSV)

但是有些來源是 Big5、有些是 UTF-8，就需要偵測語系編碼，要怎麼做呢？

Python 可以使用 chardet 來抓取文字編碼，所以要判斷檔案編碼，需要抓一小段文字給他

在這範例程式裡面，看到 Big5、utf-8 都很容易懂，但是 UTF-8-SIG 是什麼？
- UTF-8-SIG：檔案有 BOM 開頭的，就會是這個編碼
- 這些編碼可以直接丟進去 open(filename, encoding='UTF-8-SIG')，都可以直接操作

作者: Tsung

對新奇的事物都很有興趣, 喜歡簡單的東西, 過簡單的生活. 檢視「Tsung」的全部文章

「Hank」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
非常感谢。完美解决了我的问题，确实是安装…
「Tsung」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
很高興能對您有些幫助~ 感謝~~ :)
「Hank」於〈Ubuntu 24.x 遇到 Failed to start gdm.service 修復〉發佈留言2025 年 06 月 26 日
非常感谢，这个博客完美解决了我的问题。确…
「Tsung」於〈一頁式網購詐騙的幾個判斷方式〉發佈留言2025 年 06 月 20 日
嗯嗯，手法都是大同小異的~~
「johnroyer日落」於〈一頁式網購詐騙的幾個判斷方式〉發佈留言2025 年 06 月 19 日
感覺和手游很像 (?)