关于linux和Windows不同环境下文本编码的问题

pikefreeman · 发表于 2019-7-4 23:39:33

本帖最后由 pikefreeman 于 2019-7-5 13:24 编辑

在学习python基础教程第十三章数据库时书上有个例子，让我写了一个python脚本用来将ascii格式的纯文本文件导入数据库，脚本代码如下：

复制代码

然后再linux下运行发生错误:

Traceback (most recent call last):
File "importdata.py", line 31, in <module>
for line in open('ABBREV.txt'):
File "/usr/lib/python3.7/codecs.py", line 322, in decode
(result, c**umed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 5194: invalid continuation byte

复制代码

说是编码错误？到底是哪里的编码不对？在windows环境下执行代码没有任何问题，谢谢各位！

sheeboard · 发表于 2019-7-5 11:20:07

windows下是gbk，linux下默认是utf8。windows下ABBREV.txt另存为utf8编码的文件再试试。或者linux下open文件的时候指定编码。

pikefreeman · 发表于 2019-7-5 12:18:27

sheeboard 发表于 2019-7-5 11:20
windows下是gbk，linux下默认是utf8。windows下ABBREV.txt另存为utf8编码的文件再试试。或者linux下open文 ...

windows下格式是ANSI的或者utf-8运行都没有问题，linux以ascii编码打开也没有问题，问题就是用python运行的时候会出现编码错误，我不知道怎么在运行程序的时候指定文本的编码格式

sheeboard · 发表于 2019-7-5 13:00:45

pikefreeman 发表于 2019-7-5 12:18
windows下格式是ANSI的或者utf-8运行都没有问题，linux以ascii编码打开也没有问题，问题就是用python运行 ...

就是open()里加encoding='utf-8'，utf-8这里用你文件实际的编码。

pikefreeman · 发表于 2019-7-5 13:23:34

sheeboard 发表于 2019-7-5 13:00
就是open()里加encoding='utf-8'，utf-8这里用你文件实际的编码。

问题解决了，非常感谢！

		自动登录	找回密码
密码			立即注册

[已解决] 关于linux和Windows不同环境下文本编码的问题