Python中文件的操作步骤,分为打开,读写,关闭。

不管任何时候,写下打开文件的语句时(行1),一定要写上关闭的代码(行5)。

如果在打开语句中,第一个参数,只写下文件名,Python会在和代码存放的同一个目录下,打开该文件,w代表着清除该文件所有内容,并把指针放到第一行。

如果没有找到,Python会创建一个新文件,并把指针放到第一行。

计算机有很多编码系统,如果不让中文显示乱码,就需要用utf-8来告知open语句,用这种编码写入。这样,我们从显示器上看到的中文内容,就是正常显示的。

如果你没有指定编码名称,系统会采用默认的gbk编码,这种编码对英文和数字是友好的,但对中文,它无能为力。

完整操作见动图。

纯中文占字节

文本的内容是由9个中文和2个标点符号组成,因为用的是utf-8编码,所以标点符号也可以认为是中文。

一个中文占两个字节,所以总共占22个字节。

当我们要读取文件时,r会查找并打开,并把指针放在第一行,如果没有,系统会报错。

如果没有用指定的utf-8打开含有中文的内容,也会报错。

read读取文件,如果缺省参数,就是把所有内容提取完。如果有参数,1代表着一个中文(以此类推),而不是一个字节,这一点请注意。

如果是零,什么也不读取。

如果是负一,或更小,会读取全部内容。

纯英文占字节

如果是英文的话,

参数1,代表着一个英文字母。

零和负数的情况类同。

六个英文字母,只占用六个字节。

中文英文混排占字节

当内容有中文,也有英文时。

read语句会自动把汉字和英文字母区分开。

一个中文会占三个字节,一个英文还是一个字节。两个中文和六个英文,总共12个字节。

PS:本文代码基于Windows 10,Python 3.10.4。