Python中文件的操作步骤,分为打开,读写,关闭。
不管任何时候,写下打开文件的语句时(行1),一定要写上关闭的代码(行5)。
如果在打开语句中,第一个参数,只写下文件名,Python会在和代码存放的同一个目录下,打开该文件,w代表着清除该文件所有内容,并把指针放到第一行。
如果没有找到,Python会创建一个新文件,并把指针放到第一行。
计算机有很多编码系统,如果不让中文显示乱码,就需要用utf-8来告知open语句,用这种编码写入。这样,我们从显示器上看到的中文内容,就是正常显示的。
如果你没有指定编码名称,系统会采用默认的gbk编码,这种编码对英文和数字是友好的,但对中文,它无能为力。
完整操作见动图。
纯中文占字节
文本的内容是由9个中文和2个标点符号组成,因为用的是utf-8编码,所以标点符号也可以认为是中文。
一个中文占两个字节,所以总共占22个字节。
当我们要读取文件时,r会查找并打开,并把指针放在第一行,如果没有,系统会报错。
如果没有用指定的utf-8打开含有中文的内容,也会报错。
read读取文件,如果缺省参数,就是把所有内容提取完。如果有参数,1代表着一个中文(以此类推),而不是一个字节,这一点请注意。
如果是零,什么也不读取。
如果是负一,或更小,会读取全部内容。
纯英文占字节
如果是英文的话,
参数1,代表着一个英文字母。
零和负数的情况类同。
六个英文字母,只占用六个字节。
中文英文混排占字节
当内容有中文,也有英文时。
read语句会自动把汉字和英文字母区分开。
一个中文会占三个字节,一个英文还是一个字节。两个中文和六个英文,总共12个字节。
PS:本文代码基于Windows 10,Python 3.10.4。
热门跟贴