Python3 open() 函数详解 读取文件写入文件追加文件二进制文件
open()
函数的主要作用是打开文件并返回相应文件对象,使用文件对象可以对当前文件进行读取、写入、追加等操作,默认情况下"r"模式,文件不存在的话会发生OSError错误的。
它是Python的内置函数,在python文件中直接可以使用。
语法
#常用方式
open(file, mode='r')
#完整参数
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数
file - 文件的路径(相对或绝对)
mode[可选] - 指定文件的打开模式,分为只读,只写,读写,追加等。还有一些常用的组合模式,详见下表:
模式及含义
字符 | 含义 |
---|---|
'r' | 只读方式打开文件,文件不可写,文件如果不存在则报错,打开文件后指针会放在文件的开头,这是默认模式 |
'w' | 打开文件只用于写入内容,不可读取,如果文件不存在则自动创建,如果原文件已存在则会将其清空覆盖。 |
'x' | 独占只写模式,所谓独占,就是要求当前指定文件必须是不存在的,然后再由它进行创建。如果已存在则会报错。 |
'a' | 打开文件用于追加(只写),如果文件不存在则自动创建,如果已存在,则在文件内容的最后追加内容。 |
'b' | 二进制模式,一般用于非文本文件,如图片等。 |
't' | 文本模式(默认) |
'+' | 读写模式,一般配合只读、只写模式使用,以扩充它们的功能。 |
'U' | 通用换行模式(已废弃) |
常用组合模式
字符 | 含义 |
---|---|
'r+' | 打开文件用于读写,指针放在文件开头,写入的内容从当前所在位置进行替换(需要注意:如果是新打开的文件,就是从开头开始替换,如果使用了readline或readlines方法读取内容后,当前位置会发生改变的)。 |
'rb' | 以二进制格式打开文件用于只读,文件不存在会报错。 |
'rb+' | 以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容从当前所在位置进行替换。 |
'w+' | 打开文件用于读写,文件不存在则创建,存在则覆盖。 |
'wb' | 以二进制格式打开文件用于只写,写入的内容类型必须是bytes(b)类型。 |
'wb+' | 以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容直接覆盖原文件。 |
'a+' | 打开文件用于读写,文件不存在则创建,存在则在文件内容末尾追加内容。 |
'ab' | 以二进制格式打开文件用于只写(追加),写入的内容类型必须是bytes(b)类型。 |
'ab+' | 以二进制格式打开文件用于读写,写入的内容类型必须是bytes(b)类型。写入的内容会在文件内容末尾追加。 |
buffering[可选] - 用于设置缓冲策略,必须是一个整数,传递0关闭缓冲(仅允许在二进制下可以使用),传递1则是行缓冲(仅在文本模式下可用),传递大于1的整数,则是指定缓冲区的大小(以字节为单位),如果没有给出指定的缓冲策略,将按照二进制文件以固定大小进行缓冲,在许多的系统上,缓冲区的长度通常为4096或8192字节,而“交互式”文件文件(isatty()返回True)使用行缓冲,其他文件文件与二进制文件的一致。
encoding[可选] - 指定打开文件的编码和解码的字符编码,应该只用于文本模式下。
errors[可选] - 指定文件在编码和解码时发生错误的处理方式,默认是严格的模式,发生错误会报ValueError错误,其他参数详见下表:
字符 | 含义 |
---|---|
'strict' | 严格模式,发生错误会直接报错,与不传递值效果一致。 |
'ignore' | 忽略模式,一般不建议使用,可能会导致数据丢失。 |
'replace' | 在有错误的地方插入指定的标记。可以是任意字符串,例如('?') |
'surrogateescape' | 一般用于处理未知编码的文件 |
'xmlcharrefreplace' | 仅在写入时使用,将编码不支持的字符转换为相应的XML字符 |
'backslashreplace' | 用Python的反向转义序列替换格式错误的数据 |
'namereplace' | 仅在写入时使用,用\N{...}转义序列替换不支持的字符 |
newline[可选] - 指定换行模式,仅适用于文本模式,可以是None,'\n','\r'和'\r\n'。
closefd[可选] - 如果参数为false时且file给的是文件描述符,则在关闭文件时,底层文件描述符将保持打开状态,如果file给出的是文件名,则必须为True(默认值),否则报错。
opener[可选] - 自定义文件的开启者,这个不常用。
返回值
相应文件对象
实例
§ 实例1 - 'r','r+','rb','rb+'模式
#r
>>> f = open('text.txt', 'r')
>>> f.readline()
'abcdefg1234567'
f.close()
#r+
#r是只读模式,由于加上了+号,就变成了读写模式了,但是它与其他写模式不同,它是从当前光标位置开始写入的,默认是从文件内容的头部开始。可以通过seek来控制光标位置,也会受到read、readline、readlines影响。
#本例中头部的abc被替换成了aaa。
>>> f = open('text.txt', 'r+')
>>> f.write('aaa')
>>> f.seek(0)
>>> f.read()
'aaadefg1234567'
>>> f.close()
#rb
>>> f = open('text.txt', 'rb')
>>> f.read()
b'abcdefg1234567'
#rb+
>>> f = open('text.txt', 'rb+')
>>> f.write(b'aaa')
>>> f.seek(0)
>>> f.read()
b'aaadefg1234567'
>>> f.close()
§ 实例2 - 'w','w+','wb','wb+'模式
#text.txt原本内容为“abcdefg1234567”。
#w
#由于w是只写模式,所以写入完毕后还得再打开一次才能读取到内容。
>>> f = open('text.txt', 'w')
>>> f.write('aaa')
>>> f.close()
>>> f = open('text.txt', 'r')
>>> f.readline()
'aaa'
>>> f.close()
#从结果可以看出,文件的内容被完全覆盖了。
#w+
#这样就可以覆盖然后又读取了。
>>> f = open('text.txt', 'w+')
>>> f.write('aaa')
>>> f.seek(0)
>>> f.read()
'aaa'
>>> f.close()
#wb
>>> f = open('text.txt', 'wb')
>>> f.write(b'aaa')
>>> f.close()
>>> f = open('text.txt', 'r')
>>> f.read()
'aaa'
>>> f.close()
#wb+
>>> f = open('text.txt', 'wb+')
>>> f.write(b'aaa')
>>> f.seek(0)
>>> f.read()
b'aaa'
>>> f.close()
§ 实例3 - 'a','a+','ab','ab+'模式
#text.txt原本内容为“abcdefg1234567”。
#a
#由于a是只写模式,所以写入完毕后还得再打开一次才能读取到内容。
>>> f = open('text.txt', 'a')
>>> f.write('aaa')
>>> f.close()
>>> f = open('text.txt', 'r')
>>> f.read()
'abcdefg1234567aaa'
>>> f.close()
#a+
#这样就可以追加然后又读取了。
>>> f = open('text.txt', 'a+')
>>> f.write('aaa')
>>> f.seek(0)
>>> f.read()
'abcdefg1234567aaa'
>>> f.close()
#ab
>>> f = open('text.txt', 'ab')
>>> f.write(b'aaa')
>>> f.close()
>>> f = open('text.txt', 'r')
>>> f.read()
'abcdefg1234567aaa'
>>> f.close()
#ab+
>>> f = open('text.txt', 'ab+')
>>> f.write(b'aaa')
>>> f.seek(0)
>>> f.read()
b'abcdefg1234567aaaaaa'
>>> f.close()
§ 实例4 - 'x'模式
#假设text.txt是存在的。
#由于text.txt是不存在的,所以顺利执行了。我们再执行一次试试。
>>> f = open('text.txt', 'x')
>>> f.write('abc')
>>> f.close()
>>> f = open('text.txt', 'r')
>>> f.read()
'abc'
>>> f.close()
#就会执行报错了。提示text.txt文件已经存在了。用x可以防止文件被覆盖或修改,只能一次性创建并写入内容。
>>> f = open('text.txt', 'x')
FileExistsError: [Errno 17] File exists: 'text.txt'