python学习笔记-文件操作

文件操作

1、打开文件,得到文件句柄并赋值给一个变量
2、通过句柄操作文件
3、关闭文件
#1. 打开文件,得到文件句柄并赋值给一个变量
f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r

#2. 通过句柄对文件进行操作
data=f.read()

#3. 关闭文件
f.close()

常用读写方法:

#####读#####

#read()
f=open("hello",encoding='utf-8')
data=f.read()
print(data)

#readable() 是否可读,可读返回true
print(f.readable())

#readline()一次读一行
print("第一行",f.readline())
print("第二行",f.readline(),end='')
print("第三行",f.readline())

#readlines() 读取所有行的一个列表
data=f.readlines()
print(data)

f.close()

#####写#####

#w 文件存在时清空文件开始写,文件不存在时会新建一个文件
#文件内容只能是字符串,只能写字符串

#write()
f=open("hello2",'w',encoding="utf-8")
f.write("111111
")
f.write("2222222
")
f.write("333
444
555
")

#writeable()

#writelines()
f.writelines(["555
","666
","777
"])
f.close()

#####追加#####

f=open("hello2","a",encoding="utf-8")
f.write("写到最后")
f.close()

打开文件的模式

#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】

#2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
rb 
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

#3. 了解部分
"+" 表示可以同时读写某个文件
r+, 读写【可读,可写】
w+,写读【可读,可写】
a+, 写读【可读,可写】


x, 只写模式【不可读;不存在则创建,存在则报错】
x+ ,写读【可读,可写】
xb

例子:读写的方式复制文件

src_f=open("xxx","r",encoding="utf-8")
data=src_f.readlines()
src_f.close()

dst_f=open("xxx_new","w",encoding="utf-8")
dst_f.writelines(data)
dst_f.close()
View Code

例子:使用with关键字

with open("www","r",encoding="utf-8") as src_f,open("xxx_new","w",encoding="utf-8") as dst_f:
    data=src_f.read()
    dst_f.write(data)

例子:b模式

f=open("test11.py",'rb',encoding='utf-8') #报错,以b的方式打开不能再制定编码
data=f.read()
print(data)

#如果要显示原内容
#字符串-->bytes   encoding
#bytes -->字符串    decode

print(data.decode('utf-8'))

f=open("test22.py","wb")
f.write(bytes("1111
",encoding="utf-8")) #写法1
f.write("周末".encode("utf-8"))  #写法2

其他方法

f.closed #是否关闭
f.encoding #文件打开的编码,如果文件打开模式为b,则没有该属性
f.flush  #刷新,文件内容从内存刷到硬盘
f.name #文件名
f.tell() #当前光标位置
f.seek(0) #移动光标到指定位置,从文件开头算起
f.seek(3,1)#第二个参数是0,从开头算起,第二个参数是1,表示从当前对相对位置算起,第二个参数是2,表示从结束位置算起,seek(-5,2)
f.read(4) #读4个字符
f.truncate(10) #截取文件从开头到10的位置,属于写操作。文件必须以写方式打开,但w和w+除外(r+,a+可以,w+不行)
#除了read(),其他方法tell,seek,truncate对光标的移动操作都是以字节为单位

例子:读文件最后一行。(应用比如查看最新日志等,不用读取整个文件到内存)

#循环文件的推荐方式
for i in f:
    print(i)
#例子,读取文件最后一行
for i in f:
    offs=-10
    while True:
        f.seek(offs,2)
        data=f.readlines()
        if len(data) > 1:
            print("文件的最后一行是%s" %(data[-1].decode("utf-8")))
            break
        offs*=2

 文件的修改

文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:

方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)

import os

with open('a.txt') as read_f,open('aa.txt.swap','w') as write_f:
    data=read_f.read() #全部读入内存,如果文件很大,会很卡
    data=data.replace('jobs','NB') #在内存中完成修改

    write_f.write(data) #一次性写入新文件

os.remove('a.txt')
os.rename('aa.txt.swap','a.txt') 

方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件

import os

with open('a.txt') as read_f,open('aa.txt.swap','w') as write_f:
    for line in read_f:
        line=line.replace('jobs','NB')
        write_f.write(line)

os.remove('a.txt')
os.rename('aa.txt.swap','a.txt')