Python文件和目录操作详解

一、文件的打开和创建

1、打开


open(file,mode):

>>>fo = open('test.txt', 'r') >>>fo.read() 'hello\n' >>>fo.close() file(file,mode):

>>>f = file('test.txt', 'r') >>>f.read() 'hello\n' >>>f.close()


mode可取值:

2、创建

用w/w+/a/a+模式打开即可。

二、文件的读取
1、String = FileObject.read([size])


>>> fr = open('test.txt')

>>> fr.read()

'hello\nworld\n'


or:

>>> for i in open('test.txt'):

...     print i

... 

hello

world


2、String = FileObject.readline([size])

>>> f = open('test.txt')

>>> f.readline()

'hello\n'

>>> f.readline()

'world\n'

>>> f.readline()

''


或者可以用next

3、List = FileObject.readlines([size])


>>> f = open('test.txt')

>>> f.readlines()

['hello\n', 'world\n']

三、文件的写入

1、write(string)


>>> f = open('test.txt', 'a')

>>> f.write('hello\nworld')

#'hello\nworld'

2、writelines(list)


>>> l = ['a','b','c']

>>> f=open('test.txt','a')

>>> f.writelines(l)

#'hello\nworldabc'


注:writelines相当于调用了多次write,不会自动添加换行(\n)符

四、内容查找替换

1、FileObject.seek(offset, mode)

offset:偏移量

mode:
0表示将文件指针指向从文件头部到“偏移量”字节处,
1表示将文件指针指向从文件当前位置向后移动“偏移量”字节,
2表示将文件指针指向从文件尾部向前移动“偏移量”字节。


>>> f=open('test.txt')

>>> f.read()

'hello\nworldabc'

>>> f.read()

''

>>> f.seek(0,0)

>>> f.read()

'hello\nworldabc'

>>> f.close()

2、flush:提交更新,即在文件关闭之前把内存中的内容强制写入文件(一般是文件关闭后写入)

3、文件查找:遍历行进行查找


#!/usr/bin/python

import re

search='hello world' file='test.txt' count = 0 f = open(file) for l in f.readlines():     li = re.findall(search,l)     if len(li) > 0:         count += len(li) print "Search " + str(count) + " \"" + search + "\"" f.close()

4、文件内容替换:遍历行进行替换

替换到新文件demo:


#!/usr/bin/python

os='hello' of='test.txt'

rs='ten' rf='test2.txt'

ofh = open(of) newl=[] for l in ofh.readlines():     nl = l.replace(os,rs)     newl.append(nl)

rfh = open(rf,'w+') rfh.writelines(newl) ofh.close() rfh.close()


替换到原文件demo:

[server@localserver file]$ cat test.txt 

abc

hello

world

hello world

helloworld

hello hello world

[server@localserver file]$ cat fr.py 

#!/usr/bin/python

os='hello' file='test.txt'

rs='ten'

f = open(file, 'r+') s=f.read() f.seek(0,0) f.close() f = open(file, 'w+') f.write(s.replace(os,rs)) f.close() [server@localserver file] python fr.py [server@localserver file]$ cat test.txt abc ten world ten world tenworld ten ten world

这里采用了重建文件的办法。

或用 fileinput 模块直接在原文件上修改:


#!/usr/bin/python

import fileinput

os='hello' file='test.txt'

rs='ten'

for line in fileinput.input(file, inplace=True):     print line.replace(os,rs).replace('\n','')


注意,这里删除了\n是因为print时会写入换行。

五、文件及目录操作

一般是借助OS模块实现

1、mkdir(path[,mode=0777]):创建目录,相当于mkdir


>>>import os

>>>os.mkdir('tt')


2、makedirs(name[, mode=511]):创建多级目录,相当于mkdir -p

3、rmdir(path):删除目录,相当于rm

4、removedirs(path):删除多级目录,相当于rm -rf

5、listdir(path):列出目录中文件和文件夹,相当于ls

6、getcwd():获取当前路径,相当于pwd

7、chdir(path):切换目录,相当于cd

8、rename(src, dst):重命名

9、shutil.copyfile(str,dst):复制文件(要引入shutil模块)

10、path.splitext(filename):获取文件路径和扩展名


>>> import os

>>> fileName, fileExtension = os.path.splitext('/path/to/somefile.ext')

>>> fileName

'/path/to/somefile'

>>> fileExtension

'.ext'

11、walk(top, topdown=True, onerror=None):遍历目录


>>> import os

>>> g = os.walk('a')

>>> g.next()

('a', ['b'], [])

>>> g.next()

('a/b', ['f', 'c'], [])

>>> g.next()

('a/b/f', [], ['3.txt'])

>>> g.next()

('a/b/c', ['d', 'e'], [])

>>> g.next()

('a/b/c/d', [], ['1.txt'])

>>> g.next()

('a/b/c/e', [], ['2.txt'])


walk返回的是一个生成器,生成器中的内容是:当前目录,目录列表,文件列表

python自己递归实现文件遍历:


#!/usr/bin/python

import os

def dirList(path):     filelist = os.listdir(path)     fpath = os.getcwd()     allfile = []     for filename in filelist:         filepath = os.path.abspath(os.path.join(path, filename))         if os.path.isdir(filepath):             allfile.extend(dirList(filepath))         else:             allfile.append(filepath)     return allfile

files = dirList('a') print files