我想浏览当前文件夹及其所有子文件夹,并获取所有扩展名为.htm | .html的文件。我发现可以找到一个对象是目录还是文件,如下所示:
import os dirList = os.listdir("./") # current directory for dir in dirList: if os.path.isdir(dir) == True: # I don't know how to get into this dir and do the same thing here else: # I got file and i can regexp if it is .htm|html
最后,我想将所有文件及其路径放在一个数组中。这样有可能吗?
您可以os.walk()用来递归遍历目录及其所有子目录:
os.walk()
for root, dirs, files in os.walk(path): for name in files: if name.endswith((".html", ".htm")): # whatever
要构建这些名称的列表,可以使用列表理解:
htmlfiles = [os.path.join(root, name) for root, dirs, files in os.walk(path) for name in files if name.endswith((".html", ".htm"))]