目录
# 常规排序sort()
自然排序natsort
listdir 时间顺序排序:
遍历目录,文件大小倒叙排序
自定义函数排序
# 常规排序sort()
a = ['1.mp4', '3.mp4', '10.mp4', '2.mp4'] a.sort() print(a)
讯享网
可以看到,sort()在进行文件名排序时,是从前往后逐字符比较,这并不是我们想要的结果。这时,可以使用第#三方库natsort。

自然排序natsort
讯享网from natsort import natsorted a = ['1.mp4', '3.mp4', '10.mp4', '2.mp4'] b = natsorted(a) print(b)
倒序:添加参数:reverse=True):
listdir 时间顺序排序:
def get_file_list(file_path): dir_list = os.listdir(file_path) if not dir_list: return else: # 注意,这里使用lambda表达式,将文件按照最后修改时间顺序升序排列 # os.path.getmtime() 函数是获取文件最后修改时间 # os.path.getctime() 函数是获取文件最后创建时间 dir_list = sorted(dir_list,key=lambda x: os.path.getmtime(os.path.join(file_path, x))) # print(dir_list) return dir_list
遍历目录,文件大小倒叙排序
讯享网import os def get_file_list(dir_path): g = os.walk(dir_path) img_files = ['%s/%s' % (i[0], j) for i in g for j in i[-1] if j=='label.csv'] file_list = sorted(img_files,key=lambda m_file: os.path.getsize(m_file),reverse=True) for file in file_list: print(int(os.path.getsize(file)/1000),'kb',file) if __name__ == '__main__': get_file_list(dir_path=r"D:\data\similar")
自定义函数排序
import os DIR = "/home/serho/workspace/lisp" def compare(x, y): stat_x = os.stat(DIR + "/" + x) stat_y = os.stat(DIR + "/" + y) if stat_x.st_ctime < stat_y.st_ctime: return -1 elif stat_x.st_ctime > stat_y.st_ctime: return 1 else: return 0 iterms = os.listdir(DIR)
讯享网#Python文件排序 按文件名称字符串小写排序 images.sort(key=lambda x: x.lower()) #按创建时间精确到秒排序 images.sort(key=lambda x: os.path.getctime(x)) #按创建时间,精确到纳秒排序 images.sort(key=lambda x: os.stat(x).st_ctime_ns) 3按文件名称去掉后缀的数值名称排序 images.sort(key = lambda x: int(x[:-4])) #使用os.stat的返回值statinfo的三个属性获取文件的创建时间等信息 statinfo=os.stat("E:\\A\\314_noteach_753__152.png") st_atime (访问时间), st_mtime (修改时间), st_ctime(创建时间) print(statinfo) print(statinfo.st_mtime) print(statinfo.st_ctime_ns) #可按照文件名称排序,对字符串和数值混合的可以自定义实现混合排序 # -*- coding: utf-8 -*- # @Time : 2019/4/30 13:32 # @Author : shine # @File : mix_sort.py """ 基于字符串数字混合排序的Python脚本 """ def is_number(s): try: float(s) return True except ValueError: pass try: import unicodedata unicodedata.numeric(s) return True except (TypeError, ValueError): pass return False def find_continuous_num(astr, c): num = '' try: while not is_number(astr[c]) and c < len(astr): c += 1 while is_number(astr[c]) and c < len(astr): num += astr[c] c += 1 except: pass if num != '': return int(num) def comp2filename(file1, file2): smaller_length = min(len(file1), len(file2)) for c in range(0, smaller_length): if not is_number(file1[c]) and not is_number(file2[c]): if file1[c] < file2[c]: return True if file1[c] > file2[c]: return False if file1[c] == file2[c]: if c == smaller_length - 1: if len(file1) < len(file2): return True else: return False else: continue if is_number(file1[c]) and not is_number(file2[c]): return True if not is_number(file1[c]) and is_number(file2[c]): return False if is_number(file1[c]) and is_number(file2[c]): if find_continuous_num(file1, c) < find_continuous_num(file2, c): return True else: return False def sort_list_by_name(lst): for i in range(1, len(lst)): x = lst[i] j = i while j > 0 and comp2filename(x, lst[j-1]): lst[j] = lst[j-1] j -= 1 lst[j] = x return lst
用python对指定目录下的所有文件(夹)大小进行排序
原创goandfly 最后发布于2016-07-29 18:56:45 阅读数 1575 收藏
展开
Windows的某个目录下sort by size只能对该目录下的文件进行排序,不能对目录下的文件夹进行排序,而手工点击右键逐个计算文件夹的大小效比较低。在此我用用python对指定目录下的所有文件(夹)大小进行排序,代码如下:
#! /usr/bin/env python ''' Sort the size of floders and files with given directory. Author: Sean.Xu ''' import os import os.path import datetime L={} k={} rootdir = 'C:\\Windows' def getdirsize(dir): size = 0 for parent, dirnames, filenames in os.walk(dir): for filename in filenames: try: name = os.path.join(parent, filename) size += os.path.getsize(name) except: continue return size def getsizename(size): if (size > 1024*1024*1024.0): numstr = str(size/(1024*1024*1024.0)) sizename = numstr[:(numstr.index('.')+3)]+'GB' elif (size > 1024*1024.0): numstr = str(size/(1024*1024.0)) sizename = numstr[:(numstr.index('.')+3)]+'MB' elif (size > 1024.0): numstr = str(size/1024.0) sizename = numstr[:(numstr.index('.')+3)]+'KB' else: sizename = str(size) +'Bytes' return sizename # proc start starttime = datetime.datetime.now() filenames = os.listdir(rootdir) for filename in filenames: fullpath = os.path.join(rootdir, filename) if os.path.isdir(fullpath): L[filename] = getdirsize(fullpath) else: L[filename] = os.path.getsize(fullpath) k = sorted(L.items(), key=lambda L:L[1], reverse = True) endtime = datetime.datetime.now() print 'The directory of %s has %d items(folder and file).' %(rootdir, len(k)) print 'It took %ds to sort the size of these items. The result is as below:' %(endtime - starttime).seconds for i in range(len(k)): print k[i][0],"\t",getsizename(k[i][1])
示例中是对C的Windows目录下的文件(夹)进行排序,部分结果如下:
D:\python_example>sortfilesize.py
The directory of C:\Windows has 131 items(folder and file).
It took 68s to sort the size of these items. The result is as below:
Installer 14.30GB
WinSxS 3.92GB
System32 2.35GB
assembly 849.10MB
Microsoft.NET 387.80MB
Fonts 376.48MB
Panther 180.95MB
Symbols 167.64MB
IME 165.17MB
SoftwareDistribution 150.48MB
SystemApps 116.69MB
Speech 110.44MB
INF 73.98MB
Speech_OneCore 50.81MB
servicing 48.02MB
InputMethod 34.57MB
Boot 30.72MB
Performance 28.19MB
Media 26.35MB
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/68457.html