本题在**文件路径前缀树(逻辑上按 / 分段)**上做统计:对每个文件,把它的大小累加到「目标目录 target 的一级子项」上。
p 满足 p == target 或 p 以 target + '/' 为前缀,则认为 target 在文件系统中出现;否则返回空列表。p 以 target + '/' 开头的文件,令相对路径 rel = p[len(target)+1:]。若 rel 中不含 /,则该文件本身就是一级子项,累加到 p;否则一级子项为 target + '/' + rel 的第一段路径前缀。员工 A 的磁盘空间经常被耗尽,他需要找到占用空间最大的目录或文件,然后决定如何清理文件释放空间。
给定某一目录,请编写程序帮助他统计该目录内一级子目录和文件的占用空间,并返回目标目录一级子项(文件或子目录)中占用空间最大的项。
输入: 参数 1:要进行统计的目标目录。 参数 2:文件系统内的文件列表。 参数 3:文件 Size 列表,该列表中的数据和文件列表存在一一对应关系。
输出: 目标目录一级子项(文件或子目录)中占用空间最大的项组成的列表。
"/dir1/dir2-1", ["/dir0/dir1-1/file1-1", "/dir1/dir1-1/file1-1", "/dir1/dir2-1/file3-1", "/dir1/dir2-1/file3-2", "/dir1/dir2-1/dir3-1/file4-1"], [8192, 81920, 2048, 8192, 1024]
["/dir1/dir2-1/file3-2"]
/dir1/dir2−1 下共有三个一级子项 file3−1、file3−2、dir3−1,它们的占用空间统计如下:
其中 file3−2 占用的空间最大,因此返回 ["/dir1/dir2−1/file3−2"]。
"/dir1", ["/dir0/dir2-1/file3-1", "/dir1/dir2-1/file3-1", "/dir1/dir2-1/file3-2", "/dir1/dir2-2/file3-3", "/dir1/file2-3"], [10240, 4096, 8192, 10240, 8192]
["/dir1/dir2-1"]
/dir1 下共有三个一级子项 dir2−1、dir2−2、file2−3,它们的占用空间如下:
其中 dir2−1 占用的空间最大,因此返回 ["/dir1/dir2−1"]。
"/dir1", ["/dir1/dir1/file1", "/dir1/dir1/file2", "/dir1/dir2/file3"], [1024, 2048, 3072]
["/dir1/dir1", "/dir1/dir2"]
/dir1 下共有两个一级子项 dir1、dir2,它们的占用空间如下:
由于 dir1 和 dir2 占用的空间一致,且为最大,因此需要对这两个子项进行升序排列后返回,返回结果为 ["/dir1/dir1","/dir1/dir2"]。