`
乌拉蕾
  • 浏览: 72089 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

pytohn 统计一个文件所有文件的大小

阅读更多

     我的ubuntu空间小的可怜,总共就20G,因为是双系统,vista占了100G,汗。。。就这样将就这,其中/home目录只有可怜的7G多,再加上要在淘宝上买东西,所有又装了个虚拟机,用了3G,接着汗。。。接着,某天系统warning,只有不到2M的可用空间,暴汗。。。已经很省着用了,咋个就这么穷,打开目录想看看哪个东西动了我的硬盘,一打开我的妈哟,加上隐藏文件,大大小小直接看不见大小的文件至少上了30个,更不说里面的东西了。。。我要看那些占了较大空间的文件是哪些不是要挨着点开,受不了这么做,google了一下,写了个python 文件,还是把大家伙找出来了,嘿嘿。。。

 

import os
from os.path import join,getsize

#得到一个目录下所有文件以及目录的大小,用了递归
def get_size(src):
    '''Get the size of a directory or a file'''
    size=0L
    if os.path.isfile(src):  #文件直接算
        size=os.stat(src)[6]
    elif os.path.isdir(src):
        for item in os.listdir(src):
            itemsrc=join(src,item)
            #print item
            #iterate to caculate the directory size
            size+=get_size(itemsrc)
    return size

#只得到目录的大小,没有用递归
def getdirsize(dir):
    size = 0L
    for root,dirs,files in os.walk(dir):
        size += sum([getsize(join(root, name)) for name in files])
    return size

def listdir(dir):
    for item in os.listdir(dir):
        try:
            size = getdirsize(join(dir,item))/1024.0/1024.0
           #只打印大于200M的文件
            if size>200:
                print 'file is %s ,size is %.2f' %(item,size)
        except Exception:
            continue


if __name__=='__main__':
    dirname=r'/home/sunny'
    listdir(dirname)

     因为ubuntu下可以直接看见该文件夹下的文件的大小,看不见目录的大小,所以直接用第二个方法就可以了,当然这个带点人工,如果要全自动的就用第一个方法。

0
0
分享到:
评论
2 楼 乌拉蕾 2010-01-13  
tuoxie007 写道
du -h 一下不就行了吗

也用过du -sm * | sort -n
1 楼 tuoxie007 2010-01-13  
du -h 一下不就行了吗

相关推荐

    python统计目录下面所有文件类型及大小

    通过给定的路径,读取下面所有的目录,找出不同类型的文件并统计个数及大小

    python统计一个文件下指定文件的大小以及得到最大文件里面出现次数最多的单词

    python统计一个文件夹下指定文件的大小并获得这个文件下所有文件大小的总和以及得到最大文件里面出现次数最多的单词。萌新有错的地方请多指教

    python3实现指定目录下文件sha256及文件大小统计

    主要为大家详细介绍了python3实现指定目录下文件sha256及文件大小统计,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

    minio文件储存服务

    minio 兼容Amason的S3分布式对象存储项目,采用Golang实现,客户端支持Java,Python,Javacript, Golang语言。Minio可以做为云存储的解决方案用来保存海量的图片,视频,文档。由于采用Golang实现,服务端可以工作在...

    Python统计单词出现的次数

    统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词。 前言: 这道题在实际应用场景中使用比较广泛,比如统计历年来四六级考试中出现的高频词汇,记得李笑来就利用他的编程技能出版过一本背单词的畅销书...

    4.100个Python源码实例文件、系统、多媒体.zip

    042 用Python制作mini翻译器. 043用Python实现文件对比分析并生成报告044 英文短文自动分词写入文本文件. ...057 图片转字符画之将生成字符画保存到文件....058图片转字符画之通过命令行指定图片大小和名称

    测量UDP 数据包延迟_python_代码_下载

    更严重的是,这是为一个项目编写的,该项目涉及一大堆 Raspberry Pi 向手机发送实时音频数据,我们想检查丢包的分布情况。ping是一种选择,但是 a)我们不确定 ICMP 结果与 UDP 的可比性,并且 b)我们希望能够测量...

    Python每日一题.docx

    第 0004 题:任一个英文的纯文本文件,统计其中的单词出现的个数。 第 0005 题:你有一个目录,装了很多照片,把它们的尺寸变成都不大于 iPhone5 分辨率的大小。 第 0006 题:你有一个目录,放了你一个月的日记,都...

    python 生成目录树及显示文件大小的代码

    我定义了一个rank,进入一个子文件夹时,让rank+1,遍历完子文件夹rank就-1。 如图充分说明了递归、遍历的顺序以及rank值变化:(丑了点。。。) 下面放代码:复制代码 代码如下:”’ Created on Jul 22, 2009 @...

    python打印田字格程序2

    由26个英文字母(大小写)、数字和下划线“_”字符共同构成一个列表。打印由随机列表的内容构成一个“田”字格图形,长度任意...最后统计每种字符出现的个数,保存在一个字典文件中,字典中每个元素分别为“字符:个数”。

    python cookbook(第3版)

    1.5 实现一个优先级队列 1.6 字典中的键映射多个值 1.7 字典排序 1.8 字典的运算 1.9 查找两字典的相同点 1.10 删除序列相同元素并保持顺序 1.11 命名切片 1.12 序列中出现次数最多的元素 1.13 通过某个...

    遍历文件夹生成excel文件统计表

    1. 可以遍历指定文件夹的所有文件,支持嵌套目录,生成excel统计表,并添加超链接,可以点击打开,相当于一个目录索引 2. 文件统计表包含【层级】【文件名称】【文件路径】【属性】【大小】【创建时间】【上次修改】...

    python 远程统计文件代码分享

    享一个Python获取远程文件大小的函数代码,简单实用,是学习Python编程的基础实例。

    Python统计日志中每个IP出现次数的方法

    本文实例讲述了Python统计日志中每个IP出现次数的方法。分享给大家供大家参考。具体如下: 这脚本可用于多种日志类型,本人测试MDaemon的all日志文件大小1.23G左右,分析用时2~3分钟 代码很简单,很适合运维人员,有不足...

    大数据分析-网站日志数据文件(Hadoop部署分析资料)

    至此,我们通过Python网络爬虫手段进行数据抓取,将我们网站数据(2013-05-30,2013-05-31)保存为两个日志文件,由于文件大小超出我们一般的分析工具处理的范围,故借助Hadoop来完成本次的实践。 使用python对原始...

    georasters:GeoRasters是一个Python模块,提供了快速灵活的工具来处理GIS栅格文件

    它包括用于合并栅格绘图栅格从栅格中提取信息给定一个点(纬度,经度),找到其在栅格中的位置汇总栅格以降低分辨率将两个不同大小的栅格与公共区域和大小对齐获取栅格的所有地理信息轻松创建GeoTiff文件将GeoTiff...

    基于PyQt5(GUI界面)目标检测的行人检测并统计python源码+模型+项目说明.zip

    1、在videoDetection.py中设置path变量并运行,并新建一个名为videos的文件夹(也可以在代码中改成其他路径),检测后的结果将以图片的形式存储在这个文件夹中 2、在img_to_video.py中设置存放图片的文件夹路径,...

    AarPackageSize:快速批量统计aar包大小

    Demo效果克隆本工程在终端使用python执行如下脚本:python AarPackageSize.py使用使用以下命令获取依赖树,在app模块目录下执行如下命令会得到一个名为depends.txt结果文件:../gradlew -q dependencies --...

    python:Python 脚本

    hash_mRNA_IDs.py - 返回一个 uniq mRNA id 哈希C_loadFasta.py - 加载 fasta 序列的脚本D_longest_fasta_sequence_header.py - 脚本返回最长序列的标题E_get_chr_size_gff3.py - 脚本采用 gff3 文件并返回每个...

Global site tag (gtag.js) - Google Analytics