博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python计算文件md5值
阅读量:4707 次
发布时间:2019-06-10

本文共 2310 字,大约阅读时间需要 7 分钟。

  md5是一种常见不可逆加密算法,使用简单,计算速度快,在很多场景下都会用到,比如:给用户上传的文件命名,数据库中保存的用户密码,下载文件后检验文件是否正确等。下面讲解在python中如何使用md5算法。

 

一、计算字符串的md5值

#!/usr/bin/env python# -*- coding: utf-8 -*-import sysimport hashlibreload(sys)sys.setdefaultencoding('utf-8')if __name__ == '__main__':    content = "hello"    md5hash = hashlib.md5(content)    md5 = md5hash.hexdigest()    print(md5)

 运行上述代码,输出:5d41402abc4b2a76b9719d911017c592

用PHP自带的md5函数计算同一个字符串,验证下hello的md5是否正确。

可见python下计算字符串的md5也是非常方便,使用hashlib库即可。网上有文章介绍python2.x下可以使用md5库,该库在python3.x不能使用,因此不推荐使用该库。

 

字符串的md5计算比较简单,下面看下如何计算文件的md5值。

二、计算文件的md5值

#!/usr/bin/env python# -*- coding: utf-8 -*-import sysimport hashlibreload(sys)sys.setdefaultencoding('utf-8')if __name__ == '__main__':    file_name = "3383430480_51_01.jpg"    with open(file_name, 'rb') as fp:        data = fp.read()    file_md5= hashlib.md5(data).hexdigest()    print(file_md5)     # ac3ee699961c58ef80a78c2434efe0d0

文件md5计算跟字符串计算是一样,直接使用hashlib的md5方法,然后hexdigests就好了。同样用PHP代码验证下

从结果可以看出md5是一样的,文件md5值也不过如此呀,心里窃喜。。。

如果大文件呢,比如几个G呢,上述代码肯定会内存溢出,怎么办呢,可以分块读取文件内容并计算。

 

三、计算大文件的md5值

#!/usr/bin/env python# -*- coding: utf-8 -*-import sysimport hashlibdef get_file_md5(fname):    m = hashlib.md5()   #创建md5对象    with open(fname,'rb') as fobj:        while True:            data = fobj.read(4096)            if not data:                break            m.update(data)  #更新md5对象    return m.hexdigest()    #返回md5对象reload(sys)sys.setdefaultencoding('utf-8')if __name__ == '__main__':    file_name = "mongodb_us.zip"    file_md5 = get_file_md5(file_name)    print(file_md5)     # 0f45cdbf14de54001e82a17c3d199a4b

分块读取文件内容,然后调用hashlib的update()方法将分块数据更新至md5对象中,最后调用hexdigest()方法得出md5值。

 

四、封装成常用库md5.py

#!/usr/bin/env python# -*- coding: utf-8 -*-import hashlibdef get_file_md5(file_name):    """    计算文件的md5    :param file_name:    :return:    """    m = hashlib.md5()   #创建md5对象    with open(file_name,'rb') as fobj:        while True:            data = fobj.read(4096)            if not data:                break            m.update(data)  #更新md5对象    return m.hexdigest()    #返回md5对象def get_str_md5(content):    """    计算字符串md5    :param content:    :return:    """    m = hashlib.md5(content) #创建md5对象    return m.hexdigest()

 

好了,关于md5的计算就到这里,有不同见解的同学,欢迎拍砖,一起来探讨,谢谢。

 

转载于:https://www.cnblogs.com/xiaodekaixin/p/11203857.html

你可能感兴趣的文章
C#中的委托和事件(续)
查看>>
python--MySql
查看>>
机器学习 - pycharm, pyspark, spark集成篇
查看>>
mysql explain 中key_len的计算
查看>>
实验一
查看>>
Linux内核--网络栈实现分析(九)--传输层之UDP协议(下)
查看>>
Lua -- 简洁、轻量、可扩展的脚本语言
查看>>
Python 2.7_Second_try_爬取阳光电影网_获取电影下载地址并写入文件 20161207
查看>>
[Fiddler] 开启Fiddler抓包的时候产品报“证书错误”
查看>>
打包苦逼活
查看>>
Oracle Certified Java Programmer 经典题目分析(二)
查看>>
第二十五章补充内容 17位字段
查看>>
灰色预测
查看>>
css随笔
查看>>
基于自己封装的select下拉选择的省市区三级联动效果,兼容IE
查看>>
初识Python
查看>>
nodejs+mysql入门实例(改)
查看>>
表达式语言
查看>>
jQuery EasyUI实现关闭全部tabs
查看>>
iOS项目之WKWebView替换UIWebView相关
查看>>