栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python base64编码

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python base64编码

Python base64编码 1.bytes.decode()

decode()方法语法:

bytes.decode(encoding="utf-8", errors="strict")
  • encoding – 要使用的编码,如"UTF-8"。
  • errors – 设置不同错误的处理方案。默认为 ‘strict’,意为编码错误引起一个UnicodeError。 其他可能得值有 ‘ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 以及通过 codecs.register_error() 注册的任何值。
实例
#!/usr/bin/python3
 
str = "菜鸟教程";
str_utf8 = str.encode("UTF-8")
str_gbk = str.encode("GBK")
 
print(str)
 
print("UTF-8 编码:", str_utf8)
print("GBK 编码:", str_gbk)
 
print("UTF-8 解码:", str_utf8.decode('UTF-8','strict'))
print("GBK 解码:", str_gbk.decode('GBK','strict'))

结果:

菜鸟教程
UTF-8 编码: b'xe8x8fx9cxe9xb8x9fxe6x95x99xe7xa8x8b'
GBK 编码: b'xb2xcbxc4xf1xbdxccxb3xcc'
UTF-8 解码: 菜鸟教程
GBK 解码: 菜鸟教程
2.base64使用 a.简介

base64是网络上最常见的用于传输8Bit字节码的编码方式之一,base64就是一种基于64个可打印字符(包括a-z、A-Z、0-9、/、+)来表示二进制数据的方法。base64编码是从二进制到字符的过程,可用于在HTTP环境下传递较长的标识信息。

按照RFC2045的定义,base64被定义为:base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。(The base64 Content-Transfer-Encoding is designed to represent arbitrary sequences of octets in a form that need not be humanly readable.)

base64编码是一种“防君子不防小人”的编码方式。广泛应用于MIME协议,作为电子邮件的传输编码,生成的编码可逆,后一两位可能有“=”,生成的编码都是ascii字符。
优点:速度快,ascii字符,肉眼不可理解
缺点:编码比较长,非常容易被破解,仅适用于加密非关键信息的场合

b.编码原理

base64要求把每三个8Bit的字节转换为四个6Bit的字节(38 = 46 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。

base64编码遵循以下规则:

①.把3个字符变成4个字符。

②每76个字符加一个换行符。

③.最后的结束符也要处理。

从严格意义上来说,base64编码算法并不算是真正的加密算法,它只是将源数据转码成为了一种不易阅读的形式,而转码的规则是公开的(解码很容易)。转码之后的数据具有不可读性,需要解码后才能阅读。

注:base64加密后产生的字节位数是8的倍数,如果不够位数以=符号填充。


c.实例
import base64

if __name__ == '__main__':
    s = '这是一段文字'
    ss = s.encode('utf-8')  # 返回字节数组bytes
    output = base64.b64encode(ss)  # 参数支持bytes
    print(output)  # b'6L+Z5piv5LiA5q615paH5a2X'
    print(str(output, 'utf-8'))  # 6L+Z5piv5LiA5q615paH5a2X  将bytes转换为字符串
    raw_string = base64.b64decode(output)  # 解码 返回字节数组.
    print(raw_string)  # b'xe8xbfx99xe6x98xafxe4xb8x80xe6xaexb5xe6x96x87xe5xadx97'
    print(raw_string.decode()) # 这是一段文字

d.具体图示


关于不足 补=

所以 A对应的base64字符就是QQ。上边已经说过了,原则是base64字符的最小单位是四个字符一组,那这才两个字 符,后边补两个"=“吧。其实不用”=“也不耽误解码,之所以用”=",可能是考虑到多段编码后的base64字符串拼起来也不会引起混淆。由此可见 base64字符串只可能最后出现一个或两个"=",中间是不可能出现"="的。下图中字符"BC"的编码过程也是一样的。

说起base64编码可能有些奇怪,因为大多数的编码都是由字符转化成二进制的过程,而从二进制转成字符的过程称为解码。而base64的概念就恰好反了,由二进制转到字符称为编码,由字符到二进制称为解码。

base64编码主要用在传输、存储、表示二进制等领域,还可以用来加密,但是这种加密比较简单,只是一眼看上去不知道什么内容罢了,当然也可以对base64的字符序列进行定制来进行加密。

3.参考文章

传送门

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/348606.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号