博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python2 与python3中最大的区别(编码问题bytes&str
阅读量:6274 次
发布时间:2019-06-22

本文共 1973 字,大约阅读时间需要 6 分钟。

 

1,在python2.x 中是不区分bytes和str类型的,在python3中bytes和str中是区分开的,str的所有操作bytes都支持
python2 中                                                    
>>> s = "abcdefg"
>>> b = s.encode()    #或者使用下面的方式
>>> b = b"abcdefg"
>>> type(b)
<type 'str'>
python3中     #str和bytes是严格区分的
>>> s = "abcdefg"
>>> type(s)
<class 'str'>
>>> b = b"abcdefg"
>>> type(b)
<class 'bytes'>
str是文本系列,bytes是字节系列
文本是有编码的(UTF-8,GBK,GB2312等)
字节没有编码
文本的编码指的是字符如何使用字节来表示组织方式,linux下默认都使用UTF-8
2,bytes与str之间的转换-------编码
bytes由str通过encode方法转化得到的,str也可以通过bytes 通过decode方法转化得到
通过b前缀可以定义bytes
GBK 是双字节,UTF-8 灵活编码,1字节,2字节,3字节,4字节都有,最大支持6字节长度,中文大多数是3字节
>>> S = "我是中国人"
>>> S
'我是中国人'
>>> b = S.encode()     #进行编码为bytes
>>> b
b'\xe6\x88\x91\xe6\x98\xaf\xe4\xb8\xad\xe5\x9b\xbd\xe4\xba\xba'
>>> b.decode()    #进行解码为字符串
'我是中国人'
>>>
str被编码成什么格式的,就需要使用什么格式的编码进行解码
>>> S = "我是中国人"
>>> S
'我是中国人'
>>> b = S.encode('GBK')
>>> b
b'\xce\xd2\xca\xc7\xd6\xd0\xb9\xfa\xc8\xcb'
>>> b.decode('GBK')
'我是中国人'
可以使用bin( )将一个10进制整数或者16进制数转化为2进制
>>> bin(10)
'0b1010'
>>>
>>> bin(0xce)
'0b11001110'
3,bytes的操作
bytes具有string类型的所有操作,bytes可以通过str encode转化,也可以通过前缀b定义
>>> b = b'abc'
>>> b
b'abc'
>>> b.decode()
'abc'
>>> b'abc'.find(b'c')
2
>>> len(('我是中国人').encode())      #求bytes的长度
15
>>> b
b'abc'
>>> b.hex()   #转化为16进制
'616263'
>>> bin(616263)      #转化为2进制
'0b10010110011101000111'
除了encode外,str操作都有对应的bytes版本,但是传入的参数必须是bytes
                                                                          
bytearray类型
bytearray是可变的,bytes和str是不可变的,主要用于图片处理
相对bytes来说,多了insert,append,extend,pop,remove,clear,reverse等操作,并且支持索引操作
>>> S1 = "人生苦短,我学python!"
>>> S1
'人生苦短,我学python!'
>>> b1 = bytearray(S1.encode())
>>> b1.decode()
'人生苦短,我学python!'
>>> b1
bytearray(b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe5\xad\xa6python\xef\xbc\x81')
>>> b1[:6] = bytearray('生命'.encode())
>>> S1
'人生苦短,我学python!'
>>> b1
bytearray(b'\xe7\x94\x9f\xe5\x91\xbd\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe5\xad\xa6python\xef\xbc\x81')
>>> b1.decode()
'生命苦短,我学python!'
>>>

 

原文:https://blog.csdn.net/u010694764/article/details/53811035

转载于:https://www.cnblogs.com/fmgao-technology/p/9054802.html

你可能感兴趣的文章
solrCloud+tomcat+zookeeper集群配置
查看>>
/etc/fstab,/etc/mtab,和 /proc/mounts
查看>>
Apache kafka 简介
查看>>
socket通信Demo
查看>>
技术人员的焦虑
查看>>
js 判断整数
查看>>
建设网站应该考虑哪些因素
查看>>
mongodb $exists
查看>>
js实现页面跳转的几种方式
查看>>
sbt笔记一 hello-sbt
查看>>
常用链接
查看>>
pitfall override private method
查看>>
springMVC数据绑定
查看>>
!important 和 * ----hack
查看>>
聊天界面图文混排
查看>>
控件的拖动
查看>>
svn eclipse unable to load default svn client的解决办法
查看>>
Android.mk 文件语法详解
查看>>
nGrinder3.2重磅发布
查看>>
QT liunx 工具下载
查看>>