【Python学习之四】集合类型

环境
　　虚拟机：VMware 10
　　Linux版本：CentOS-6.5-x86_64
　　客户端：Xshell4
　　FTP：Xftp4
　　python3.6

一、字符串：字符串实际上就是字符的数组
1、切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
(1)python中从左侧开始，下标 0 开始；从右侧，下标从-1开始；
(2)切片的语法：[起始:结束:步长],选取的区间属于左闭右开型，即从"起始"位开始，到"结束"位的前一位结束（不包含结束位本身)，步长：表示下标变化的规律。

示例：

a='abcdefg'
print(a[0])#取字符串0位置字符:a
print(a[-1])#从右侧取字符串-1位置字符:g

print(a[2:10])#如果结束位置超过字符串总长度 不会报错  会一直取到字符串末尾:cdefg
#print(a[10])#如果直接使用下标超过字符串长度的下标取值 会报错：IndexError: string index out of range

print(a[:3])#取字符串0-2位置字符 起始位置0可以省略:abc
print(a[3:])#取字符串3到末尾字符 结束位置为末尾 可以省略:defg

print(a[0:3])#取字符串0-2位置字符:abc
print(a[1:-1])#取 下标为1开始 到 最后第2个  之间的字符
print(a[0:4:3])#从0位置开始 每3个长度取一个字符串:ad
print(a[::-1])#末尾到开始区间 按照从右向左取值 相当于反转字符串：gfedcba
print(a[0:6:-2])#没有结果 从0开始向左没有值了
print(a[6:0:-2])#从下标6开始向左每隔2个位置取值 不包括0位置：gec

2、字符串常用API
<1>find == java Indexof方法
检测 str 是否包含在 mystr中，如果是返回开始的索引值，否则返回-1
mystr.find(str, start=0, end=len(mystr))
<2>index
跟find()方法一样，只不过如果str不在 mystr中会报一个异常.
mystr.index(str, start=0, end=len(mystr))
<3>count
返回 str在start和end之间在 mystr里面出现的次数
mystr.count(str, start=0, end=len(mystr))
<4>replace
把 mystr 中的 str1 替换成 str2,如果 count 指定，则替换不超过 count 次.
mystr.replace(str1, str2, mystr.count(str1))
<5>split
以 str 为分隔符切片 mystr，如果 maxsplit有指定值，则仅分隔 maxsplit 个子字符串
mystr.split(str=" ", 2)
<6>capitalize
把字符串的第一个字符大写
mystr.capitalize()
<7>title
把字符串的每个单词首字母大写
<8>startswith
检查字符串是否是以 obj 开头, 是则返回 True，否则返回 False
mystr.startswith(obj)
<9>endswith
检查字符串是否以obj结束，如果是返回True,否则返回 False.
mystr.endswith(obj)
<10>lower
转换 mystr 中所有大写字符为小写
mystr.lower()
<11>upper
转换 mystr 中的小写字母为大写
mystr.upper()
<12>ljust
返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
mystr.ljust(width)
<13>rjust
返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
mystr.rjust(width)
<14>center
返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
mystr.center(width)
<15>lstrip
删除 mystr 左边的空白字符
mystr.lstrip()
<16>rstrip
删除 mystr 字符串末尾的空白字符
mystr.rstrip()
<17>strip ---java trim
删除mystr字符串两端的空白字符
<18>rfind
类似于 find()函数，不过是从右边开始查找.
mystr.rfind(str, start=0,end=len(mystr) )
<19>rindex
类似于 index()，不过是从右边开始.
mystr.rindex( str, start=0,end=len(mystr))
<20>partition
把mystr以str分割成三部分,str前，str和str后
mystr.partition(str)
<21>rpartition
类似于 partition()函数,不过是从右边开始.
mystr.rpartition(str)
<22>splitlines
按照换行符分隔，返回一个包含各行作为元素的列表
mystr.splitlines()
<23>isalpha
如果 mystr 所有字符都是字母则返回 True,否则返回 False
mystr.isalpha()
<24>isdigit
如果 mystr 只包含数字则返回 True 否则返回 False.
mystr.isdigit()
<25>isalnum
如果 mystr 所有字符都是字母或数字则返回 True,否则返回 False
mystr.isalnum()
<26>isspace
如果 mystr 中只包含空格，则返回 True，否则返回 False.
mystr.isspace()
<27>join

将mystr 插入list的每个元素后面（list最后一个元素除外）,构造出一个新的字符串

mystr.join(list)

示例：

b='ab cdefg'
print(b.find('b'))#1  
print(b.find('d',0))#4

#print(b.index('t'))#ValueError: substring not found

print(b.count('d'))#1
print(b.replace('f', '123'))#ab cde123g

print(b.split(sep=' ', maxsplit=1)) #['ab', 'cdefg']
print(b.capitalize())#Ab cdefg
print(b.title())#Ab Cdefg
print(b.startswith("ab"))#True
print(b.endswith('cc'))#False
print(b.lower())#ab cdefg
print(b.upper())#AB CDEFG
print(b.ljust(20))#ab cdefg            
print(b.rjust(20))#            ab cdefg
print('*'*50)#**************************************************
print(b.center(50))#                     ab cdefg                     
print('*'*50)#**************************************************
print(b.strip())
print(b.partition(' '))#('ab', ' ', 'cdefg')
c=['1','2','3']
print(b.join(c))#1ab cdefg2ab cdefg3

二、列表 list

Python内置的一种数据类型。list是一种有序、可重复、元素数据类型多样化的集合，可以随时添加和删除元素，使用中括号[]。

a=['a','b','c',10,12.5]
b=['1','2']
print(len(a))#len()是内置函数 用来计算集合元素个数：5
print(a[2])#列表也是通过下标来获取元素:c
#print(a[6])#超出长度取值报错：IndexError: list index out of range

1、列表增加元素
(1)append:在列表末尾追加新元素

a.append('d')
print(a)#['a', 'b', 'c', 10, 12.5, 'd']
a.append(b)
print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2']]

(2)extend:可以将另一个集合中的元素逐一添加到列表中

a.extend(b)
print(a)#['a', 'b', 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

(3)insert: 在指定位置index前插入元素object

a.insert(2, 500)
print(a)#['a', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

2、修改元素
修改元素的时候，要通过下标来确定要修改的是哪个元素，然后才能进行修改

a[0]='l'
print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1', '2']

3、查找元素
in（存在）,如果存在那么结果为true，否则为false
not in（不存在），如果不存在那么结果为true，否则false

print(10 in a)#True

index：返回某个元素下标，找不到报错ValueError: ' ' is not in list
count：返回某个元素的个数，找不到报错ValueError: ' ' is not in list

print(a.index('a', ))#找不到报错ValueError: 'a' is not in list
print(a.count('a'))#找不到报错ValueError: 'a' is not in list

4、删除元素
pop：默认删除最后一个元素

a.pop()
print(a)#['l', 'b', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']

remove：根据元素的值进行删除第一个

a.remove('b')
print(a)#['l', 500, 'c', 10, 12.5, 'd', ['1', '2'], '1']

del：根据下标进行删除，其实可以删除所有变量

del(a[0])
print(a)#[500, 'c', 10, 12.5, 'd', ['1', '2'], '1']
del(a)
print(a)#NameError: name 'a' is not defined

5、排序

sort方法是将list按特定顺序重新排列，默认为由小到大，参数reverse=True可改为倒序，由大到小。
reverse方法是将list逆置。

c = [1, 4, 2, 3]
c.sort()
print(c)#[1, 2, 3, 4]
c.reverse()
print(c)#[4, 3, 2, 1]

6、遍历

（1）枚举

打印下标和元素

chars = ['a', 'b', 'c', 'd']
for i,chr in enumerate(chars):
    print(i,chr)
# 0 a
# 1 b
# 2 c
# 3 d

（2）通用方式

chars = ['a', 'b', 'c', 'd']
for chr in chars:
    print(chr)
# a
# b
# c
# d

（3）按照序号类似枚举

for i in range(len(chars)):
    print(i, chars[i])
# 0 a
# 1 b
# 2 c
# 3 d

（4）python2中的xrange

for i in xrange(len(chars)):
    print(i, chars[i])
# 0 a
# 1 b
# 2 c
# 3 d

xrange 和range的区别：

　　range会直接将所有结果生成一个list对象；
　　xrange则不会直接生成一个list，而是一个生成器，会每次调用返回其中的一个值；
　　因此，xrange的循环性能比range好，尤其是当列表返回很大的情况。但是当你需要返回是一个列表的话，可以使用range

7、列表推导式
就是指的轻量级循环创建列表
示例：

a=[i for i in range(1,10)]
print(a)#[1, 2, 3, 4, 5, 6, 7, 8, 9]

(1)在循环的过程中使用if 来确定列表中元素的条件

a=[i for i in range(1,10) if i%2==0]
print(a)#[2, 4, 6, 8]

(2)2个for循环

a=[(i,j) for i in range(1,5) for j in range(6,10)]
print(a)#[(1, 6), (1, 7), (1, 8), (1, 9), (2, 6), (2, 7), (2, 8), (2, 9), (3, 6), (3, 7), (3, 8), (3, 9), (4, 6), (4, 7), (4, 8), (4, 9)]

(3)3个for循环

a=[(x,y,z) for x in range(2) for y in range(2) for z in range(2)]
print(a)#[(0, 0, 0), (0, 0, 1), (0, 1, 0), (0, 1, 1), (1, 0, 0), (1, 0, 1), (1, 1, 0), (1, 1, 1)]

三、元组
Python的元组与列表类似，不同之处在于元组的元素不能修改。元组使用小括号()，列表使用方括号[]

元祖也可以使用下标获取元素：

t=('a','b','c',10,12.5,['A','B'])
print(t)#('a', 'b', 'c', 10, 12.5, ['A', 'B'])
print(t[2])#c

tt=(1,)#只有1个元素的tuple定义时必须加一个逗号,，来消除歧义
print(tt)#(1,)
ttt=(1)
print(ttt)#1

元组用的不多，主要注意是元素不可改变，如果元素是引用类型，则引用类型元素中元素是可以改变的

t[5][0]='X'
t[5][1]='Y'
print(t)#('a', 'b', 'c', 10, 12.5, ['X', 'Y'])

t[5]=['X','Y']#报错TypeError: 'tuple' object does not support item assignment

元组遍历：

tuple=(1,2,3,'a','b')
for t in tuple:
    print(t)
# 1
# 2
# 3
# a
# b

四、字典dict(java中叫map)
键-值（key-value）存储，字典的每个元素由2部分组成，键:值,使用大括号{}表示，dict的key必须是不可变对象,比如字符串，整数等，不能使用list。

示例：
info = {'name':'班长', 'id':100, 'sex':'f', 'address':'地球亚洲中国北京'}
说明：
字典和列表
(1)字典和列表一样，也能够存储多个数据;
(2)dict内部存放的顺序和key放入的顺序是没有关系的
(3)字典中找某个元素时，是根据'名字'（就是冒号:前面的那个值，例如上面代码中的'name'、'id'、'sex'）;列表中找某个元素时，是根据下标进行的;
(4)字典查找和插入的速度极快，不会随着key的增加而变慢;列表查找和插入的时间随着元素的增加而增加；
(5)字典具有极快的查找速度,需要占用大量的内存，内存浪费多;列表占用空间小，浪费内存很少。

1、取值
在不确定字典中是否存在某个键而又想获取其值时，可以使用get方法，还可以设置默认值;

print(info['name'])#取值：班长
#print(info['age'])#报错：KeyError: 'age'

print(info.get('name'))
age=info.get('age')
print(type(age))#age为None：<class 'NoneType'>
age1=info.get('age',18)#若info中不存在'age'这个键，就返回默认值18
print(age1)#18

2、修改

info['id']=200
print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}

3、添加
如果在使用变量名['键'] = 数据时，这个“键”在字典中，不存在，那么就会新增这个元素

info['age']=18
print(info)#{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18}

4、删除
del删除指定的元素

print('删除前：%s'%info)#删除前：{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京', 'age': 18}
del info['age']
print('删除后：%s'%info)#删除后：{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}

del删除整个字典

print('删除前：%s'%info)#删除前：{'name': '班长', 'id': 200, 'sex': 'f', 'address': '地球亚洲中国北京'}
del info
#print('删除后：%s'%info)#报错：NameError: name 'info' is not defined

清空整个字典

info = {'name':'monitor', 'sex':'f', 'address':'China'}
print('清空前,%s'%info)#清空前,{'name': 'monitor', 'sex': 'f', 'address': 'China'}
info.clear()
print('清空后,%s'%info)#清空后,{}

5、len()测量字典中，键值对的个数

info = {'name':'monitor', 'sex':'f', 'address':'China'}
print(len(info))#3

6、has_key （python2.7版本） == in 条件表达式

dict.has_key(key)如果key在字典中，返回True，否则返回False
>>>info={'name':'monitor', 'sex':'f', 'address':'China'}
>>>info.has_key('id')
>>>False

7、字典四种遍历方式
(1)遍历字典的key（键）

dict={'name':'张三','age':20}
for key in dict.keys():
print('key:%s,value:%s'%(key,dict[key]))
#key:name,value:张三
#key:age,value:20

(2)遍历字典的value（值）

for value in dict.values():
print('value:%s'%value)
# value:张三
# value:20

(3)遍历字典的项（元素）

#item是一个元组
for item in dict.items():
print(item) 
#('name', '张三')
#('age', 20)

(4)遍历字典的key-value（键值对）
#注意区别 item()和items()

for key,value in dict.items():
print('key=%s,value=%s'%(key,value))
# key=name,value=张三
# key=age,value=20

小结：可变类型与不可变类型
1、可变类型，值可以改变：
列表 list
字典 dict
set （没有value的字典）

2、不可变类型，值不可以改变：
数值类型 int, long, bool, float
字符串 str
元组 tuple

3、集合类型

列表（list）	a=[]	先后顺序，有下标位[index],可以重复，可变类型
元组(tuple)	a=()	有先后顺序，有下标位，元素可以重复，不可变（只能查）
字典(dict)	a={key:value}	没有先后顺序，没有下标，key不可重复，value可以，可变类型
集合（set）	a=set()	没有先后顺序，没有下标，不可重复，可变类型

参考：

Python学习笔记