Python 函数基础、有序集合、文件操作(三)

一、set

特点:

   set是一个无序且不重复的元素集合访问速度快;天生解决元素重复问题

方法:

初始化

>>> s1 = set()
>>> print(type(s1))
<class 'set'>

add()  增加元素

>>> s1.add('tom')
>>> print(s1)
{'tom'}

clear()  清空

>>> s1.clear()
>>> print(s1)
set()

差集

  循环老的序列,只要某一个元素在原序列,有就删除。对比自己没有的

difference()  对比,显示不同的部分

Return the difference of two or more sets as a new set.

返回不同的部分生成新的集合。

>>> s1  
{1, 2, 3, 4, 'haha'}
>>> s2 = s1.difference(['haha'])
>>> s2
{1, 2, 3, 4}

difference_update()  对比,并将修改原集合,不生成新的集合

>>> s1  
{1, 2, 3, 4, 'haha'}

>>> s3 = s1.difference_update(['haha'])
>>> s1
{1, 2, 3, 4}
>>> s3
>>>

difference和differentce_update的区别:

  一个是生成新的set

  删除当前set中包含在new set里的元素

dicard()  移除

>>> s1.discard(1)
>>> s1
{2, 3, 4}

intersection()  取交集,生成新set

>>> s1
{1, 2, 3, 4, 'tom', 'cow', 'cat'}
>>> s3 = s1.intersection(['tom','cat'])
>>> s3
{'cat', 'tom'}

intersetion_update()  取交集,修改原来set

>>> s3 = s1.intersection_update(['tom','cat'])
>>> s3     #说明没有生成新的set
>>> s1
{'cat', 'tom'}  #修改原set

isdisjonint()  如果没有交集,返回True

>>> s1
{'tom', 1, 2, 3, 4, 'cat', 'pig'}
>>> s3
{'haha'}
>>> s1.isdisjoint(s3)
True

issubset()  是否是子集

>>> s1
{'tom', 1, 2, 3, 4, 'cat', 'pig'}
>>> s2
{'tom', 3}
>>> s2.issubset(s1)
True

s1.issuperset(s2)  是否是父集;s2是否是s1的子集,如果是则返回True,否则返回False

>>> s1
{'tom', 1, 2, 3, 4, 'cat', 'pig'}
>>> s2
{'tom', 3}
>>> s1.issuperset(s2)
True

pop()  移除;移除的同时并获取这个值

>>> s1
{2, 3, 4, 'cat', 'pig'}
>>> ret = s1.pop()
>>> ret
2
{3, 4, 'cat', 'pig'}

remove()  指定移除;没有返回值

>>> s1.remove('pig')
>>> s1
{3, 4, 'cat'}

对称差

  循环两次,对比前后set的不同。

symmetric_difference()  差集,并获取新对象

>>> s1
{3, 4, 'cat'}
>>> s2
{'tom', 3}
>>> s1.symmetric_difference(s2)
{'tom', 'cat', 4}

symmetric_difference_update()  差集,改变原来;对比两个集合,取不同部分返回给原来的集合

>>> s1 = set('abcd')
>>> s2 = set('bcdf')
>>> s1.symmetric_difference_update(s2)
>>> s1
{'f', 'a'}
>>> s2
{'b', 'f', 'c', 'd'}

union()  并集

>>> s2 = set('bcdf')
>>> s1 = set('abcd')
>>> s1.union(s2)
{'b', 'a', 'd', 'c', 'f'}

update()  更新

>>> s1.update([2])
>>> s1
{'b', 2, 'a', 'h', 'd', 'c'}

二、collection系列

1、计数器

首先需要导入 collections模块 

Counter()  统计

import collections

>>> st1 = collections.Counter('asdasdqwcadfqwqwfadf')
>>> st1
Counter({'a': 4, 'd': 4, 'f': 3, 'q': 3, 'w': 3, 's': 2, 'c': 1})

most_common()   取出出现前X个

>>> print(st1.most_common(4))
[('a', 4), ('d', 4), ('f', 3), ('q', 3)]

>>> for k in st1.elements():
...     print(k)
...
c
a
a

.......

>>> for k,v in st1.items():
...     print(k,v)
...
c 1
a 4
f 3
q 3
w 3
s 2
d 4

  elements,等于原生的值。传入的是什么就是什么;

  st1,就是处理过封装过的数据。

update()  增加

>>> st1 = collections.Counter('asdasdasdasdsadasqweqw')
>>> st1
Counter({'a': 6, 's': 6, 'd': 5, 'q': 2, 'w': 2, 'e': 1})
>>> st1.update(['tom','a','asd'])
>>> st1
Counter({'a': 7, 's': 6, 'd': 5, 'q': 2, 'w': 2, 'tom': 1, 'asd': 1, 'e': 1})

subtract()  删除

  如果存在就减1,不存在为-1

>>> st1 = collections.Counter('aabbccddeef')
>>> st1
Counter({'b': 2, 'e': 2, 'c': 2, 'a': 2, 'd': 2, 'f': 1})
>>> st1.subtract(['a','dd'])
>>> st1
Counter({'b': 2, 'e': 2, 'c': 2, 'd': 2, 'f': 1, 'a': 0, 'dd': -1})

2、有序字典

>>> dic = collections.OrderedDict()
>>> dic = dict()
>>> dic['k1'] = 'aa'
>>> dic['k2'] = 'bb'
>>> dic['k3'] = 'cc'
>>> dic
{'k2': 'bb', 'k1': 'aa', 'k3': 'cc'}

move_to_end()  移动一个到最后面
>>> dic = collections.OrderedDict()
>>> dic['k1'] = 'aa'
>>> dic['k2'] = 'bb'
>>> dic['k3'] = 'cc'

>>>dic.move_to_end('k1')

OrderedDict([('k2', 'bb'), ('k3', 'cc'), ('k1', 'aa')])

pop()  删除

>>> dic.pop('k1')
'aa'
>>> dic
OrderedDict([('k2', 'bb'), ('k3', 'cc')])

update()  增加

>>> dic.update({'k1':'1111','k100':'100'})
>>> dic
OrderedDict([('k2', 'bb'), ('k3', 'cc'), ('k1', '1111'), ('k100', '100')])

3、默认字典

>>> dic = collections.defaultdict(list)
>>> dic['k1'].append('tom')
>>> dic
defaultdict(<class 'list'>, {'k1': ['tom']})

from collections import defaultdicevalues = [11,22,33,44,55,66,77,88,99,]

my_dict = defaultdict(list)

my_dict = {}

for value in values:

  if value > 66:

    my_dict['k1'].append(value)

  else:

    my_dict[''k2].append(value)

4、可命名元组

>>> MytupleClass = collections.namedtuple('MytupleClass',['x','y','z'])
>>> st1 = MytupleClass(11,22,33)

>>> print(st1.x)
11

>>> print(st1.y)

22

>>> print(st1.z)
33

5、队列

>>> d = collections.deque()
>>> d
deque([])
>>> d.append('1')
>>> d
deque(['1'])
>>> d.appendleft('11')
>>> d.appendleft('22')
>>> d
deque(['22', '11', '1'])

count()  统计

>>> d
deque(['11', '22', '11', '1'])

>>> d.count('11')
2


单向队列

  先进先出

import queue

q = queue.Queue()

q.put('123')

q.put('678'

print(q.qsize())

2

print(q.get())

>>> print(q.get())
123
>>> print(q.get())
678
>>> print(q.get())

6、深浅拷贝

copy.copy()

  只拷贝一层

>>> s1 = 'aa'

>>> s2 = s1
>>> print(id(s1))
4558601776
>>> print(id(s2))
4558601776

>>> n1 = [1,2,'aa','bb',{'kk':'vv'}]
>>> n1
[1, 2, 'aa', 'bb', {'kk': 'vv'}]
>>> n2 = n1
>>> print(id(n1))
4558122952
>>> print(id(n2))
4558122952

copy.deepcopy()

  拷贝所有层
a

三、函数基础

  学习函数之前,为了实现某个特定功能,需要根据业务逻辑从上到下实现功能,套用无数个if...else或者while循环,需要相当长的代码来实现。并且在开发过程中会出现许多重复的代码,引入函数后就可以避免这一乱象。

1、自定义函数

  Python的函数是通过赋值传递的,参数通过赋值传递给函数。def语句将创建一个函数对象并将其赋值给一个变量名,def语句的一般格式如下:

def function_name(arg1,arg2[,...]):

  statement

[return value]

  def:表示函数的关键字

  函数名:函数的名称,根据名称来调用函数

  函数体:函数中进行一系列的逻辑计算,封装的一些功能

  参数:为函数体提供数据

  返回值:当函数执行完毕后,可以给调用者返回数据。但返回值不是必须的,如果没有return语句,则默认返回值为None。

示例:

#有返回值
def
test():   st1 = 'tom'   st2 = 'cat'   return st1,st2 reg = test() print(reg) #输出结果 ('tom', 'cat')
#无返回值
def
test(): st1 = 'tom' st2 = 'cat' reg = test() print(reg) #运行结果 None

参数:

  普通参数

  默认参数

  动态参数

  Python函数的两种类型参数,一种是函数定义里的形参,一种是调用函数时传入的实参。

在函数的内部,实参会被赋值给形参。

  作为实参传入到函数的变量名称和函数定义里形参的名字没有关系。函数里面只关心形参的值,而不去关心它在调用前叫什么名字。

异常处理:

  try/except 捕获异常并处理

try:  

  block
except [exception,[data…]]:
   block

  执行try下的语句,如果引发异常,则执行过程会跳到第一个except语句;

  如果第一个except中定义的异常与引发的异常匹配,则执行该except中的语句;

  如果不匹配则执行下一个except。

import smtplib
from email.mime.text import MIMEText
from email.utils import formataddr

def mail(f_user,t_user):
    res = True
    try:
        msg = MIMEText('邮件内容','plain','utf-8')
        msg['From'] = formataddr(['wo',f_user])
        msg['To'] = formataddr(['Test',t_user])
        msg['Subject'] = '主题'
        server = smtplib.SMTP('smtp.163.com',25)
        server.login(f_user,'hahah@163.com')
        server.sendmail(f_user,[t_user,],msg.as_string())
        server.quit()
    except Exception:
        res = False
    return ret
res = mail('xxxxx@163.com','xxxxx@163.com')
if res == True:
    print("Success!")
else:
    print("Try again!")

  代码执行解析:

  1、传两个值给mail()分别为发送者和接受者邮箱;

  2、执行mail(),指定res为True,如果执行后面发送邮件功能正常运行,那么就不再执行except;

     如果发送邮件失败,执行except,并将res = False;

  3、如果res 返回值为True,打印“Success!”,否则打印“Try again!”

 动态参数

  当函数的参数不确定时,可以使用*args和**kwargs。*args没有key值,**kwargs有key值

  示例:

def show(*args):
    print(args,type(args))
show('enenen')
#运行结果
('enenen',) <class 'tuple'>

# *args可以当作可容纳多个变量组成的list或tuple
def show(**args):
    print(args,type(args))
show(k1  = 22)
#运行结果
{'k1': 22} <class 'dict'>
def show(*args,**kwargs):
    print(args,type(args))
    print(kwargs,type(kwargs))
show(2,3,4,232,4343,n1=20,k1='tom')
#运行结果
(2, 3, 4, 232, 4343) <class 'tuple'>
{'n1': 20, 'k1': 'tom'} <class 'dict'>

  写参数的时候,一个*放在前面,两个*放后面。

def show(*args,**kwargs):
    print(args,type(args))
    print(kwargs,type(kwargs))
l = [1,2,3,3434,343,]
d = {'k1':100,'k2':20}
show(*l,**d)
#运行结果
(1, 2, 3, 3434, 343) <class 'tuple'>
{'k2': 20, 'k1': 100} <class 'dict'
动态参数格式化
s1 = '{0} is {1}' res = s1.format('tom','cat') print(res) #运行结果 tom is cat
s1 = '{0} is {1}'
l = ['tom','cat']
res = s1.format(*l)
print(res)
#运行结果
tom is cat
s1 = '{name} is {age}'
d1 = {'name':'tom','age':11}
res = s1.format(**d1)
print(res)
#运行结果
tom is 11

 四、文件操作

  详情见http://www.cnblogs.com/xiajie/p/5081122.html 补充部分:

read():读取指定数目个字节到字符串中,负数将读取至文件末尾,默认是-1

>>> file_obj = open('test.txt','r')
>>> file_obj.read()
'dfdff\n'
>>> file_obj.seek(0)
>>> file_obj.read(0)
''
>>> file_obj.read(1)
'd'
>>> file_obj.read(2)
'fd'
>>> file_obj.read(-1)
'ff\n'

readline():读取文件的一行,包括行结束符,可以制定size参数的值,默认是-1

>>> file_obj = open('test.txt','r')
>>> file_obj.readline()
'xxx\n'
>>> file_obj.readline(2)
'ha'
>>> file_obj.readline(-1)
'enene\n'

readlines():读取所有剩余的行,然后作为一个字符串列表返回

    
>>> file_obj.seek(0)
>>> file_obj.readlines()
['xxx\n', 'haha\n', 'enene\n']

文件的指针定位与查询

(1)文件指针:

      文件被打开后,其对象保存在 f 中, 它会记住文件的当前位置,以便于执行读、写操作,这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

(2)文件打开时的位置:

      以"r"   "r+"   "rb+" 读方式, "w"   "w+"   "wb+"写方式 打开的文件,

     一开始,文件指针均指向文件的头部。

(3) 获取文件指针的值:

      L = f.tell()

(4) 移动文件的指针

       f.seek(   偏移量, 选项 )

      选项 =0 时, 表示将文件指针指向从文件头部到 "偏移量"字节处。

      选项 =1 时, 表示将文件指针指向从文件的当前位置,向后移动 "偏移量"字节。

      选项 =2 时, 表示将文件指针指向从文件的尾部,,向前移动 "偏移量"字节。

  

>>> file_obj.seek(0)
>>> file_obj.tell()
0
>>> file_obj.seek(5)
>>> file_obj.tell()
5
 
>>> file_obj.seek(5,1)
>>> file_obj.tell()
10
>>> file_obj.seek(5,2)
>>> file_obj.tell()
57
>>> file_obj.seek(5,0)
>>> file_obj.tell()
5
原文地址:https://www.cnblogs.com/xiajie/p/5137149.html