python基础-文件处理与函数

1. 文件处理

1.1 文件处理流程

　　1.打开文件，得到文件句柄并赋值给一个变量

　　2.通过句柄对文件进行操作

　　3.关闭文件

1.2 文件读取模式r

　　r文本模式的读，在文件不存在，不会创建新文件

f = open('a.txt','r',encoding='utf-8')
f.readable()    # 判读文件是否可读
f.writable()    # 判读文件是否可写
f.readline()    # 一次读取一行
f.readlines()   # 一次读取所有值
f.close()

1.3 文件读取模式rb

　　b模式直接从硬盘中读取bytes，不用指定编码格式；以什么格式存的文件，以什么格式读取文件

f = open('a.txt','rb')
print(f.read().decode('utf-8'))
f.close()

1.4 文本写模式 w

　　w文本模式的写，文件存在则清空，不存在则创建

f = open('a.txt','w',encoding='utf-8')
f.writable()                    # 判断是否可写
f.readable()                    # 判断是否可读
f.write('你好')                 # 写单个值
f.writelines(['aaa
','bbb
'])    # 写列表
f.writelines(('111
','222
'))    # 写元组
f.close()

1.5 文件追加模式a

　　a 文件模式的追加，文件存在、光标跳到文件末尾，文件不存在创建

f = open('a.txt','a',encoding='utf-8')
print(f.tell())     # 打印文件光标的位置
f.write('3333
')
f.write('4444
')
f.close()

1.6 混合模式

　　"+" 表示可以同时读写某个文件

　　r+ 可读写文件，即可读、可写、可追加

　　w+ 可写读文件，即可写、可读、可追加

　　a+ 同a

　　混合模式不常用，了解即可。

1.7 b模式

#rb模式直接从硬盘中读取bytes
f = open('a.txt','rb')
print(f.read())
f.close()

#wb模式
f = open('a.txt','wb')
f.write('你好'.encode('utf-8'))
f.close()

1.8 遍历文件

　　在内存中，同时只有一条内容，不依赖索引；文件很多，用循环遍历的方式读取文件。

with open('a.txt','r',encoding='utf-8') as f:
    for line in f.read():
        print(line)

1.9 Copy文件

　　利用r模式，模拟Copy动作；以b的方式打开文件，不会涉及文件编码的问题，b是Bytes的格式；利用r进行处理文件路径，以后经常需要处理文件路径的问题，也就是右斜杠没有特殊意义。

import sys

if len(sys.argv) < 3:
    print('Usage:python3 copy.py source.file target.file')
    sys.exit()

with open(r'%s' %sys.argv[1],'rb') as f_read,
    open(r'%s' %sys.argv[2],'wb') as f_write:
    for line in f_read:
        f_write.write(line)

1.10 文件其他操作

1.10.1 read

　　例如：read(3)

　　1.文件打开方式为文本模式时，代表只读取3个字符。

f = open('a.txt','r',encoding='utf-8')
print(f.read(3))
f.close()

　　2.文件打开方式为b模式时，代表读取3个字节。

f = open('a.txt','rb')
print(f.read(6).decode('utf-8'))
print(f.read(3).decode('utf-8'))
f.close()

1.10.2 seak

　　以字节为单位，进行移动光标，有三种模式，三种模式默认指定的参照物不同；其中1、2模式必须在b模式下进行。

　　0模式：默认以文件开头为光标移动，参照物为文件开头

　　1模式：以当前光标所在的位置为参照物

　　2模式：以文件结尾为参照物，进行文件光标的移动

# seek的0模式 默认为0模式
f = open('a.txt','r')
print(f.read(3))
print(f.tell())
f.seek(3)
print(f.tell())
print(f.read())

# seek的1模式
f = open('a.txt','rb')
print(f.read(3))
print(f.tell())
f.seek(3,1)
print(f.tell())
print(f.read().decode('utf-8'))

# seek的2模式
f=open('a.txt','rb')
f.seek(0,2)
print(f.tell())
print(f.read())

1.10.3 tell

　　tell是告诉光标的位置，tell编译器的具体实现：

def tell(self, *args, **kwargs): # real signature unknown
    """
    Current file position.
    
    Can raise OSError for non seekable files.
    """
    pass

1.10.4 truncate

　　truncate是截断文件，所以文件的打开方式必须可写，但是不能用w、w+等方式打开，因为那样直接清空文件，所以truncate要在r+、a、a+等模式使用；

with open('a.txt','r+',encoding='utf-8') as f:
    f.truncate(2)

1.10.5 类似于tail命令

　　以rb方式打开文件，光标移动到最后:f.seek(0,2)

# tail.py -f access.log
import time
import sys

with open(r'%s' % sys.argv[2], 'rb') as f:
    f.seek(0, 2)
    while True:
        line = f.readline()
        if line:
            print(line.decode('utf-8'),end='')
        else:
            time.sleep(0.5)

1.11 总结

最常用的模式：r、w、a

rb、wb、ab

文件的其他模式，了解即可

2.函数

2.1 不用函数的问题

复杂度增大

组织结构不清晰

可读性差

代码冗余

可扩展性差

　　如何解决问题：

　　利用函数进行解决问题。例如修改下水道的问题：需要准备工具；利用工具与函数进行类比：

　　1.工具就是具备某一种功能的物件，就是程序中的函数的概念

　　2.事先准备工具的过程称为函数的定义

　　3.遇到特定的场景拿来就用称为函数的调用

2.2 函数的分类

　　在python中，函数的分类有两种：

　　1. 内置函数

　　2. 自定义函数

　　　　例如：python内置的函数（len、print、max）

2.3 原则

　　函数的使用原则：

　　1.先定义

　　 2.再调用

2.4 直观感受使用函数

'''
**********************
hello jack
**********************
'''

def print_star():
    print('*'*20)

def print_msg():
    print('hello jack')

print_star()
print_msg()
print_star()

2.5 函数使用

　　函数的定义与变量的定义类似，没有事先定义变量，而直接引用变量，会报错

　　没有事先定义函数，而直接调用，就相当于在引用一个不存在的变量名

'''
函数的使用：
    1 先定义
    2 再调用
'''

#定义阶段
def foo():
    print('from foo')
    bar()
def bar():
    print('from bar')

#调用阶段
foo()

　　函数在定义阶段发生了什么事情？？

　　函数在定义阶段：只检测语法，不执行代码

def func():
     asdf #asdf=’bbbb’
func()

2.6 函数定义

#函数的定义语法
'''
def 函数名(arg1,arg2,arg3):
    "注释"
    函数体
    return 返回值

函数名一般是动词
参数
return:函数内部可以有多个return，但只能执行一次，函数就结束调用，
        并且会把return后的值作为函数执行的结果返回
'''

2.6.1函数定义三种形式

　　无参：应用场景仅仅只是执行一些操作，比如与用户交互，打印

　　有参：需要根据外部传进来的参数，才能执行相应的逻辑，比如统计长度，求最大值

　　空函数：设计代码结构

2.6.2 无参函数

def foo():
    print('from foo')

2.6.3 有参函数

# 求最大值的函数，类似于python内置函数max
def my_max(x,y):
    if x > y:
        return x
    else:
        return y

res=my_max(1,2)
print(res)

2.6.4 空函数

# sql解析，首先设计sql解析框架
def select(sql):
    '''select function'''
    print(sql)
    #sql=['select', '*', 'from', 'mysql.user;']

def insert(sql):
    '''insert function'''
    pass

def update(sql):
    '''update function'''
    pass

def delete(sql):
    '''delete function'''
    pass

#select  * from mysql.user;
def main():
    while True:
        sql=input('>>: ').strip()
        if not sql:continue
        cmd_info=sql.split()
        cmd=cmd_info[0]

        if cmd == 'select':
            select(cmd_info)

main()

2.7 函数return

　　return，是函数结束的标志

　　return的返回值没有类型限制

　　　　1. 没有return：返回None，等同于return None

　　　　2. return 一个值：返回该值

　　　　3. return val1,val2,val3:返回(val1,val2,val3)

　　需要返回值：

　　　　调用函数，经过一系列的操作，最后得到一个确定的结果，则必须要有返回值

　　　　通常有参函数要有返回值，输入参数，经过计算，得到一个最终结果

　不需要返回值：

　　　　调用函数，仅仅只是执行一系列的操作，最后不需要得到结果，无序有返回值

　　　　通常无参函数不需要有返回值

#函数的返回值，返回多个值
def func():
    print('from func')
    return [1,2,3],'a',1,{'a':3}

2.8 函数调用

　　函数的调用，有三种形式：

　　　　1.语句形式

　　　　2.表达式形式

　　　　3.函数调用当做另一个函数的参数

def my_max(x,y):
    if x > y:
        return x
    else:
        return y

my_max(1,2)                 # 语句形式
res=my_max(1,2)*10             # 表达式形式
res2=my_max(my_max(1,2),3)     # 函数调用可以当做另外一个函数的参数

2.9 函数参数

　　函数的参数，分两种

　　 1.形参：在定义函数时，括号内的参数，形参就是变量名

　　 2.实参：在调用函数时，括号内的参数，实参就是变量值

　　在调用阶段实参（变量值）才会绑定形参（变量名），调用结束，解除绑定

#形参：在定义函数时，括号内的参数成为形参
#特点：形参就是变量名
def foo(x,y): #x=1,y=2
    print(x)
    print(y)

#实参：在调用函数时，括号内的参数成为实参
#特点：实参就是变量值
foo(1,2)

#在调用阶段实参（变量值）才会绑定形参（变量名）
#调用结束后，解除绑定

2.10 参数分类

2.10.1 位置参数

　　位置参数：按照从左到右的顺序依次定义的参数

　　　　1.位置形参：必须被传值，并且多一个不行，少一个也不行

　　　　2.位置实参：与形参按照位置一一对应

def foo(x,y):
    print(x)
    print(y)
foo(1,2)

def register(name,age):
    print(name)
    print(age)
register('jack',18)

2.10.2 关键字参数

　　关键字实参：指的是按照name=value的形式，指名道姓地给name传值

　　关键字参数需要注意的问题：

　　　　问题一:语法规定位置实参必须在关键字实参的前面

　　　　问题二:一定不要对同一个形参传多次值

def foo(name,age):
    print(name)
    print(age)
foo(age=18,name='jack')

#关键字实参需要注意的问题是：
def foo(name,age,sex):
    print(name)
    print(age)
    print(sex)

# 正常传值
foo('jack',18,'male')
foo(sex='male',age=18,name='jack')
foo('jack',sex='male',age=18)

#问题一:语法规定位置实参必须在关键字实参的前面
foo('jack',sex='male',age=18)

#问题二:一定不要对同一个形参传多次值
foo('jack',sex='male',age=18,name='jack1')
foo('male',age=18,name='jack1')

2.10.3 默认参数

　　默认参数，即默认形参：在定义阶段，就已经为形参赋值，意味在调用阶段可以不用传值

　　使用默认参数，可以降低函数使用的复杂度。

def foo(x,y=222):
    print(x)
    print(y)

foo('jack')
foo(1,'a')

def register(name,age,sex='male'):
    print(name,age,sex)

register('jack',73)
register('tom',38)
register('mary',28,'female')

　　默认参数需要注意的问题

　　问题一:默认参数必须放在位置参数之后

def foo(y=1, x):
    print(x, y)

　　问题二：默认参数只在定义阶段赋值一次，而且仅一次

x=100
def foo(a,b=x):
     print(a,b)

x=22222
foo('jack')

　　问题三：默认参数的值应该定义成不可变类型

　　　　不可变类型：包括字符串、数字、元组

　　　　可变类型：列表、字典

2.11 可变长参数

　　可变长参数指的是实参的个数不固定(个数多了)

　　实参无非位置实参和关键字实参两种

　　形参必须要两种机制分别处理：

　　　　按照位置定义的实参溢出的情况 *

　　　　按照关键字定义的实参溢出的情况 **

2.11.1 位置参数

　　多出来的位置实参，会交给*处理，保存成元组的形式，*把多出来赋值给args

def foo(x,y,*args): #args=(3,4,5,6,7)
    print(x)
    print(y)
    print(args)

foo(1,2,3,4,5,6,7) #*
foo(1,2) #*

　　*args的扩展用法

　　* 处理的是位置参数

　　* 可以存在于形参位置，*也可以在于实参位置

　　碰到*位于实参位置，打回原形，拆成位置参数

　　例如：foo(1,2,*(3,4,5,6,7)) <====> foo(1,2,3,4,5,6,7)

def foo(x,y,*args): # *args = *(3,4,5,6,7)
    print(x)
    print(y)
    print(args)
foo(1,2,3,4,5,6,7) # *
foo(1,2,*(3,4,5,6,7))  # 等价于foo(1,2,3,4,5,6,7)

def foo(x,y,*args): #
    print(x)
    print(y)
    print(args)
foo('a','b',*(1,2,3,4,5,6,7))     # 等价于foo('a','b',1,2,3,4,5,6,7)
foo('jack',10,2,3,4,5,6,9)

2.11.2 关键字参数

　　多出来的关键字实参，会交给**处理，保存成字典形式，**把多出来的参数交给kwargs

def foo(x,y,**kwargs): #kwargs={'z':3,'b':2,'a':1}
    print(x)
    print(y)
    print(kwargs)
foo(1,2,z=3,a=1,b=2) #**

　　**kwargs的扩展用法

　　** 处理的是关键字参数

　　** 可以存在于形参位置，**也可以在于实参位置

　　碰到**位于实参位置，打回原形，拆成关键字参数

　　例如：foo(1,2,**{'z':3,'b':2,'a':1}) <====> foo(1,2,a=1,z=3,b=2)

def foo(x,y,**kwargs): # kwargs={'z':3,'b':2,'a':1}
    print(x)
    print(y)
    print(kwargs)
foo(1,2,**{'z':3,'b':2,'a':1}) # foo(1,2,a=1,z=3,b=2)

def foo(x, y):
    print(x)
    print(y)
foo(**{'y':1,'x':2})  # foo(y=1,x=2)

2.11.3 混合使用

def foo(x,*args,**kwargs): # args=(2,3,4,5) kwargs={'b':1,'a':2}
    print(x)
    print(args)
    print(kwargs)
foo(1,2,3,4,5,b=1,a=2)

2.11.4 间接调用函数

import time

def register(name,age,sex='male'):
    print(name)
    print(age)
    print(sex)
    time.sleep(3)

def wrapper(*args, **kwargs): #args=('egon',) kwargs={'age':18}
    start_time=time.time()
    register(*args, **kwargs)
    stop_time=time.time()
    print('run time is %s' %(stop_time-start_time))

wrapper('jack',age=26)
register('jack',26)

2.11.5 命名关键字参数

　　命名关键字参数，必须是被以关键字实参的形式传值

　　在*后面定义的形参称为命名关键字参数，必须是被以关键字实参的形式传值；属于了解内容。

def foo(*args,x):
    print(x)
    print(args)

foo(1,2,3,4,x='jack')

def foo(name,age,*,sex,group):
    print(name,age,sex,group)
foo('jack',18,group='group1',sex='male')

def foo(name,age,*,sex='male',group):
    print(name,age,sex,group)
foo('mary',18,group='group1')

2.12 函数对象

　　函数是第一类对象：指的是函数可以被当做数据传递

　　1 被赋值

def foo():
    print('from foo')

f=foo
print(f)
f()

　　2 可以当做参数传入

def wrapper(func):
    # print(func)
    func()
wrapper(foo)

　　3 可以当做函数的返回

def wrapper(func):
    return func
res=wrapper(foo)
print(res)

　　4 可以当做容器类型的元素

cmd_dic={
    'func':foo
}

print(cmd_dic)
cmd_dic['func']()