Python基础知识

Python解释器分类：
1、CPython：这个解释器是用C语言开发的，所以叫CPython。在命令行下运行python就是启动CPython解释器
2、IPython：IPython是基于CPython之上的一个交互式解释器，也就是说，IPython只是在交互方式上有所增强，
但是执行Python代码的功能和CPython是完全一样的。好比很多国产浏览器虽然外观不同，但内核其实都是调用了IE。
CPython用>>>作为提示符，而IPython用In [序号]:作为提示符。
3、PyPy：PyPy是另一个Python解释器，它的目标是执行速度。PyPy采用JIT技术，对Python代码进行动态编译
（注意不是解释），所以可以显著提高Python代码的执行速度。
绝大部分Python代码都可以在PyPy下运行，但是PyPy和CPython有一些是不同的，这就导致相同的Python代码
在两种解释器下执行可能会有不同的结果。如果你的代码要放到PyPy下执行，就需要了解PyPy和CPython的不同点。
4、Jython：Jython是运行在Java平台上的Python解释器，可以直接把Python代码编译成Java字节码执行。
5、IronPython：IronPython和Jython类似，只不过IronPython是运行在微软.Net平台上的Python解释器，
可以直接把Python代码编译成.Net的字节码。
小结：Python的解释器很多，但使用最广泛的还是CPython。如果要和Java或.Net平台交互，最好的办法不是
用Jython或IronPython，而是通过网络调用来交互，确保各程序之间的独立性。

Python文本编辑器：
在Python的交互式命令行写程序，好处是一下就能得到结果，坏处是没法保存，下次还想运行的时候，还得再敲一遍。
所以，实际开发的时候，我们总是使用一个文本编辑器来写代码，写完了，保存为一个文件，这样，程序就可以反复运行了。
推荐使用Notepad++，免费使用，有中文界面；
请注意，用哪个都行，但是绝对不能用Word和Windows自带的记事本。Word保存的不是纯文本文件，而记事本会
自作聪明地在文件开始的地方加上几个特殊字符（UTF-8 BOM），结果会导致程序运行出现莫名其妙的错误。
在Windows上不能直接运行py文件，在Mac和Linux上是可以的，方法是在.py文件的第一行加上一个特殊的注释：
#！/usr/bin/env python3,然后，通过chomd命令给py文件以执行权限，就可以直接运行py文件了。
小结：用文本编辑器写Python程序可以保存为后缀为.py的文件，就可以用Python直接运行这个程序了。

print输出：
用print()在括号中加上字符串，就可以向屏幕上输出指定的文字。
print()函数可以接受多个字符串，用逗号“,”隔开，打印字符串时，遇到逗号会输出一个空格，起到拼接的作用
input输入：
input()可以让用户输入字符串，并存放到一个变量里，可以起到交互的作用
input()在括号中可以写一个字符串来提示用户输入
小结：任何计算机程序都是为了执行一个特定的任务，有了输入，用户才能告诉计算机程序所需的信息，
有了输出，程序运行后才能告诉用户任务的结果。
输入是Input，输出是Output，因此，我们把输入输出统称为Input/Output，或者简写为IO。
input()和print()是在命令行下面最基本的输入和输出，但是，用户也可以通过其他更高级的图形界面完成输入和输出，
比如，在网页上的一个文本框输入自己的名字，点击“确定”后在网页上看到输出信息

Python数据类型：
1、整数
2、浮点数（小数）
3、字符串（用单引号或双引号或三引号括起来的任意文本）
转义字符：表示换行、表示制表符等（r''表示''内部的字符串默认不转义）
4、布尔值（True、False）
5、列表
6、元祖
7、字典
8、集合
变量：
变量名必须是大小写英文、数字和下划线的组合，且不能用数字开头
小结：Python支持多种数据类型，在计算机内部，可以把任何数据都看成一个“对象”，
而变量就是在程序中用来指向这些数据对象的，对变量赋值就是把数据和变量给关联起来。

字符编码
ASCII编码是1个字节（支持中文）
Unicode编码字母中文都是2个字节
UTF-8编码字母是1个字节，中文是3个字节

ord()函数把字符转换成字符编码
chr()函数把字符编码转换成字符

bytes类型的数据用带b前缀的单引号或双引号表示，如x=b'ABC'
encode()函数可以把str转换为bytes，如'ABC'.encode('utf-8')运行结果b'ABC'，超过编码范围会报错
decode()函数可以把bytes转换为str，如b'ABC'.decode('utf-8')运行结果'ABC'
如果bytes中包含无法解码的字节，decode()方法会报错
如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节，
如b'ABC'.decode('utf-8'，errors='ignore')运行结果'ABC'

Python文件为防止乱码，通常在文件开头写上这两行：
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；
第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。

字符串操作：
str.capitalize():将字符串的第一个字母大写
str.count():获得字符串中某一子字符串的数目
str.find():获得字符串中某一子字符串的起始位置，无则返回-1
str.isalnum():检测字符串是否仅包含0-9A-Za-z
str.isalpha():检测字符串是否仅包含A-Za-z
str.isdigit():检测字符串是否仅包含数字
str.islower():检测字符串是否均为小写字母
str.isspace():检测字符串中所有字符是否均为空白字符
str.istitle():检测字符串中的首字母是否为大写
str.isupper():检测字符串是否均为大写字母
str.join():连接字符串
str.lower():将字符串全部转换为小写
str.split():分割字符串
str.swapcase():将字符串中大写字母转换为小写或小写字母转换为大写
str.title():将字符串的首个字母转换为大写
len(str):获取字符串长度
字符串的格式化：
>>> 'Hello, %s' % 'world'
'Hello, world'
>>> 'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'
%运算符就是用来格式化字符串的。在字符串内部，%s表示用字符串替换，%d表示用整数替换，%f表示用浮点数替换，
%x表示用十六进制整数替换，有几个%?占位符，后面就跟几个变量或者值，顺序要对应好。如果只有一个%?，括号可以省略。
字符串里的%是一个普通字符，可以用%%表示一个%
另一种格式化字符串的方法是使用字符串的format()方法，它会用传入的参数依次替换字符串内的占位符{}
如>>> 'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125)
'Hello, 小明, 成绩提升了 17.1%
小结：当str和bytes互相转换时，需要指定编码，最常用的编码是UTF-8。

列表(list)：
list是一种有序的集合，可以随时添加和删除其中的元素。用len()函数可以获得list元素的个数
可以用索引来访问list中的每一个元素，list的索引是从0开始的，当索引超出范围时，Python会报一个IndexError错误
list的最后一个元素的索引可以用len(classmates) - 1表示，还可以用-1做索引，直接获取最后一个元素
list的操作：
list.append(x)：列表尾部追加成员x
list.count(x):返回列表中的参数x出现的次数
list.extend(L):向列表中追加另一个列表L
list.index(x):返回参数x在列表中的序号
list.insert(index,object)：向列表中指定位置(index)插入数据(object)
list.pop():删除列表中尾部的成员并返回删除的成员，pop(i)可以删除指定位置的元素，i是索引位置
list.remove(x):删除列表中的指定成员（有多个则只删除第一个）指定成员不存在则报错
list.reverse():将列表中成员的顺序颠倒
list.sort()：将列表中成员排序（要求其成员可排序，否则报错）
>>> alst = [1,2,3,4,5] #建立一个列表
>>> alst.append(1) #列表尾部追加元素1，alst = [1,2,3,4,5,1]
>>> alst.count(1) #统计1在列表中出现的次数，1出现2次
>>>alst.exend([2,'insert']) #列表后追加另一个列表所有元素，alst = [1,2,3,4,5,1,2,'insert']
>>> alst.index(2) #元素2在列表中首次出现的序号，2出现的序号为1
>>> alst.insert(3,0) #在序号3处插入元素0，alst = [1,2,3,0,4,5,1,2,'insert']
>>> alst.pop() #删除并返回列表最后一个元素，删除并返回'insert'，alst = [1,2,3,0,4,5,1,2]
>>> alst.remove(1) #删除列表中的元素（仅删除第一个），alst = [2,3,0,4,5,1,2]
>>> alst.sort() #对列表元素进行排序，alst = [0,1,2,2,3,4,5]

元祖(tuple):
tuple是一种有序的集合，tuple一旦初始化就不能修改。用len()函数可以获得tuple元素的个数
因为tuple不可变，所以代码更安全，能用tuple代替list就尽量用tuple
元祖只有一个元素时必须加一个逗号来消除歧义：
>>> t = (1)
>>> t
1
>>> t = (1,)
>>> t
(1,)
“可变的”tuple：
>>> t = ('a', 'b', ['A', 'B'])
>>> t[2][0] = 'X'
>>> t[2][1] = 'Y'
>>> t
('a', 'b', ['X', 'Y'])
表面上看，tuple的元素确实变了，但其实变的不是tuple的元素，而是list的元素。tuple一开始指向的list并
没有改成别的list，所以，tuple所谓的“不变”是说，tuple的每个元素，指向永远不变。即指向'a'，就不能
改成指向'b'，指向一个list，就不能改成指向其他对象，但指向的这个list本身是可变的！
小结：list和tuple是Python内置的有序集合，一个可变，一个不可变。

字典(dict)：
dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度
为什么dict查找速度这么快？
因为dict的实现原理和查字典是一样的。假设字典包含了1万个汉字，我们要查某一个字，一个办法是把字典从第一页往后翻，
直到找到我们想要的字为止，这种方法就是在list中查找元素的方法，list越大，查找越慢。
第二种方法是先在字典的索引表里（比如部首表）查这个字对应的页码，然后直接翻到该页，找到这个字。无论找哪个字，
这种查找速度都非常快，不会随着字典大小的增加而变慢。
key不存在，dict就会报错，避免key不存在的错误的两种方法：
一是通过in判断key是否存在
二是通过dict提供的get()方法，如果key不存在，可以返回None，或者自己指定的value
删除key的方法：pop(key)
dict的key必须是不可变对象
dict内部存放的顺序和key放入的顺序是没有关系的
和list比较，dict有以下几个特点：
查找和插入的速度极快，不会随着key的增加而变慢；
需要占用大量的内存，内存浪费多。
而list相反：
查找和插入的时间随着元素的增加而增加；
占用空间小，浪费内存很少
字典操作：
dic.clear():清空字典
dic.copy():复制字典
dic.get(k,[default]):获得键k对应的值，不存在则返回default
dic.items():获得由键盒值组成的迭代器
dic.keys():获得键的迭代器
dic.pop(k):删除k：v成员对
dic.values():获得值的迭代器
dic.fromkeys(iter,value):以列表或元祖中给定的键建立字典，默认值为value
dic.popitem():从字典中删除任意k:v项并返回它
dic.setdefault(k,default):若字典中存在key值为k的，则返回其对应的值；否则，在字典中建立一个k:default字典成员

集合(set)：
set是一组无序的、不可重复的集合
重复元素在set中自动被过滤
>>> s = set([1, 1, 2, 2, 3, 3])
>>> s
{1, 2, 3}
通过add(key)方法可以添加元素到set中，可以重复添加，但不会有效果
>>> s.add(4)
>>> s
{1, 2, 3, 4}
>>> s.add(4)
>>> s
{1, 2, 3, 4}
通过remove(key)方法可以删除元素
>>> s.remove(4)
>>> s
{1, 2, 3}
set可以做数学意义上的交集、并集等操作
>>> s1 = set([1, 2, 3])
>>> s2 = set([2, 3, 4])
>>> s1 & s2
{2, 3}
>>> s1 | s2
{1, 2, 3, 4}

序列：
序列表示索引为非负整数的有序对象的集合，包括前面所介绍的字符串、列表和元祖。
字符串是字符的序列，列表和元祖则是任意Python数据类型或对象的序列。
元祖是不可变的，字符串也是不可以变的（修改字符串就是重新创建一个字符串）。
序列的切片方法：
abc =[0,1,2,3,4,5,6,7]
abc[:] #取全部成员数据项，abc =[0,1,2,3,4,5,6,7]
abc[0:] #取全部成员数据项，abc =[0,1,2,3,4,5,6,7]
abc[:-1] #取除最后一个成员之外的所有成员数据项，abc =[0,1,2,3,4,5,6,]
abc[2:5] #取到[2,3,4]
abc[::2] #每隔一个取一个成员，取到[0,2,4,6]
abc[0:5:2] #从0至4每隔一个取一个成员，取到[0,2,4]
abc[::-1] #从右至左取全部成员，abc =[7,6,5,4,3,2,1,0]
abc[5:0:-2] #从5至0(不包括0)从右至左每隔一个取一个成员，取到[5,3,1]
序列的内置操作：
len(s):返回s的元素数（长度）
min(s):返回s中的最小值
max(s):返回s中的最大值
sum(s):返回s中各项的和
all(s):s中所有项为真，则返回真，否则返回假
any(s):s中有一项为真，则返回真，否则返回假

条件判断：
if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>
条件判断从上向下匹配，当满足条件时执行对应的块内语句，后续的elif和else都不再执行

循环：
Python的循环有两种
一种是for...in循环，依次把可迭代对象中的每个元素迭代出来
for循环的内置函数：
enumerate(seq):编号迭代
sorted(seq):排序迭代
reversed(seq):翻转迭代
zip(seq1,seq2,...):并行迭代
>>>for i,item in enumerate('abc'):
>>>print('第%d个字符是:%s'%(i,item))
弟0个字符是：a
弟1个字符是：b
弟2个字符是：c
>>>for i in sorted([3,1,6]):
>>>print(i)
1
3
6
>>>a = (1,2)
>>>c = (3,4)
>>>a = (5,6,7)
>>>for i,j,k in zip(a,b,c):
>>>print('%d:%d:%d'%(i,j,k))
1:3:5
2:4:6
并行迭代函数中序列值的长度不一致时，只遍历到最短的序列的长度
第二种循环是while循环，只要条件满足，就不断循环，条件不满足时退出循环
在循环中，break语句可以提前退出整个循环，continue语句可以跳过当前的这次循环，直接开始下一次循环，
这两个语句通常都必须配合if语句使用。
要特别注意，不要滥用break和continue语句。break和continue会造成代码执行逻辑分叉过多，容易出错。大多数循环
并不需要用到break和continue语句，上面的两个例子，都可以通过改写循环条件或者修改循环逻辑，去掉break和continue语句。
有些时候，如果代码写得有问题，会让程序陷入“死循环”，也就是永远循环下去。这时可以用Ctrl+C退出程序，或者强制结束Python进程。