python 基础知识

《A Byte of Python》中文版《简明 python 教程》，非常简洁，有助于具有一定编程基础的人，快速了解和掌握python。

这里的示例代码以python2为标准。

“

对于很多编程语言来说，程序都必须要有一个入口，比如 C，C++，以及完全面向对象的编程语言 Java，C# 等。如果你接触过这些语言，对于程序入口这个概念应该很好理解，

C 和 C++ 都需要有一个 main 函数来作为程序的入口，也就是程序的运行会从 main 函数开始。同样，Java 和 C# 必须要有一个包含 Main 方法的主类来作为程序入口。

而 Python 则有不同，它属于脚本语言，不像编译型语言那样先将程序编译成二进制再运行，而是动态的逐行解释运行。也就是从脚本第一行开始运行，没有统一的入口。

”

“

if __name__ == '__main__' 就相当于是 Python 模拟的程序入口。Python 本身并没有规定这么写，这只是一种编码习惯。

由于模块之间相互引用，不同模块可能都有这样的定义，而入口程序只能有一个。到底哪个入口程序被选中，这取决于 __name__ 的值。

”

“

__name__ 是内置变量，用于表示当前模块的名字，同时还能反映一个包的结构。如果一个模块被直接运行，则其没有包结构，其 __name__ 值为 __main__。

所以，if __name__ == '__main__' 我们简单的理解就是： 如果模块是被直接运行的，则代码块被运行，如果模块是被导入的，则代码块不被运行。

”

1.Python是一种解释型语言.Python解释器是通过“一次执行一条语句”的方式运行程序的。Python科学计算程序员则更趋向于使用IPython（一种加强的交互式Python解释器）。

通过使用命令%run，IPython会在同一个进程中执行指定文件中的代码。（.py文件和IPython解释器在同一目录下，或者运行时加上文件路径）

%run hello_world.py   #out: Hello world  
%run E:/hello_world.py   #out: Hello world

2.元组是一种一维的，定长的，不可变的Python对象序列。最简单的创建方式是一组以逗号隔开的值。通过调用tuple，任何序列或迭代器都可以被转换成元组。

tup = 4,5,6     
print tup      #(4,5,6)  
print tuple([4,0,2])  #(4,0,2)  
print tuple('string') #('s','t','r','i','n','g')

3.元组拆包可以非常轻松的交换变量名。拆包功能还可以用于元组或列表组成的序列进行迭代。元组中比较有用的方法是count（对列表也是如此），它用于用于计算指定指定值的出现次数。

a = 5  
b = 2  
b,a = a,b  
print a,b  # 2 5  
  
seq = [(1,2,3),(4,5,6)]  
for a,b,c in seq:  
    print a,b,c  
# 1 2 3  
# 4 5 6  
  
a = (1,2,2,2,3,4,3,2)  
print a.count(2)   #4

4.跟元组相比，列表（list）是变长的，而且其内容也是可以修改的。它通过方括号（[ ]）或list函数进行定义。通过append方法，可以将元素添加到列表的末尾。

a_list = [2,3,4,None]  
print a_list  #[2, 3, 4, None]  
tup = ('foo','bar','baz')  
b_list = list(tup)  
print b_list  #['foo', 'bar', 'baz']  
  
b_list.append('dwarf')  
print b_list  #['foo', 'bar', 'baz', 'dwarf']

5.合并列表，和元组一样，用加号（+）将两个列表加起来即可实现合并。对于一个已定义的列表，可以用extend方法一次性添加多个元素。

print [4,None,'foo'] + [7,8,(2,3)]  #[4, None, 'foo', 7, 8, (2, 3)]  
x = [4,None,'foo']  
x.extend([7,8,(2,3)])  
print x  #[4, None, 'foo', 7, 8, (2, 3)]

注意：列表的合并是一种相当费资源的操作，因为必须创建一个新列表并将所有对象复制过去。而用extend将元素附加到现有列表（尤其是在构建一个大列表时）就会好很多。　

#extend() 方法合并速度快的多

everything = []  
for chunk in list_of_lists:   #合并速度快的多  
    everything.extend(chunk)  
  
for chunk in list_of_lists:  
    everything = everything + chunk

6.对于一个序列进行迭代时，常常需要跟踪当前项的索引，Python内置了一个enumerate函数，它可以返回序列的值和索引。

i = 0  
for value in ['aa','bb','cc']:  
    i += 1  
    print str(i) + ":" + value  
  
for i,value in enumerate(['aa','bb','cc']):   # 0:aa  
    print str(i) + ":" + value                # 1:bb  
                                              # 2:cc  
some_list = ['foo','bar','baz']  
mapping = dict((v,i) for i,v in enumerate(some_list))  
print mapping  #{'baz': 2, 'foo': 0, 'bar': 1}

7.zip用于将多个序列（列表，元组）中的元素“配对”，从而产生一个新的元组列表。zip最常见的用法是同时迭代多个序列，还可以结合enumerate一起使用。

seq1 = ['foo','bar','baz']  
seq2 = ['one','two','three']  
print zip(seq1,seq2) #[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]  
  
for i,(a,b) in enumerate(zip(seq1,seq2)):  #0:foo,one  
    print('%d:%s,%s'%(i,a,b))              #1:bar,two  
                                           #2:baz,three

8.调用列表的sort方法可以实现就地的排序。sorted函数可以将任何序列返回为一个新的有序列表。reversed用于按逆序迭代序列中的元素。

a = [7,2,5,1,3]  
a.sort()  
print a #[1, 2, 3, 5, 7]  
  
print sorted([7,1,2,6,0,3,2])   #[0, 1, 2, 2, 3, 6, 7]  
print list(reversed(range(10))) #[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

9.导入工具库，dir(math)查看模块中的方法和属性。

from some_module import f   #f直接用  
import some_module as sm    # sm.f  
import some_module          # some_module.f

10.Python用if elif else，True False首字母要大写。

11.格式化字符串和新的方法格式化字符串。

hw2015 = "%s %s %d"%('Hello','world',2015)  
print hw2015   #Hello world 2015  
  
print "{} is a {}".format("THis","string") #THis is a string  
print "{0} can be {1}".format("strings","formatted") #strings can be formatted

12.range，arange，xrange比较

range用作循环，range(10)返回一个list

xrange也用作循环，只是xrange（10）不返回list，返回xrange对象。

arange是numpy中的函数，生成array类型对象

import numpy as np  
print range(5)      #[0, 1, 2, 3, 4]  
print range(1,9,2)  #[1, 3, 5, 7]  
  
print np.arange(5)  #[0 1 2 3 4]  
  
print xrange(5)       #xrange(5)  
print list(xrange(5)) #[0, 1, 2, 3, 4]  
  
for i in xrange(5):  
    print i

13.字典：字典(dict)可算是Python中最重要的内置数据结构，他更常见的名字是哈希映射（hash map）或关联数组。

它是一种大小可变的键值对集，其中的键(key)和值（value）都是Python对象。用{ }或dict函数创建字典。

d1 = {'a':'some value','b':[1,2,3,4]}  
print d1 #{'a': 'some value', 'b': [1, 2, 3, 4]}  
d1[7] = 'an integer'  # 添加元素  
print d1 #{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}  
print d1['b']  #[1, 2, 3, 4] 访问元素  
  
del d1[7]  #删除元素  
print d1   #{'a': 'some value', 'b': [1, 2, 3, 4]}

keys()和values()方法分别用于获取键和值的列表。虽然键值对没有特定的顺序，但这两个函数会以相同的顺序输出键和值：

d1 = {'a':'some value','b':[1,2,3,4]}  
print d1.keys() #['a', 'b']  
print d1.values()  #['some value', [1, 2, 3, 4]]

利用update方法。一个字典可以被合并到另一个字典中：

d1 = {'a':'some value','b':[1,2,3,4]}  
d1.update({'c':12})  
print d1 #{'a': 'some value', 'c': 12, 'b': [1, 2, 3, 4]}

从序列类型创建字典：

key_list = ['a','b']  
value_list = [1,2]  
mapping = {}  
for key,value in zip (key_list,value_list):  
    mapping[key] = value  
print mapping  #{'a': 1, 'b': 2}

14.defaultdict：创建字典时，有时会出现字典的key不存在的异常，为此需使用if else判断一下：

words = ['apple','bat','bar','atom','book']  
by_letter = {}  
for word in words:  
    letter = word[0]  
    if letter not in by_letter:  
        by_letter[letter] = [word]  
    else:  
        by_letter[letter].append(word)  
print by_letter  #{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

内置的collections模块有一个叫做defaultdict的类，它可以使该过程更简单。传入一个类型或函数（用于生成字典各插槽所使用的默认值）即可创建一个defaultdict：

words = ['apple','bat','bar','atom','book']  
from collections import defaultdict  
by_letter = defaultdict(list)  
for word in words:  
    by_letter[word[0]].append(word)  
print by_letter   
#defaultdict(<type 'list'>, {'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']})

15.列表集合以及字典的集合表达式

基本形式如下

列表：list_comp = [expr for val in collection if condition]

集合：set_comp = {expr for value in collection if condition}

字典：dict_map = {key-expr:value-expr for value in collection if condition}

strings = ['a','as','bat','car','dove','python']  
list_comp = [x.upper() for x in strings if len(x)>2]  
print list_comp #['BAT', 'CAR', 'DOVE', 'PYTHON']  
set_comp = {len(x) for x in strings}  
print set_comp  #set([1, 2, 3, 4, 6])  
map_comp = {val:index for index,val in enumerate(strings)}  
print map_comp  #{'a': 0, 'bat': 2, 'python': 5, 'car': 3, 'as': 1, 'dove': 4}

16.Python中相关的库

Numpy ---- 数组支持

Scipy ----- 矩阵支持

Matplotlib ---可视化

Pillow ---- 图片处理

OpenCV ----- 视频处理

scikit-learn ----- 机器学习

theano ---- 深度学习（先安装c++编译器MinGW）

keras ---- 深度学习，基于theano

xgboost ---- 各类数据挖掘竞赛中常用的包

Pandas是一个python库，通过数据标记和数据之间的关系来进行工作，其特点是简单直观。它非常适合用于数据分析，可以快速简单的对数据进行操作，整合以及可视化。

参考： https://blog.csdn.net/qq_34264472/article/details/53158169 （感谢博主！）