NumPy常用函数总结

NumPy库总包含两种基本的数据类型：矩阵和数组，矩阵的使用类似Matlab，本实例用得多的是数组array。

shape()
shape是numpy函数库中的方法，用于查看矩阵或者数组的维素
>>>shape(array) 若矩阵有m行n列，则返回(m,n)
>>>array.shape[0] 返回矩阵的行数m，参数为1的话返回列数n

tile()
tile是numpy函数库中的方法，用法如下:
>>>tile(A,(m,n)) 将数组A作为元素构造出m行n列的数组

sum()
sum()是numpy函数库中的方法
>>>array.sum(axis=1)按行累加，axis=0为按列累加

argsort()
argsort()是numpy中的方法，得到矩阵中每个元素的排序序号
>>>A=array.argsort() A[0]表示排序后排在第一个的那个数在原来数组中的下标

dict.get(key,x)
Python中字典的方法，get(key,x)从字典中获取key对应的value，字典中没有key的话返回0

sorted()
python中的方法

min()、max()
numpy中有min()、max()方法，用法如下
>>>array.min(0) 返回一个数组，数组中每个数都是它所在列的所有数的最小值
>>>array.min(1) 返回一个数组，数组中每个数都是它所在行的所有数的最小值

listdir('str')
python的operator中的方法
>>>strlist=listdir('str') 读取目录str下的所有文件名，返回一个字符串列表

split()
python中的方法，切片函数
>>>string.split('str')以字符str为分隔符切片，返回list

numpy中读取.csbv文件　

>>>（1）第一种方法使用loadtxt　

　　# load the CSV file as a numpy matrix
　　dataset = np.loadtxt('./../DataAir/testdata.csv',delimiter=',')
　　# separate the data from the target attributes
　　X_test = dataset[:,0:6]
　　y_test = dataset[:,6]

>>>（2）第二种方法使用csv.read

　　csvfile = open('./../testData/testdata.csv')
　　reader1 = csv.reader(csvfile)
　　mTest = 0
　　vectorUnderTest = zeros((1,6)) #1*6
　　for lineT in reader1: #每一行对应一个测试数据
　　　　classNumStr = int(lineT[6])
　　　　for k in range(6):
　　　　　　lineT[k] = float(lineT[k]) #将.csv文件读取出来的字符列表转为float类型
　　　　　　vectorUnderTest[:,k] = lineT[k] #将样本加入大数据集矩阵中

>>>（3）第三种方法使用readline,readlines,read

　  fh = open('c:\autoexec.bat')
    for  line in  fh.readlines(): 
    print  line
 .readline() 和 .readlines() 之间的差异是后者一次读取整个文件，象 .read() 一样。
 .readlines() 自动将文件内容分析成一个行的列表，该列表可以由 Python 的 for ... in ... 结构进行处理。
 另一方面，.readline() 每次只读取一行，通常比 .readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时，才应该使用 .readline()。