机器学习记录(1)

机器学习是指从有限的观测数据中学习出具有一般性的规律，并利用这些规律对未知数据进行预测的方法。利用机器学习来解决问题的主要步骤如下

数据预处理：比如对数据的去噪。
特征提取：从原始数据中提取有效的特征。
特征转换：对特征进行一定的变换，如降维、升维。
预测：学习一个函数进行预测。

局部表示和分布式表示：局部表示常常表示成One-Hot向量，例如对于颜色A而言，将其表示成\([1,0,0]^T\),随着颜色种类数的增加，One-Hot的维度将会变的特别巨大且不能扩展。另外不同颜色之间的相似度都为0。分布式表示通常表现为压缩、低维、稠密的向量。比如对于颜色A而言，分布式表示成\([0.24,0.56,0.45]^T\)。

深度学习：通过构建具有一定深度的模型，可以让模型自动学习好的特征表示，从而最终提升预测或者识别的准确性。所谓的深度指原始数据经过非线性特征转换的次数。

课后作业：numpy的基本操作。

1、导入numpy

import numpy as np

2、建立一个一维数组 a 初始化为[4,5,6], (1)输出a 的类型（type）(2)输出a的各维度的大小（shape）(3)输出 a的第一个元素（值为4）

import numpy as np
a = np.array([4, 5, 6])
# a 的类型
print(type(a))
print(a.shape)
print(a[0])

3、建立一个二维数组 b,初始化为 [ [4, 5, 6],[1, 2, 3]] (1)输出各维度的大小（shape）(2)输出 b(0,0)，b(0,1),b(1,1) 这三个元素（对应值分别为4,5,2）

import numpy as np
a = np.array([[4, 5, 6],[1, 2, 3]])
print(a.shape)
print(a[0,0],a[0,1],a[1,1])

4、1)建立一个全0矩阵 a, 大小为 3x3; 类型为整型（提示: dtype = int）(2)建立一个全1矩阵b,大小为4x5; (3)建立一个单位矩阵c ,大小为4x4; (4)生成一个随机数矩阵d,大小为 3x2.

import numpy as np
a = np.zeros([3,3], dtype=np.int)
b = np.ones((4, 5))
c = np.eye(4)
# c = np.identity(4)
d = np.random.random([3,2])

5、建立一个数组 a,(值为[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]] ) ,(1)打印a; (2)输出下标为(2,3),(0,0) 这两个数组元素的值

import numpy as np
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a[2,3], a[0, 0])

6、把上一题的 a数组的 0到1行 2到3列，放到b里面去，（此处不需要从新建立a,直接调用即可）(1),输出b;(2) 输出b 的（0,0）这个元素的值

import numpy as np
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a[2,3], a[0, 0])
b = a[0:2, 2 : 4]
print(b)
print(b[0, 0])

7、把第5题中数组a的最后两行所有元素放到 c中，（提示： a[1:2, :]）(1)输出 c ; (2) 输出 c 中第一行的最后一个元素（提示，使用 -1 表示最后一个元素

import numpy as np
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
c = a[1:3,:]
print(c[1,-1])

8、.建立数组a,初始化a为[[1, 2], [3, 4], [5, 6]]，输出（0,0）（1,1）（2,0）这三个元素（提示：使用 print(a[[0, 1, 2], [0, 1, 0]]) ）

import numpy as np
a = np.array([[1, 2], [3, 4], [5, 6]])
print(a[[0, 1, 2],[0, 1, 0]])

9、建立矩阵a ,初始化为[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]，输出(0,0),(1,2),(2,0),(3,1) (提示使用 b = np.array([0, 2, 0, 1]) print(a[np.arange(4), b])

import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
b = np.array([0, 2, 0, 1])
print(a[np.arange(4), b])

10、对9 中输出的那四个元素，每个都加上10，然后重新输出矩阵a.(提示： a[np.arange(4), b] += 10 ）

import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
b = np.array([0, 2, 0, 1])
c = a[np.arange(4), b]
print(c + 10)

array的数学运算

11、执行 x = np.array([1, 2])，然后输出 x 的数据类型

import numpy as np
x = np.array([1, 2])
print(x.dtype)

12、执行 x = np.array([1.0, 2.0]) ，然后输出 x 的数据类类型

import numpy as np
x = np.array([1.0, 2.0])
print(x.dtype)

13、执行 x = np.array([[1, 2], [3, 4]], dtype=np.float64) ，y = np.array([[5, 6], [7, 8]], dtype=np.float64)，然后输出 x+y ,和 np.add(x,y)

import numpy as np
x = np.array([[1, 2], [3, 4]],dtype=np.float64)

y = np.array([[1, 2], [3, 4]],dtype= np.float64)

print(x + y)
print(np.add(x,y))

14、利用 13题目中的x,y 输出 x-y 和 np.subtract(x,y)

import numpy as np
x = np.array([[1, 2], [3, 4]],dtype=np.float64)

y = np.array([[1, 2], [3, 4]],dtype= np.float64)
print(np.subtract(x,y))

15、利用13题目中的x，y 输出 x*y ,和 np.multiply(x, y) 还有 np.dot(x,y),比较差异。然后自己换一个不是方阵的试试。

import numpy as np
x = np.array([[1, 2], [3, 4]],dtype=np.float64)

y = np.array([[1, 2], [3, 4]],dtype= np.float64)
# 直接相乘是对应元素相乘
print(np.multiply(x, y))
# dot()是矩阵相乘运算
print(np.dot(x, y))

16、利用13题目中的x,y,输出 x / y .(提示：使用函数 np.divide())

import numpy as np
x = np.array([1, 2],dtype=np.float64)

y = np.array([[1, 2], [3, 4]],dtype= np.float64)
print(x / y)
print(np.divide(x, y))

17、利用13题目中的x,输出 x的开方。(提示：使用函数 np.sqrt() )

import numpy as np
x = np.array([[1, 2],[3,4]],dtype=np.float64)

print(np.sqrt(x))

18、.利用13题目中的x,y ,执行 print(x.dot(y)) 和 print(np.dot(x,y))

import numpy as np
x = np.array([[1, 2],[3,4]],dtype=np.float64)
y = np.array([[1, 2], [3, 4]],dtype= np.float64)

print(x.dot(y))

19、利用13题目中的 x,进行求和。提示：输出三种求和 (1)print(np.sum(x)): (2)print(np.sum(x，axis =0 )); (3)print(np.sum(x,axis = 1))¶

import numpy as np
x = np.array([[1, 2],[3,4]],dtype=np.float64)

print(np.sum(x))
# 行和
print(np.sum(x,axis=0))
# 列和
print(np.sum(x,axis=1 ))

20、利用13题目中的 x,进行求平均数（提示：输出三种平均数(1)print(np.mean(x)) (2)print(np.mean(x,axis = 0))(3) print(np.mean(x,axis =1))）

import numpy as np
x = np.array([[1, 2],[3,4]],dtype=np.float64)

print(np.mean(x))
# 行平均数
print(np.mean(x,axis=0))
# 列平均数
print(np.mean(x,axis=1 ))

21、利用13题目中的x，对x 进行矩阵转置，然后输出转置后的结果，（提示： x.T 表示对 x 的转置）

import numpy as np
x = np.array([[1, 2],[3,4]],dtype=np.float64)
print(x.T)

参考：https://github.com/nndl/nndl.github.io