不多说,直接上干货!
Spark Mllib基本数据类型,根据不同的作用和应用场景,分为四种不同的类型
1、Local vector : 本地向量集,主要向spark提供一组可进行操作的数据集合
2、Labeled point: 向量标签,让用户能够分类不同的数据集合
3、Local matrix:本地矩阵,将数据集合以矩阵形式存储在本地计算机中。
4、Distributed matrix : 分布式矩阵,将数据集合以矩阵形式存储在分布式计算机中
具体,见
不多说,直接上干货!
Spark Mllib基本数据类型,根据不同的作用和应用场景,分为四种不同的类型
1、Local vector : 本地向量集,主要向spark提供一组可进行操作的数据集合
2、Labeled point: 向量标签,让用户能够分类不同的数据集合
3、Local matrix:本地矩阵,将数据集合以矩阵形式存储在本地计算机中。
4、Distributed matrix : 分布式矩阵,将数据集合以矩阵形式存储在分布式计算机中
具体,见