Spark Mllib里的Mllib基本数据类型(图文详解)

  不多说,直接上干货!

Spark Mllib基本数据类型,根据不同的作用和应用场景,分为四种不同的类型

    1、Local  vector : 本地向量集,主要向spark提供一组可进行操作的数据集合

    2、Labeled point: 向量标签,让用户能够分类不同的数据集合

    3、Local matrix:本地矩阵,将数据集合以矩阵形式存储在本地计算机中。

    4、Distributed  matrix : 分布式矩阵,将数据集合以矩阵形式存储在分布式计算机中

  具体,见

Spark Mllib机器学习实战的第4章 Mllib基本数据类型和Mllib数理统计

原文地址:https://www.cnblogs.com/zlslch/p/7469338.html