可视化mark

待尝试研究的可视化组件及产品:

  • 开源组件
  • 商业组件

开源组件


  • zeppelin
  • Caravel
  • D3.js
  • Flare
  • talend(ETL)
  • pentaho
  • spagoBI
  • NanoCubs
  • Dygraphs
  • Saiku
  • airpal
  • Chart.js
  • chartist.js
  • ECharts
  • FnordMetric
  • redash
  • zingchart

zeppelin


  • 主页:
  • apache 开源产品
  • 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前的工具
  • http://www.pointtec.de/zeppelin/

Caravel


  • Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析
  • 快速创建数据可视化互动仪表盘
  • 丰富的可视化图表模板,灵活可扩展
  • 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)
  • 简洁的语义层,可以控制数据资源在 UI 的展现方式
  • 与 Druid 深度集成,可以快速解析大规模数据集
  • https://github.com/airbnb/superset
  • https://segmentfault.com/a/1190000005083953

D3.js


  • 一个强调网页标准的用来创建数据可视化JavaScript库。使用HTML、SVG和CSS,可以让使用者以数据驱动的方式去操作DOM,能够满足现在浏览器的兼容性并且不受专用框架的限制。
  • 示例地址:https://github.com/d3/d3/wiki/Gallery

Flare


  • 处理复杂、交互式图表、支持数据管理、视觉编码、动画和交互作用,各种可视化表格从时间线到多层图表来说明关系
  • 演示地址:http://flare.prefuse.org/demo
  • 关注演示部分:
    1. layout -> intent

talend


  • 网址:https://www.talend.com/download/talend-open-studio/
  • 即提供免费版本,也提供收费版本
  • Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。

  • Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。 两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码

  • 易用性:

    1. Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供
    2. Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
  • 技术支持:
    1. Talend:主要在美国
    2. Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员
  • 部署:
    1. Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
    2. Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署
  • 速度
    1. Talend:需要手工调整,对特定数据源有优化知识
    2. Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计
  • 数据质量:
    1. Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
    2. Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。

pentaho


  • 网址:http://www.pentaho.com/product/big-data-analytics
  • pentaho自称为“全面的数据集成和商业智能平台”,该公司主要大力推销它的商业软件,该软件基于开源社区。
  • Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案
  • 功能和特点
    ◆ 工作流引擎:Shark and JaWE
    ◆ 数据库:Firebird RDBMS
    ◆ 集成管理和开发环境:Eclipse
    ◆ 报表工具:Eclipse BIRT
    ◆ ETL工具:Enhydra/Kettle
    ◆ OLAP Server:Mondrian
    ◆ OLAP展示:JPivot
    ◆ 数据挖掘组件:Weka
    ◆ 应用服务器和Portal服务器:JBoss
    ◆ 单点登陆服务及LDap认证:JOSSO
    ◆ 自定义脚本支持:Mozilla Rhino Javascript脚本处理器

spagoBI


NanoCubs


Dygraphs


Saiku


airpal


  • Airpal 是一个基于 Web 的查询执行工具,利用 Facebook 的 PrestoDB 进行查询和获取结果。提供了查找表、元数据、浏览数据行,编写和执行查询的功能,这些功能全部通过浏览器完成。一旦查询开始执行,用户可跟踪查询进度获取并下载结果。查询的结果可生成新的 Hive 表用于进一步的分析
  • 源码地址:https://github.com/airbnb/airpal
  • 项目特性:
    •可选的用户访问控制
    •SQL语法高亮
    •查询结果导出到CSV文件,或者存到Hive表中
    •可查看SQL查询的历史记录
    •可保存查询
    •根据表名搜索对应的表
    •可查看表结构,并预览前1000行数据

Chart.js


  • chart.js 是一个简单、面向对象、为设计者和开发者准备的图表绘制工具库
  • ChartJS 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库
  • 网址:http://www.bootcss.com/p/chart.js/

chartist.js


ECharts


FnordMetric


  • FnordMetric是一个使用SQL语句来实现数据收集和可视化的框架,它使用chartsql扩展了标准的sql,允许你编写查询语句来返回图表而不是返回表,查询结果作为SVG向量图或者images来呈现出来。这些图表可以很容易嵌入一个web站点中,这样你就可以在短短几分钟内绘制漂亮的图表
  • 网址: http://fnordmetric.io/
  • 参考:http://blog.csdn.net/itas109/article/details/52311390

redash


  • re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
  • 访问地址: https://redash.io/

zingchart


商业组件


  • Ethink
  • Tableau
  • PowerBI
  • FineReport
  • Style Intelligence
  • sisense

EThink


  • 公司地址: http://www.ethinkbi.com/#
  • 演示: http://www.ethinkbi.com/try/
  • 说明:安徽象形信息科技有限公司(ETHINK)是国内大数据产品及方案服务商,专注于大数据,BI,大数据分析,大数据挖掘工具领域,是一家国内大数据分析产品领域的领导企业
  • 关注点:
    1. 地图下钻(缺点:不能按比例缩放) http://120.26.36.169:8088/ethinknew/user?type=item2
    2. K线图:关注下面关联的时间轴

Tableau


    1. 混合数据源
    2. 高效快速
    3. Tableau9.0版本开始支持中国地图
  • 产品分类:
    1. Tableau Desktop:收费,分个人版跟专业版,个人版只能连本地文件,专业版则无限制。Tableau制作端,创建可视化图表的软件
    2. Tableau Server:收费。可以发布做好的可视化图表,在浏览器或者移动设备上即可查看,共享、协作提高数据分析决策效率
    3. Tableau Online:收费,按年收取。基于云的服务,简单来讲就是云计算版server,企业不用自己部署Tableau server服务,通过Tableau自己的云端服务器,处理发布出去的可视化图表,同样能达到server的效果。不过由于服务器不在中国境内,运行效率可能会受到影响
    4. Tableau Public:免费。可在线分享自己的工作表、仪表板以及故事,与更多的人交流交互式数据故事
    5. Tableau Reader:免费。Tableau阅读器可打开并查看Desktop中生成的可视化图表,并且能进行可视化交互、筛选、钻取和查看明细
  • 关注点:
    1. 图表丰富,操作简单
    2. 交叉表

PowerBI


FineReport


Style Intelligence


sisense


原文地址:https://www.cnblogs.com/tgzhu/p/6399713.html