[DB] 数据量

某光伏电站项目

  • 7488个组件,容量2396kWp,单片功率320Wp,每24个一串,每13个串接入一台逆变器,共24台100kW组串式逆变器
  • 10个方阵各3台逆变器1个月的5min间隔有功功率运行数据,数据量 8.5M

 贝壳找房

  • 产品技术团队:1000人
  • 日志流式数据:线上服务2000个
  • 埋点数据:APP、web端上报经纪人、用户行为,通过前端埋点上报
  • 业务数据:kafka消息队列产生实时业务数据
  • YARN平台:700个节点,1000多个实时任务,每天消息量千亿级,单峰单个任务百万条/s

58同城

  • Hadoop离线计算平台:4000+服务器,数百PB存储,日40万计算任务
  • HDFS日240T数据接入,共计150PB数据存储
  • MR/Spark每日计算任务40万+,中间处理数据量14P
  • 冷数据用GZIP压缩,热数据用LZO压缩
  • 离线Hbase集群,80台RS,100+表

 滴滴

  • 流计算业务50多个,集群1000+,计算任务3000+,每天处理数据万亿条
原文地址:https://www.cnblogs.com/cxc1357/p/13672208.html