《淘宝技术这十年》阅读，总结其中谈到的技术（一）

1.淘宝双11活动，大量并发，提到 hadoop分布式计算集群，分布于全国各地的CDN网络（13年80多个节点），支持流量>800Gbps

2.大量的日志 TB级，通过高程度压缩（1:120）,进行传送，给后台进行用户分析，（日志包括用户订单交易的快照等）

3.淘宝产生，开始是LAMP（linux+Apache+MySQL+PHP），随着PV的上升，采用IOE，IBM小型机+Oracle数据库+EMC储存，伴随用户体量的日益增长和业务的不断发展，技术亦需要进行发展，随之php--java的迁移，分布式平台的诞生。

4.大量短链接，处于连接池工具（SQL Relay）的使用，数据体量变大后，购买NAS（Network Attached Storage）；

5.支付宝的诞生，交易过程的安全性，担保交易出现，一开始叫”安全交易“，随着使用安全交易后，订单增加，卖家选择这项服务就增多，后续则成为必选，支付宝的前身

6.邀请sun公司，更换开发语言，MVC框架+EJB（控制层）+ibatis（持久层），后续编程MVC+spring+ibatis

7.商品详情分表，详情页信息太多，对常用数据进行分类分表，后续商品详情直接修改为文件，存放在TFS文件系统，提到了Block存储、raid5（便宜的冗余存储）、ext3文件系统存放数据文件、data Server 运载在一台普通linux，TFS集群规模一直在提升，随机IOPS900+，实时缩略图的生成；文件定位，内存用hash算法索引，一次读盘；写盘，Append方式

8.快照功能的灵活使用，对商品的交易生成快照，不过存储成本上升；

9.Nginx，http服务器，特点：代码清晰、模块化、性能高；

10.失败的产品，”我的淘宝“，界面UI体验差，最终被取消，用到AJAX、prototpye；

11.”招财进宝“，类似百度的竞价排名，购买广告位，可以查看出了多少钱，信用、成交量、被收藏数量，很好的电商服务平台盈利模式，被收费抵制失败后，最后以淘宝直通车的形式复活；随着淘宝体量上升和话语权的上升，终于在后面强力推出天猫从淘宝分离的行动，空前强硬且成功，为整个电商行业进步加速，现在亚马逊基本还是以前淘宝的无分级模式（假货横行），从而奠定了我国电商领先世界的基石；用户行为跟踪和AJAX被提到；

12.TBstore缓存诞生，TBstore分布式算法，根据key进行Hash算法，对Hash值与总Cache服务器数据取模，再通过取模后的值，找到服务器列表中下表为此值得Cache服务器。通过Java Client API封装实现；

13.TBstore 存储基于Berkeley DB，弱点：Berkeley DB在数据量>内存后，即往硬盘写数据，缓存性能此时大幅下降。

14.UIC（user information center）诞生，应用系统访问UIC，获取高达几十亿的用户信息，必须用到缓存，不能直接查询数据库，TDBM诞生，参考了memcached内存结构

15.TDBM、TBstore的合并，key-value缓存系统---tair（taobao pair），Tair包括缓存和持久化两种存储功能。Tair为分布式系统，由中心控制节点（config server）+一系列服务节点（data server）组成，

16.iSearch搜索引擎，从每份数据1份变成每份数据多分，从单行变成矩阵，访问容量更大，可用性更高；