项目总结-推荐系统

1、案例背景

当今电商发展的竞争愈来愈激烈。某玩具公司销售额突破6千万后,公司的发展便遭遇瓶颈。公司现状描述,公司属于中型发展公司,资金链充足;该公司的玩具货品来源品牌代理加工工厂,玩具质量和款式以及性价比均为亮点;公司运营团队的规模20人。该玩具公司希望,可以通过我们的分析,给予突破瓶颈+提升销售额的方案。

2、分析目的

首先与玩具公司进行调研,了解公司发展情况;结合市场定位以及竞争分析,确定竞争对手以及制定竞争方案;对公司自身数据进行深度挖掘,优化营销方案。

本次案例中,将针对算法建模的模块,即对公司自身数据进行深度挖掘,优化营销方案。

3、数据说明

共有三个数据文件。

(1)Orders文件是用户在产生购买行为后的交易数据,该数据以订单编号为区分,所产生的数据均在一个订单编号下,时间段为2017年5月整月的数据。

字段的说明:

  订单编号:只要是一次下单购买的商品,不管购买数量为多少,均为一个订单,均具备一个订单编号;

  买家应付金额/邮费:在购买商品理应支付的金额

  买家实付金额/邮费:买家实际支付的金额(享受折扣,以及包邮),一般在淘宝中,会有售价以及折扣价,售价为商家自认为商品所值得的价格,折扣价为实际的销售价格。

  订单状态:买家的行为决定了订单的状态,买家将宝贝加入到订单中,并提交该订单,此时为下单,此时产生的一系列数据均为下单数据;当买家实际支付之后,此时订单状态才会变为交易成功。

  宝贝种类:这一笔订单中,一共购买的宝贝总类别

  宝贝数量:这一笔订单中,宝贝的总数量

(2)Items_orders文件为每一个商品的交易数据

  该文件为宝贝的交易数据,以宝贝类别为区分字段,如果一个订单中包含5种宝贝,此时将会以宝贝为维度,呈现5条数据。每一条数据中,包含宝贝的价格、数量等字段信息。

(3)Items_attribute为商品的属性数据

该数据包含宝贝的ID、标题、价格以及玩具类型、适用年龄以及品牌。

4、Python代码实现

4.1导入数据文件

 4.1.1查看数据

 

 

 4.1.2将数据合成一个表

 

  得到orders_items_props表

 

 4.2构建关系矩阵

 

 

 

4.3基于商品相似度的算法推荐

4.3.1计算物品相似度

 

     

 

 4.3.2 根据相似度推荐排名前五的商品

 

4.3.3导出到CSV文件

 

4.4基于用户相似度的算法推荐

原文地址:https://www.cnblogs.com/lvzw/p/11618393.html