推荐系统-用户信息数据的采集(1)

马克思说人是一切关系的总和,人是人的历史的总和,他的过去的一切造就了现在的他,他的每一个行为都会和他的家庭教育,他的人生经历有着密切的关系。

           在中国偌大的土地上,生长者各色各样的人,他们有着不同的工作,不同的收入,在不同的地方,发生者各种各样的故事,虽然人一直在不断变化,但是人在某个阶段会不自觉或不得已的按照一种生活模式生活,人的需求在某一个阶段就有一定的稳定性,我们就利用这种稳定性来预测未来。

  用最近自己历史预测未来。

  例如我们发现一个用户,总是在我们的网站浏览手机,那么下一次,我们就会向他推荐手机。

用类似的人的的历史预测未来。

如果你身边有个人,跟你差不多的家庭背景,差不多的大学,差不多的专业,那你们的人生大多数是很相似的。

扯了这么多无关的,回归正题,这篇文章谈推荐系统的数据从哪儿来。

1.显示数据

就是那5克星评分。还有购买数据,收藏物品,这些保存在数据库中,保存在数据库中。数据规整,易于处理。

2.隐式数据

客户的保存,复制,收藏网页,还有在网页的时间等,这些大多数保存在日志中,就是所谓的web使用挖掘。数据混乱,要识别用户和事务,转换为规范数据。

image

原文地址:https://www.cnblogs.com/hansongjiang/p/3348764.html