2013-6 阿里技术沙龙:标签生成与推荐系统

倪江峰 伯隅@阿里的分享:标签、推荐、导购

0.27%的关键字占50%PV,以标签作为中间环节

标签为四种:品牌,品类,描述,属性

标签数据库:标题、结构化数据、详情

产品词挖掘:CRF模型

商品结构化属性:半开放式结构

描述词整理:LDA模型

不同类型的词之间的关系挖掘

机器标签---场景导购

标签市场化----买卖双方的标签消费

标签个性化

结合可视化做场景发现

目前这个标签系统仅做导购入口,与检索搜索无关----主要给商品更多的流量入口渠道

------------------------------------------

杨宇航@百度:推荐技术在UGC产品中的应用

领域业务主体可以考虑本体模型方式建模

豆瓣曾工程师的分享:NIP与豆瓣标签

标签是一种有意义的片段

用简化的方式描述对象

标签预测,用户画像,标签推荐

标签的提取

内部领域词库,使用n-gram生成候选词

词的内部独立性与外部独立性

词性标准---标签选择,词频特征

TF/IDF,TextRank,基于图的排序算法

主题模型:精度高但费时

DNN:WordZrec工具包

标签树有助于扩类别的推荐

Latent Factor:隐次特征

原文地址:https://www.cnblogs.com/dhcn/p/7120668.html