标签基础知识

标签基础知识

标签的定义

  • 要有相关的用户建模算法,从已有的用户数据中挖掘深层次的、能触及用户需求的信息,将不同数据抽象出的一个标签化的用户模型。这里,用户画像技术的核心工作即是给用户打“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识,从而对用户进行基于标签的分类和抽取

  • 属性标签

    • 属性标签是描述基本特征,不需要行为产生,也不是基于规则引擎分析,例如基于用户实名认证信息,获取:性别,生日,出生日期等特征。变动频率极小,且精准性较高
  • 行为标签

    • 通过不同业务渠道埋点,捕捉用户的行为数据,基于这些数据分析,形成结果描述的标签,例如如:分析用户「网购平台」,得到的结果拼多多,淘宝,京东,天猫等。这些都是需要通过行为数据来判断的标签
  • 规则标签

    • 规则下分析出来的标签,更多是基于产品或者运营角度来看,例如电商平台需要对会员等级超过5级,且近7天活跃的会员发一次福利,这里就涉及两个标签应用:1.「会员等级」基于什么规则判断;2.「近7天活跃如如何判断,是基于登录,还是产生交易行为,这些都要可以动态配置,然后基于规则引擎把结果生成。基于动态的规则配置,经过计算和分析,生成描述的标签,也就是规则标签
  • 拟合标签

    • 拟合类标签极具复杂性,通过对多种标签智能组合分析,给出预测描述,或者直接给出进阶定义,例如如所谓的读心术,即通过多个特征,眼神信息,判断人的心理活动。在机器学习中有一句话:通过长期对用户行为的判断和学习,机器可能比用户还了解用户

标签的特点

  • 精确描述定位和搜索,具有生命周期的特性,可以计算,配置和规则化处理。可以用标签来描述各种结构和非结构化[文档、图片、视频等]的数据,从而使这些内容被高效的管理

标签的价值

  • 精细运营的基础,有效提高流量精准和效率
  • 帮助产品快速定位需求数据,进行精准分析
  • 能帮助客户更快切入到市场周期中
  • 深入的预测分析数据并作出及时反应
  • 基于标签的开发智能推荐系统
  • 基于某类下的数据分析,洞察行业特征

标签管理体系

  • 基础标签
    • 即数据的关键标签,特点精确扁平,不可再细分,用来精确的描述数据,类似元数据。当使用多个标签组合描述数据特征,就会形成结构化的表管理。
  • 标签值类型
    • 值类型:数字,字典,布尔,日期,文本框,自定义等,是对标签具体值的管理

标签生产流程

  • 基础流程
    • 数据采集
    • 数据加工
    • 标签库
    • 标签业务
    • 应用层
  • 数据汇聚池
    • 基于 Idmapping技术,置换唯一标识uid
    • 基于ud关联标签,放入计算池;
    • 相同的uid携带的标签会以贪吃蛇的方式
    • 不断丰富该uid下携带的标签內容;
记录学习的点点滴滴
原文地址:https://www.cnblogs.com/yangzilaing/p/14905009.html