【数据分享】某产品付费用户数据

原文链接:http://tecdat.cn/?p=967

原文出处:拓端数据部落公众号

数据简介

对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率。

对于付费用户预测,主要是思考收入由哪些因素推动,再对每个因素做预测,最后得出付费预测。这其实不是一个财务问题,是一个业务问题。

流失预测。这方面会偏向于大额付费用户,提取特征向量运用到应用场景的用户流失和预测里面去。(查看文末了解数据获取方式)。

数据详情

数据格式

data

字段

年龄

工作阶层

权重

教育

教育年份

婚姻状况

职业

家庭关系

种族

性别

资本收益

资本损失

每周小时数

原籍国

付费

大小

3800kb

样本量

32561

数据浏览

以前9行数据为例,我们来预览一下:

图片

变量探索:

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

数据获取

在下面公众号后台回复“付费用户数据”,可获取完整数据。


点击标题查阅往期内容

图片

R语言逻辑回归预测分析付费用户

左右滑动查看更多

01

图片

02

图片

03

图片

04

图片

点击标题查阅往期内容

R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资

R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

R语言高维数据惩罚回归方法:主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数据(含练习题)

R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

R语言线性回归和时间序列分析北京房价影响因素可视化案例

python用支持向量机回归(SVR)模型分析用电量预测电力消费

R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归

R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断

r语言逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例

R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图

Matlab中的偏最小二乘法(PLS)回归模型,离群点检测和变量选择

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

R语言多元逐步回归模型分析房价和葡萄酒价格:选择最合适的预测变量

R语言分位数回归Quantile Regression分析租房价格

重庆住房租赁市场现状分析:解读出租房市场的数据密码

R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例

R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类

R语言实现CNN(卷积神经网络)模型进行回归数据分析

R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据

R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析

R语言ISLR工资数据进行多项式回归和样条回归分析

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

R语言如何和何时使用glmnet岭回归

欲获取全文文件,请点击左下角“阅读原文”。

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
原文地址:https://www.cnblogs.com/tecdat/p/15743250.html