广东电信公话201亲情月卡用户重复购买率模型的研究

         马上要到 5.17 日世界电信日了,在这里本人也发布一篇刊登于《世界电信》2006年第1期的论文,“广东电信公话201亲情月卡用户重复购买率模型的研究”,对自己以前在广东省电信有限公司的那些刻苦工作、研究与开发的日子的勉励。

 

  

      广东电信公话201亲情月卡用户重复购买率模型的研究

                                                        马根峰  

                                  (广东电信公用电话管理中心  广州 510635)

摘要    在电信市场尤其是公话市场竞争激烈的今天,广东电信公话中心的决策者推出了为外来工、大学生及情侣等长途用量大的用户量身定做的201卡,既开创了IP长话平过市话的新资费,又展开了对长途用户的市场细分。公话中心的决策者很想了解201用户的使用情况,尤其是201用户的重复购买情况。由于从公话卡用户的账号、主叫等传统的分析角度上都无法提供问题的解决方法。最终笔者采用数据仓库、数据挖掘技术,对201的被叫进行分析,设计了201卡用户重复购买率统计数学模型及算法流程,并在实际中编写程序来实现,为决策者提供了很好的数据支撑,同时也开创了世界电信运营商经营分析中按照被叫来分析用户使用习惯的新纪元。

关键词    201亲情月卡;重复购买率;分布式数据库访问技术

 

 

              The research of the formula of the reuse ratio of 201 card

                                                  MA Gen-feng     

 (Public Payphone Center, Guangdong Telecom Corporation, Guangzhou 510635)

ABSTRACT:  Today, the competition becomes more severe in telecom market, especially in public pay phone market. The managers in Public Payphone Center, Guangdong Telecom Corporation supply the imported-worker and students with 201 card, which has the cheapest price for long distince call and subdivided the long-distance-call market. Furthermore, The managers want to know the reuse of 201 card. But in fact, it’s unable to get the answer using the tratraditional method in public payphone field. At last I design the formula for the analysis of called phone number and design the algorithm as well. Furthermore I implement the algorithm successfully by Wata Warehouse and Data Mining. As a result, it’s very successful to know the habit of the customer by the method. The significance of the method is the first use of called number to analyze the habit of the customer.

KEY WORDS: 201 phone card; reuse ratio; Access to distributed Database

 

 

 

  引言

 

         目前的电信市场,已经形成了中国电信、中国移动、中国联通、中国网通、中国铁通和中国卫通六家电信运营商共同竞争的局面。面对日益激烈的市场竞争,尤其是公话市场, 如何提高中国电信企业自身的竞争力,如何增强对自身市场的认识,这成为我们所面临的紧迫问题。

        201卡业务是广东电信的一项较新的重要业务。由于201思家月卡更能满足人们亲情之间长时间沟通的需要,并且亲情通话的资费在整个电信市场上也是最低(打国内长途含市话接入费才0.06元/分钟,所以201业务自推出以来,就保持着高速的增长。在电信领域,衡量一种产品好坏的指标之一就是产品的重复使用情况。对于201卡业务而言,就是201思家月卡用户的重复购买率。但201卡业务的特征就是一张卡的使用期限只有一个月,用户即使一直在使用201亲情月卡,我们也无法从201亲情月卡账号及主叫上确定这一消费特征。笔者在具体的工作中,充分利用201亲情月卡的亲情通话这一特征,即用户通话量最多的亲情号码在一般情况下是不变的。使用数据挖掘技术来成功地设计了201思家月卡用户重复购买率的计算模型,并开发了对应的程序,成功地进行了201思家月卡重复购买率的计算,使企业的决策者对201思家月卡产品的重复购买率有了充分的了解。同时也开创了世界电信运营商经营分析中按照被叫来分析用户使用习惯的新纪元。

 

 

 

2 重复购买率计算模型

 

   2.1  201思家月卡的特点

 

         201思家月卡的特点之一是只能拨打亲情号码,用户在使用时首先要设置亲情号码,不同面值的卡允许设置的亲情号码的个数不同,50元面值的卡允许设置三个亲情号码,40元面值的允许设计二个亲情号码;二是有一定的使用周期,即拨通第一个亲情号码后一个月内有效;三是每种面值的卡都设置有允许用户通话的时长,如50元面值的卡允许用户拨打860分钟国内长话,40元面值的卡允许用户拨打660分钟国内长话;四是该卡只能在200专用机和IC卡话机上使用。

 

 2.2  201思家月卡用户重复购买率的计算模型

         对于公话卡业务而言,由于公话卡可以在不同的公话终端上使用,所以客户分析的难点就是找到目标客户、同目标客户交流。201卡业务也是如此,我们很难在连续二个使用周期内从主叫上、201账号上找出重复使用的用户的信息。在这种情况下,唯一可以找到用户的就是201思家月卡用户所拨打过的亲情被叫号码。

         由于每个201思家月卡用户都有一个通话最多的被叫用户,并且与这个亲情被叫用户的通话具有连续性。基于此我们可以假定:一张201思家月卡对应于一个用户,每个用户都有一个这样的被叫号码。所以201思家月卡重复购买率的模型就是

                                                    (公式一)

     其中:

            a表示在上一个计费月最后一天过期的201思家月卡的数量, 表示在当前计费月内,那些过期卡的通话量最多的亲情被叫再次作为通话量最多的亲情被叫的卡数量。  

而对于在上一个计费月最后一天过期的201思家月卡的数量,结合201思家月卡的特点不难看出它包括下面两种情况

A、31天前启用的卡(即自然过期)

B、在当天已经提前使用完的卡

 

 

201思家月卡用户重复购买率的计算模型的实现

 

 3.1  系统中的数据仓库设计 

   3.1.1  逻辑模型设计

      3.1.1.1 确定粒度层次划分

 

         粒度是数据综合级别的程度。在数据仓库中,多重粒度是必不可少的。数据仓库的主要作用是DSS(决策支持)分析,因而其绝大部分查询都基于一定程度的综合数据之上,而只有较少的查询涉及细节。在本系统中采用了四重粒度,早期细节级的201话务表bill201_early;细节级201话务表bill201和201卡启用表G201Firstuse;轻度综合级的各个计费月中每张卡的每个被叫的话务统计表CardCalled_Stat;高度综合级的各个计费月中每张卡通话量最多的被叫的话务情况表CardMaxCalled_High和过期卡的通话最多的被叫话务CardOutOfDate_MaxCalled。

 

                                

3.1.1.2关系模式定义

 

    A、201话务清单:

        bill201(CardNum,CallNum,CalledNum,CallTime,CountTimeLen,MiniuteRemain,MianZhi,JFMonth)

        其中:

          CardNum为卡号,CallNum为主叫号码,CalledNum为被叫号码,CallTime为呼叫日期,CountTimeLen为计费时长,       

         MiniuteRemain为剩余时长,MianZhi为面值,JFMonth为计费月份

    B、201亲情月卡启用表:

        G201Firstuse(CardNum,CallNum,CalledNum,CallTime,MianZhi)

    C、过期201亲情月卡最多话务量的被叫通话情况:

        CardOutOfDate_MaxCalled(CardNum,CalledNum,MaxTimeLen,FirstUseMonth)

         其中:

            MaxTimeLen为某一张亲情月卡通话量最大的被叫所对应的时长合计;

            FirstUseMonth为过期卡启用的计费月份。

    D、各个计费月中每一张201亲情月卡的每一被叫的通话情况:

        CardCalled_Stat(CardNum,CalledNum,CallTimeLen,JFMonth)

         其中:

              CallTimeLen为某一张亲情月卡某一被叫的通话时长合计

    E、各个计费月中每一张201亲情月卡最大通话情况:

        CardMaxCalled_High(CardNum,CalledNum,MaxTimeLen,JFMonth)

 

 

3.1.2 选定数据库产品来建立数据仓库

 

         目前数据仓库的实现还主要借助于关系数据库系统,再者由于本系统中数据仓库数据部分来自于远程数据库,因此要用到分布式访问技术。而远程数据库系统是MS SQL SERVER7.0,加上MS SQL SERVER与其它数据库系统的连接性能又比较好,更不用说与MS SQL SERVER的连接性能了,因此选用了MS SQL SERVER7.0来建立数据仓库。同时这也符合分布式数据库系统建立时尽量采用”同构同质”型局域网数据库管理系统的建议。

 

 

3.2  计算模型的数据流图

                      

 

 

3.3  计算模型的算法过程

 

         ⑴  使用分布式数据库访问技术从其它主机的数据库挖掘201启用表G201FirstUse至计算主机的数据库;

        ⑵  生成表CardOutOfDate_Former的卡号数据,即在本计费月前一天过期的201卡:包括自然过期的卡和提前使用完的卡

        ⑶  计算表CardOutOfDate_Former中这些过期卡最大的通话时长MaxTimeLen;

        ⑷  计算表CardOutOfDate_Former中这些过期卡最大的通话时长MaxTimeLen所对应的被叫号码CalledNum;

        ⑸  从201话务清单表Bill201中计算生成本计费月中的综合级数据表

               Card_CalledNum表的数据,即计算本计费月中每张卡每个被叫号码的通话时长;

        ⑹  从Card_CalledNum表中生成CardOutOfDate_Later表的数据,即在表

               CardOutOfDate_Later中生成本计费月中每张卡最大的通话时长;

        ⑺  在CardOutOfDate_Later表中计算本计费月中每张卡最大的通话时长所对应的被叫号码;

        ⑻  计算(公式一)中的a和b的值,a等于表CardOutOfDate_Former中的记录条数;而b为表CardOutOfDate_Former和

              表CardOutOfDate_Later中被叫相同的记录的条数。

        ⑼  退出;

 

 

分布式数据库访问技术

         在数据仓库数据挖掘时,由于用到了远程数据库的访问,所以必须使用分布式数据访问技术,目前大型的数据库系统如ORACLE、SYBASE、MS SQL SERVER等都提供有远程数据库访问技术。在MS SQL SERVER中,具体访问远程数据表的方法为

SELECT [Column1,…,Column] FROM Remote_Server.DbName.Owner.TableName

 

 

5  应用效果

         自2003年9月份广东电信推出201思家月卡不久,笔者即开始采用上述的方法来进行201思家月卡用户重复购买率的统计,并且作为广东电信公话中心每个月企业运营分析的内容之一。由于201思家月卡用户重复购买率相当高(基本都是在90%以上),使得在广东电信校园200卡业务萎缩的情况下,通过话务包月服务,有效地稳住了校园电话卡的使用群体。

         另一方面,基于201思家月卡客户极高的忠诚度,广东电信的201业务已经突破最初不向固网住宅用户开放的限制。对于那些对价格非常敏感的固网住宅客户,通过向他们提供201亲情月卡(该亲情月卡20元包IP国内亲情电话20 0分钟,可设置5个国内长途亲情号码,打国内长途含市话接入费才0.1元/分钟)来有效地同其它电信运营商的IP业务进行竞争,在有效地提高了这些客户忠诚度的同时,又通过包月服务来提高了他们对于广东电信的利润贡献能力,这也符合CRM系统的经营理念。

 

 

6  结束语

         公话客户本身的消费模式决定了对它们消费特性的分析必将是一个很复杂的过程。而从用户使用的多张公话卡来研究用户的消费习惯则更是闻所未闻。笔者在广东电信公话201亲情月卡用户的重复购买率研究中,针对201亲情月卡产品本身的特点,通过计算用户通话量最大的被叫的重复率来反映201亲情月卡用户重复购买率,开辟了世界电信运营商经营分析中按照被叫来分析用户使用习惯的先河,在实际应用中也取得了良好的分析效果,为企业的运营提供了良好的导向,并最终为企业带来了巨大的经济效益。

 

 

参考文献:

[1]  邵佩英 · 分布式数据库系统及其应用 · 北京:科学出版社,2000.6

[2]  王珊 · 数据仓库技术与联机分析处理 · 北京:科学出版社,1998.6

[3]  王珊,陈红 · 数据库系统原理教程 · 北京:清华大学出版社,1998.7

[4]  袁鹏飞 · SQL Server 7.0数据库系统管理与应用开发 · 北京:人民邮电出版社,1999.5

原文地址:https://www.cnblogs.com/wuyida/p/6300823.html