航空公司客户价值分析数据挖掘设计文档
数据挖掘大作业
题目:航空公司客户价值分析
一、任务背景蓝鲨
高铁、动车等铁路的不断兴建,出行方式的多元化让航空公司受到很大的冲击。航空公司之间竞争也很激烈,除了四大航空公司之间的竞争之外,还有新兴产业的各类小型航空公司、民营航空公司,旅游等。甚至国外航线出现高速度增长。
随着时代的发展,客户问题越来越受到关注,客户流失对利润增长造成了非常大的负面影响。客户与航空公司的关系越长,航空公司的利润就越高。一个客户使用了几次这次服务,感觉服务不错,那下次还会倾向于这个服务,但是要获得新客户,不仅需要在广告和人员工资上花费很多,去吸引顾客,在销售、市场也会花费很多,并且大多数新客户产生的利润不如那些流失的老客户多。很明显,失去一个客户对公司来说比得到一个新客户更昂贵。另外老用户也可以带来新用户。
因此,在这一背景下,分析航空公司客户数据,对客户进行分类,提高客户流失率是当务之
急。航空公司应针对不同类型的客户制定相应的营销模式,以实现利润最大化。。
二、数据挖掘目标
按航空公司客户数据进行分类。分析了不同类型顾客的特点,比较不同类型顾客的顾客价值。可以为不同价值客户类别提供个性化服务,并采用相应的营销策略。
分类客户的目的,就是要更精确地说明谁是我们的客户,了解客户到底有哪些实际需要,企业应该去吸引哪些客户,哪些客户应该被重点保留,以及应该如何迎合重点客户的需求等重要问题,进而使客户关系管理真正成为业务获得成功、扩大产品销量的催化剂。客户分类是客户关系管理的核心。帕累托定律(2/8定律):就是20%的顾客给企业带来80%的销售利润。20%的客户其利润率达到100%。现有客户可以带来90%以上的收入。而大部分的营销预算经常被用在非现有客户上。在客户金字塔中具有升级潜力有5%至30%的客户。客户金字塔中客户升级2%,销售收入增加10%,利润就增加50%。
这些经验可能并不完全准确,但我们可以看到新时代客户差异化的趋势和客户价值分析的重要性。
六大茶类
企业应该投入大量的资源来赢得客户,而目标应该放在一小部分能够为企业带来高利润的客户中,而不是所有的客户中,以便长期实现自身的特点。航空公司如何投入有限的资源来实现精准营销,从而提高企业的竞争力,最终实现利润最大化?这是航空公司面临的第一个也是必要解决的问题。
三、数据探索与预处理
构建航空客户价值分析的关键特征
这种数据挖掘的目标是通过航空公司的客户数据识别客户价值,并识别具有不同价值的客户。首先,目标是客户价值识别。RFM模型是识别顾客价值最常用的模型,可以用来对顾客进行分类。数据挖掘的目标是客户价值分析,即通过航空公司客户数据识别具有不同价值的客户。识别客户价值最常用的模型是RFM模型。
R(Recency)指的是最近一次消费时间与截止时间的间隔。一般而言,最近一次消费时间与截止时间的间隔越短,说明对当时提供的商品或是服务也最有可能感兴趣。
F(Frequency)指顾客在某段时间内所消费的次数。可以说消费频率越高的顾客,也是满
意度越高的顾客,其忠诚度也就越高,顾客价值也就越大。
M(Monetary)指顾客在某段时间内所消费的金额。消费金额越大的顾客,他们的消费能力自然也就越大,这就是所谓“20%的顾客贡献了80%的销售额”的二八法则
RFM模型包括三个特征,使用三维坐标系进行展示,如图所示。X轴表示最近(时间),Y轴表示频率,Z轴表示货币,每个轴一般会分成5级表示程度,1为最小,5为最大
办护照需要什么
然而,由于机票价格受距离、舱位等诸多因素的影响,同一金额对航空公司的价值也不尽相同。因此,我们需要对指标进行修订。在所选变量中,客舱系数=对应于客舱系数的平均折扣系数=c,距离系数=某段时间内的累计飞行里程=m。
考虑到航空公司的会员制会因用户的出勤时间长短而在一定程度上影响客户价值,增加指标L=成为会员时间长度=客户关系长度决定了五个指标。R代表客户最近一次消费距今时间长度,客户关系长度L(从入会之日算起),消费频率f、飞行里程m和折扣系数。以上指标是航空公司对客户价值的识别,称为LRFMC模型。
综上,本案例,采用聚类的办法进行识别客户价值,以LRFMC模型为基础该案例,总体流程如下图
挖掘步骤
从航空公司中,有选择地提取数据进行观察、探索性数据分析和预处理,包括缺失和异常值的分析和处理、属性说明、清理和转换。将处理后的数据作为建模数据,利用客流价值的LRFMC模型对客户进行聚类。然后分析每个客户的特点,识别出有价值的客户。针对模型结果得到不同价值的客户,采用不同的营销手段,推送定制化的营销服务,重点维护老客户
数据抽取
    选取两年的时间作为观察窗口
探索性分析
对航空公司的客户数据进行了探索和分析。主要分析缺失和异常数据。通过观察发现,有票价为0、折扣率为0、飞行公里数为0的数据。票价为空值,可能是不存在飞行记录,其他空值可能是,飞机票来自于积分兑换、特价0折优惠等渠道
查每列属性观测值中空值的个数、最大值、最小值的代码如下
#-*- coding: utf-8 -*-
#对数据进行基本的探索
#返回缺失值个数以及最大最小值
import pandas as pd企业性质
datafile= '../data/air_data.csv' #航空原始数据,第一行为属性标签梦见剪发
resultfile = '../tmp/explore1.xls' #数据探索结果表
data = pd.read_csv(datafile, encoding = 'utf-8') #读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)
explore = data.describe(percentiles = [], include = 'all').T #包括对数据的基本描述,percentiles参数是指定计算多少的分位数表(如1/4分位数、中位数等);T是转置,转置后更方便查阅
explore['null'端午节短信祝福语大全] = len(data)-explore['count'] #describe()函数自动计算非空值数,需要手动计算空值数

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。