中国的在线英语教育从上个世纪九十年代开始萌芽,至今经历了录播式教育(1996-2010年)、直播式教育(2011-2016年)和互动式教育(2017年至今)三大变革阶段。近十年伴随着科技发展和互联网巨头入局的红利,在线英语教育进入了黄金发展阶段。当前的在线英语教育可以细分为语言学习、课后辅导、证书/留学、综合/平台、工具类和社区类六大板块,基本采用“免费+付费”的运营模式,一方面通过免费模式吸引新流量,占据市场份额,另一方面通过付费模式增强客户黏性获取利润。
平台功能上的异质性,使得各大板块在付费比率上存在较大差异。在语言学习板块,平台通常向消费者提供外教服务,比如阿卡索外教网,为消费者提供一对一外教口语训练,消费者需求性高,付费门槛低。而在工具类板块,比如有道翻译,平台提供的单词查询、句子翻译等免费功能基本覆盖了消费者的使用需求,因此付费比率较低。
为了跟上市场的脚步,在线英语教育平台必须通过技术创新完善系统,以此提高用户体验。但是,如果一味地依靠外来资本投资,而无法通过自身的利润来实现产品升级的话,平台将会陷入困境。因此,如何让消费者从免费走向付费,仍然是在线英语教育平台需要解决的问题。
数据简介
在使用某英语阅读app相关功能之前,用户必须先进行注册,填写相关的个人信息,随后可以领取15天的会员优惠。如果用户存在教学关系,可以在app内加入所属教师开设的班级,在班级内部完成任务和辅导。
图1 某英语阅读app用户使用流程图
我们获取了该阅读app用户在2019年9-10月的学习数据并对其进行筛选,要求用户在这两个月内登录过小程序并且浏览过文章,最终获得了15356条学习数据。
数据内容涵盖了因变量和自变量,其中以用户是否付费作为因变量。数据的自变量分为个人信息、登录行为、学习行为、优惠领取和教学关系五大维度,具体数据说明如表1。
表1 数据说明表
描述性分析
首先从用户付费角度分析,付费用户共有244人,占比1.59%,非付费用户共有15112人,占比98.41%。从数据上看,虽然该阅读app获得了一定的用户流量,但是与同行业app相比,付费转化率仍然较低。
图2用户付费情况分布
随后我们从性别和学历两个方面对用户进行了粗略的画像。在性别分布上,男性用户占比23.87%,女性用户占比33.02%,但有多达四成的用户拒绝透露性别。对用户的付费情况与性别进行交互发现,在非付费用户中,性别比例的分布与整体大体趋同,但在付费用户中,女性用户占比达到47.54%,远远超过其它两个群体。
图3 用户性别与付费情况分布
在学历分布上,普通本科院校的学生是该app的用户主力军,以62.03%的比例力压其它类型院校,985院校用户占比4.78%最低。在非付费用户中,各学校类别的分布比例与整体大体趋同;在付费用户中,985院校用户占比达到15.57%,远远超过其在整体用户中的比例,说明在985院校的用户中,付费倾倾向更加明显。
图4 用户学校与付费情况分布
登录是体验的第一步,让用户保持登录行为是平台方的基本目标,只有形成使用习惯,才有可能进一步付费。在所有用户中,有登录了174天的长久用户,也有仅登录1天的“一次性用户”。用户的最大登录天数整体呈右偏分布,在20天、40天两个节点出现了明显的下降趋势,绝大部分用户的最大登录天数不超过40天,平台方可以考虑在这两个易流失的时间节点采取激励措施来挽留客户。以中位数计,付费用户的最大登录天数水平远高于非付费用户,说明付费行为在一定程度上有效增加了用户黏性。
图5 用户登录行为分布
登录行为说明用户的浅层使用行为,学习行为则真正体现了用户的沉浸度。在xx阅读app中,学习行为共涉及到4个模块,分别是答题、朗读、写译和拓展学习。从分布上看,用户对于答题练习更加青睐,对其他练习兴致不高,综合4个模块,非付费用户的100%完成率高于付费用户,而付费用户的非零完成率高于非付费用户。
图6 用户学习行为分布
最后是优惠领取行为,平台方的优惠投放程度与用户的留存度息息相关。在用户使用初期,优惠投放有利于用户形成使用习惯,到了使用倦怠期,优惠措施可以有效地挽留客户。在xx阅读app中,平台方提供了两个优惠措施,第一个是无门槛15天vip体验券,第二个是教师pass卡,在绑定教师之后可以延长一个月的会员资格。从优惠领取行为上看,领取15天vip优惠的用户达到了八成以上,领取pass卡的用户仅占三成,说明用户对于前者更加热衷,相较而言,pass卡的吸引力较差,平台方可以考虑对后者进行优化。付费用户中领取15天vip的比率明显高于非付费用户,而领取pass卡的比率在二者之间并没有明显差距,说明领取15天vip优惠后用户的付费倾向得到了提高。
图7 用户优惠领取行为分布
建模与预测
基于描述性分析,我们对数据内容有了基本的了解。接下来建立逻辑回归模型并且采用aic准则进行变量选择,估计结果如表2。
表2 aic变量选择模型估计结果
从学校角度看,比起基准组,985院校的用户更乐意为app服务买单,专科院校的用户更倾向于拒绝付费。
从登录行为上看,最大登录天数与浏览文章天数都和付费与否呈正相关,天数越多,用户黏性越高越可能付费。相反,浏览文章数与付费与否呈负相关,用户浏览文章数过多,可能是基于粗略浏览。
从学习行为上看,答题完成率与付费与否呈正相关,在其他条件一定时,答题成功率越高,用户付费可能性越高。
从优惠领取行为上看,领取15天vip优惠行为与付费与否呈正相关,在其他条件一定时,领取15天vip优惠的用户付费可能性更高。
根据上述逐步回归模型,我们对用户的付费行为进行了预测。选取样本的付费率作为阈值,最终预测结果如图8。模型的整体错判率为26.24%,tpr值为74.59%,fpr值为26.25%,auc值为0.828,说明模型的整体拟合效果较好。
图8 模型预测结果
建议
第一,节点激励。在用户大幅流失的时间节点采取激励措施挽留用户,比如20天和40天。平台方卡可以考虑使用打卡换优惠的方式,当打卡满20天、40天的时候就能够领取相应程度的会员优惠,鼓励用户形成使用习惯和黏性。
第二,深耕答题功能,优化朗读和写译。从分析上看,用户更加青睐于答题功能,平台方可以通过提高题目的质量来巩固这批忠实用户;相反,在朗读和写译功能上,用户的参与度并不高,平台方应当适时优化部分功能,改变考察形式,以此来吸引用户。
第三,针对性优惠投放。在已有的优惠投放措施中,pass卡是针对绑定教师关系的用户,但是从数据上看,领取pass卡的比例在有无存在教师关系的两个用户群体中并没有显著差异,因此我们推断是否是由于pass卡的优惠力度对于绑定教师关系的会员用户而言没有足够的吸引力。我们建议平台方应当针对细分用户群体推出个性化的优惠措施,才能起到激励效果。
水妈小分队成员:张曦郴、郭鲁宁
案例审查:小辰
特别感谢北大光华mba“梦露”小队成员:韩露、李泽鹏、乔丹、海天、孙海淇、吕科宏
点击这里阅读原文 返回搜狐,查看更多
责任编辑: