在手游发展过程中有个不不尽如人意的事实:很难仅仅通过提供免费的服务让用户大量下载一款出色的产品。APP 市场产品琳琅满目,每一个发行商都在竭尽全力去吸引用户的眼球。这样一来,使得手游的用户获取成本也越来越高。
绝大多数的开发者都面临获取用户预算有限的问题。他们需要在买用户的花销上获得一个正的投资回报比(ROI)。在计算 ROI 的时候,一般跟两个关键变量相关:
1、单个安装成本(CPI)—— 获取一个用户下载游戏的花费
2、用户生命周期价值(LTV)—— 一个用户在游戏内带来的收入
通常,ROI 可以用 LTV 减去 CPI 来计算一个粗略值。也就是用玩家在游戏里的充值减去获取玩家的成本来计算。当然也可以把广告收入和病毒传播效益考虑进去。本文为了简化模型,将忽略这些内容。
CPI 是由 APP 广告市场的供需来确定的,而 LTV 则由产品本身决定。APP的商业化做的如何,游戏内提供的付费道具有哪些种类,以及用户的留存率如何等等都决定了产品的 LTV。
在用户还没放弃游戏之前,都是不可能准确地知道玩家的 LTV 的。能做的就是估计一个大概的 LTV 值,这也是本文说的黄金曲线存在的意义。
半年时间作为计算周期
去年夏天早些的时候,我想估计下我们游戏的LTV。想使用一种能让大家都能直观理解的方法来做,而不是用那些复杂难以理解的方法。
我开始收集数据并寻找方法。在计算LTV上有一个关键的问题是给你的玩家多少时间来展示他们的价值。游戏中玩家的价值是以天为单位来积累的。如果用年做单位来衡量 LTV 的话,是非常冒险的,因为要花费很长的时间才能赚回获取玩家的成本。对一些小公司来说,这样做会非常不合适。
而如果只用几个星期作为 LTV 的计算周期的话,那么计算出的 LTV 会非常低,这么低的 LTV 都无法说服你去导入新用户。通常折中的方案是选取180天为计算周期。
因此,我感兴趣的是玩家在180天的累计游戏内花费。正式的说法是,用户180天的 LTV。
使用用户群来做样本分析
当导入新用户时,购买的不是单个用户,而是一群用户。一般通过报价的方式在广告网络上购买某个国家某种设备的用户流量。
LTV 最好是根据一群用户的平均值来进行预估。单个用户的180天 LTV 可以用群体的总180天 LTV 除以人数来获取。
该用户群是所有进入游戏用户的一个子集。例如日用户群就是指某日进入游戏的用户群体。当然也可以把用户按照国家,广告商,游戏设备来进行分组,然后可以查看每一个群体的 LTV。
图1的蓝色线显示了一个大型免费下载APP的某个用户群体的日付费累加额度的情况。从途中,可以很明显的看出,随着玩家玩游戏的时间增长,这个群体的付费会越来越少。这主要是因为留存用户的减少,随着时间的增加,这个群体中来玩游戏的人越来越少,所以这个群体的增加的累计付费会越来越少。
曲线拟合的陷阱
曾使用过 EXCEL 的图表展示数据来帮助你理解吗?如果用过的话,你肯定遇到过用趋势线来拟合数据。这是一个非常好的功能,可以让调整变量来拟合你的数据。
已经证明过如果已经有180天的数据,那很容易找一个很好的拟合曲线,但问题也是明显的。图1里的蓝线是用幂函数来拟合真实的数据。红线是只用7天的数据来拟合出来的曲线。
这个例子中,红线的模拟线比真实情况低了大概三分之一左右,这个结果不好。
当然,也可以用曲线拟合其他的指标,例如留存率。N日留存率表示的是下载游戏N天,还有多少的用户在使用你的 APP.
Plumbee 公司的CEO,Ralf Keustermans, 他最近一次的演讲中说到过他们被用曲线拟合留存率耍过。用曲线拟合的 LTV 为9美元,而实际上的LTV只有2.5美元。
这说明了什么?常规的曲线拟合留存率或付费情况可能导致严重的错误判断。
一点改进
所以,似乎还得继续努力去找到更加可靠的预估方法。我做的第一件事情是提高拟合的精度。
EXCEL 的曲线拟合,可以使用两个参数。在用线性函数拟合的时候,LTV=a + b*x。x 是天数。也可以用多项式来进行拟合,但同时,这也可能会导致过度拟合,从而产生更荒谬的结果。
目前最好的拟合函数是幂函数或者指数函数。因此,我需要一个程序能使用更多的参数和一些不同函数的组合来拟合结果。
很幸运的是,有很多免费的工具可以帮助你来用复杂的函数拟合数据。通常,需要在简单函数和过度拟合直接寻找平衡。使用的函数越复杂,对数据的拟合也就越好。
例如用三种函数组合在一起,或者用大量的参数,或者高阶多项式都可以使得你的函数更复杂。
然而,这也意味着,在样本外的数据上,你的函数可能表现的更差些。这里有个例子,请看 Hal Varian 最近的文章,第六页。(我强烈建议你们阅读一下整片文章)
黄金曲线
用更多的数据来做模型,那预测模型也就可以获得更高的精度。在我们的例子中,使用的玩家周期越长,在预测 LTV 的效果也就越好。使用90天的值拟合的曲线在预测180的 LTV 上比使用7天的效果值要好很多。
以我的经验来看,等用户的游戏行为已经达到30天后,再来做预测是可取的。也就是获得30天的数据后再进行预估行为。
也应该保证你的样本够大,至少每个样本要几百个用户。
在用数个函数拟合了好多款游戏后,我的黄金曲线最终定为一个有三个参数的指数函数。目前为止,这个函数在只有有限的几天数据的情况下,预估后面相当长的时间的结果都相当的不错。
你是否在从这个曲线上真正获得黄金?
如果你有一款好的产品,那当然是的。但是我上面表述的只是一个估算LTV直观的易于理解的方法。能够帮你在跟别人讲述的时候比较容易的说服对方。但是,代价就是精度。
使用真正的数据科学模型可以获得更高的精度,也可以让你在跟产品团队解释的时候更加有信心。但是,小的开发者也会发现获取数据科学模型是非常难的。
在任何情况下,使用多种方法来做都是必要的。我一般喜欢用三角预测法。就是用三种不同的方法预测并对比他们的结果。假如三者的差异非常大,那我会认为三种方法都不对。但是如果差异很小,那结果就任务可靠。对预测LTV,另外一种简单的方法是试算表方法。
回到去年的夏天,我们已经有一个大规模的数据模型了。因此三角预测对比可以做了:真正的数据科学模型的结果,试算表的方法结果和黄金曲线的结果。
假如,你手里没有数据科学参考模型,那可以问下你的同行,他们的 LTV 大概是多少。以此作为参考。
CPI 也不能跟 LTV 相差特别的大。我知道肯定有更加快速或者更加直观的 LTV 预测方法。我们一起讨论一下,你是怎么做的?你的黄金曲线是怎么样的?