数据是未来的原材料

2012-04-03 19:50 来源:未知 编辑:秋军 评论:

A-A+

电商交易量每年增加一倍,但对所积累数据的了解程度是否跟着增加一倍呢?如果电商现在不开始收集数据及应用起用,未来要用数据的时候,就会发现过去的数据已经是一堆垃圾。 许多人已经开始意识到,未来的电商是数据之战,在这种大数据的背景之下,电商收集数据的边界在哪里?又该如何快速运用数据做出正确的商业决策?这是多数电商公司的困扰。

数据是越多越好吗

数据是未来的原材料

后来在美国遇到Patil,他认为过去收集数据很难,而现在获取数据资源变得更容易。但是如果收集数据的出发点,不是为了解决问题,那么收集再多的数据有什么意思呢?

可是许多公司还有一个疑问是,现在收集数据不难,成本也不高,为什么不先收集数据再说呢?等以后需要数据来解决问题时再拿出来用也可以。Patil的答案我也很认同,他劝大家千万别这么想,用这样的理念来设计数据应用肯定会失败的。数据是没有边际的,我为此也痛苦了好一段日子。比如收集一个人的生日,可以精确到几分几秒,但这么精确的数据有什么应用,能产生什么价值呢?

数据是未来的原材料

事实上,数据是有生命周期的,比如从中国身份证号码是可以推断出性别的,但是过几年如果这个规则变了,导致我们基于数据所做假设和决策依据也就失去了意义(Data Broken)。更何况保存数据及其收集时的背景(Context)也是一件不容易的事情。所以说,在收集数据的同时,我们必须知道未来可以用来做什么,今天都想不出来的话,日后就更不容易想出来了。

打一个比方,今天很多电商老板会问重复购买率是多少,于是我们收集数据来计算重复购买率,却很少想到需要重复购买率来做什么决定。这就好比刻舟求剑这个故事,他告诉我们世事在变,我们不能只是机械的套用方法或指标。就像重复购买率有不同的定义,而做不同的决策需要不同定义的重复购买率。如果从一家投资公司的角度来看重复购买率,它想收购A公司,那么会从重复购买率来看整个A公司的健康程度或用户质量等。如果从A公司本身运营的角度来看重复购买率,那么它更关注的是日、周级别的重复购买率的变化趋势,或者当月新增客户有多少人在三个月后的重复购买,从而可以衡量每个月新增及存量客户的忠诚度和质量,找出改善的空间。知道了以上的背景之后才去选择用什么数据不是更靠谱吗?

数据应用因小而美

从2011年年底,我开始思考怎么从“用数据”转变为“养数据”(即数据运营转变为运营数据),这一段时间我特别为收集什么样的数据而烦恼(more data, more problem)。而且,我也曾经想做一个特别大的适合多数人使用的数据应用出来(虚火上升),可是后来发现这在数据应用的起步阶段几乎是不可能的,一是找到可以解决大部分人需求的数据应用不容易,二是支付宝的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。

数据是未来的原材料

所以,我总结,当做数据应用的时候,数据就是等于原材料,当原材料一直处于变化的情况下,做出来的产品很容易出问题。体会数据和应用的关系之后,我最后决定从小角度切入,先做小应用出来(很好的瞄准器)。

这里说的“小”指的是应用的目标很具体。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好,差异在哪里,是很具体的问题。但如果我的目标是想知道如何让公司赢利,就是一个空泛的目标。

还请注意,“小”不是指数据量。许多人在没有获取足够数据,并且缺乏对数据理解的情况下做判断,其实是在享受自己的无知。

经过一番周折之后,也是按照小角度切入的想法设计数据应用,小角度切入设计产品可以做到具体和快速,而且可以避免因原材料的变化而导致的问题。

把数据放进“框”之中

此外,还不得不说到一个话题,在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(情景)里面看才能看出问题。

数据是未来的原材料

为了把问题说得很明白,这里我拿前阵子一家电商公司找我讨论的问题举例子。这里不太方便公开这家公司的名称,暂以A公司代替。

A问我,要不要撤去导航网站的广告?因为怀疑许多老客户是从导航网站访问官网,而不是直接访问官网。

把这个问题说得再直白点,就是要弄清楚在导航做广告与A公司的业务关系。

  • 0
  • 0
  • 投稿