受众定向-数据加工和交易     数据加工和交易

 

数据加工和交易

       因为有受众定向,CTR会提高,那么就产生了市场价值,所以市场就产生了数据的加工和交易。一些公司有数据,但它们不一定能数据变现的能力,也不一定对数据变现的业务有接口,那么就会产生数据的交易。

精准广告业务是什么?

受众定向-数据加工和交易
 
 
数据加工和交易

精准广告业务可以类比于提炼汽油的过程。炼油第一步是从油田中抽取原油,原油在炼油厂提炼成汽油,汽油在加油站售出。精准广告的原材料是的数据源,在数据源上我们得到了用户行为,即前面提到过的九种行为,定向系统是将非结构化的用户行为,转换成广告主感兴趣的用户标签,即广告主愿意购买的用户标签,标签比如有:理财,体育,电子等等。Ad Server(投放机)仅仅是使用标签的系统。大家可以看到行为定向实际上与用户定向的关系并不大,它仅仅是使用标签,更重要的是原材料(用户行为)和加工过程(定向系统),这也就是数据为什么会交易,因为它是精准广告系统中最有价值的部分。反过来说,不是哪个公司营利的多,它的定向系统就一定好。技术就像是炼油厂,它是希望能最大程度的提炼原油,而营利主要是由油田的数量决定的,比如你有淘宝,京东的购物行为,变现就会容易的多,即使技术比较差也能赚到很多钱,如果你的数据仅是Page View,那么营利就不那么容易了。

精准广告业务的错误观点

越精准的广告,给市场带来的价值越大

       这个观点个人持怀疑态度,回到第一章我们讨论的问题,特别精准的广告只有两种做法,即把广告主的用户再卖给广告主,和把广告主竞争对手的用户卖给广告主。这两种方法并不创造广告价值,换言之,没有对潜在用户的reach,这时候,它不再是一个广告,而是一个营销渠道,类似于在旅游景点互相拉客人的行为。

媒体利益与广告主利益是相博弈的关系

       从短期来讲,媒体利益与广告主利益是相博弈的关系。比如Yahoo!提供的标签是不多的,它不细分标签的原因是如果细分会对它的短期利益有伤害,如果仅提供性别标签,它可以将男性用户卖给Nike,女性用户卖给Dior,但如果分的很细,比如有-1~+1岁婴儿的母亲这种标签,那么这种标签对广告商是非常有价值的,但问题是很可能没有广告商愿意买剩下的某些细分标签用户,这对媒体短期有害的,但长期来讲,整个市场的利益只有细分,才能创造最大化,才能给广告主带来最大的价值。现在的整体趋势是Demand端越来越强,有价值的标签越来越丰富这个广告发展。

精准投放加上大数据可以显著提高营收

       营利的提高最后还是依靠销售,因为精准投放加上大数据,虽然可以把标签加工的越来越准,但是在广告主基数不变的情况下,只能是每个广告主的用户数变的越来越少,换言之,每个广告主的ROI提高了,但并不是通过提高了Return,而是降低了Investment。也就是广告平台不再对无关的用户展示广告主的广告,所以要扩大用户群只能通用销售的方法去做,做这种广告,淘宝有其先天的优势,因为它掌握着Demand端数据。

人群覆盖率较低的数据来源是不需要的

       比如Retargeting中,人群的覆盖率很低,大家可能认为没有什么效果。但是广告整体的效果往往就是依靠这样一个个覆盖不高但特别有效的标签标出来的,再加上竞价系统的激活,才使得整体广告系统的市场的流动性和收益变大。

不同的广告产品应该采用不同的投放机

       现在讲这个可能有些早,因为我们只讲了合约式广告产品一种,后面还有竞价广告和Exchange,这些算法还是一些不同的,直接的想法是分别实现不同的投放机,但到SSP的时候,无论是RTB,还是CPM,还是竞价售卖的方式,最好还是在一起决策,这样才能最好的优化supply的利益。

有价值的数据

       前面我们提到的是对行为定向有用的数据,但值得交易的数据还有很多。

用户标识

       用户标识是最有价值的数据,在广告系统中如果定位一个用户一般是用cookie,但也有更强的方式,有登录的网站,它的效果就cookie就强。腾讯有QQ号做支撑,效果就会非常好。用户标识的效果可以通过多家第三方ID绑定不断优化。Google有Gmail做支撑,它一个ID可以对应1.5的cookie,所以cookie的强度只有它有2/3。用户标识之所以重要是因为它对广告效果的影响是一个正比例的关系。

用户行为

       业界公认有效行为数据(按有效性排序):“交易,预交易,搜索广告点击,广告点击,搜索,搜索点击,网页浏览,分享,广告浏览”,需要注意的是网页浏览是一个被动行为,热点话题应该去掉。越靠近demand的行为对转化越有贡献,越主动的行为越有效。

广告商(Demand)数据

       如果对广告效果来讲,它是数据的核心。简单的cookie植入可以用于retargeting。对接广告商种子人群可以做look-alike,提高覆盖率。

用户属性和精确地理位置

       非媒体广告网络很难获取,需通过第三方数据对接。移动互联和HTML5为获得地理位置提供了便利性。

社交网络

实名社交网络的人口属性信息相对准确,当一个用户的属性未知时,可以通过好友关系链推测出他的用户属性。

数据管理平台(Data Management Platform

       关于DMP(Data Management Platform)的定义,大家的看法往往不同。DMP有几项主要的业务功能,1. 为网站提供数据加工和对外交易能力,即将网站的数据管理起来,加工成标签,标签给网站使用,也可以出售。2.对于google finance和Yahoo! Finance的用户,他们都会被打上finance标签,如果DMP接入不同的网站,它就可以跨网站加工用户标签,这就比只加工单个网站的数据,标签更准确,这种标签在交易市场中是有公司有兴趣购买的。DMP是否应该直接从事广告交易存在争议,Audience Science的人认为直接参与广告交易,它本身才有利润空间,而bluekai的人认为,将标签放到exchnage中售卖就可以了,但它的利润是比较薄。

       DMP的关键特征有:1. 定制化用户划分,DMP自己加工用户标签是因为它可以针对不同的网站加工不同的标签。2. 统一的对外数据接口,比如在retargeting中,一个网站要接多个exchange,那么网站网页代码中就要加入不同exchange的JS代码,而使用DMP,就可以直接把人群已经加工完成了,那无论哪个exchange来对接的时候,就可以通过DMP交给exchange,这对exchange也是有好处的,要在一个网站上做retargeting,在刚开始的时候,收集到的用户并不多,大约在三个月才能把用户收集完成,如果DMP已经加工完成用户了,在exchange接入后,可以直接使用所有用户信息了。

       代表公司有Bluekai和Audience Science。

DMP系统架框示意

受众定向-数据加工和交易
 
 
数据加工和交易

       DMP在架构中的位置在图中已经标出,它主要是运行一个Data Highway,把各种各样的数据收集起来,比如它对接了十家媒体,那么十家媒体的数据都通过它的Data Highway到计算平台上,它做两件事,1.做Audience Targeting,即给用户打标签,2. 将标签放在在一些可以对外售卖的体系中,比如AdExchange中。它也可以对上下文提供标签,它属于离线挖掘的部分,作用是综合各网站的数据为主。

Data Highway工具

       个人工作中常用的是Facebook的Scribe这个Data Highway,它提供大规模分布式日志收集功能,比如服务器会产生多种日志,广告投放系统日志,点击日志,我们希望可以在几分钟内收集到这些日志流到Hadoop或是Storm上,进行数据挖掘,我们可以用Scribe。它可以准实时收集大量日志到HDFS,得用Thrift实现底层服务。

受众定向-数据加工和交易
 
 
数据加工和交易

       类似的工具有常用的Flume,和Chukwa。

Bluekai

       Bluekai的核心业务主要是接入中小网站后提供给它们数据加工和变现的方式。比如有一家卖服装的小网店,它有自己用户的搜索行为,购买行为,但它的数据量不大,不值得用这些数据去分析变现,Bluekai就会与这些中小网站合作,通过汇聚众多中小网站用户资料和行为数据,加工成受众定向标签,通过Data exchange对外售卖。比如某些DSP想知道用户身上有什么标签,而它又没有用户信息,就可以向Bluekai购买或分成,Bluekai再向网站分成。Bluekai是完全的数据加工的公司,它与广告的关系不大。

       Bluekai提供大量细分的类别,它有着开放体系上的标签,如“对宝洁洗发水感兴趣的人”,“想去日本旅游的人”,这些非常精细类目对于要做效果广告的广告主来说非常有意义,所以它的售价也很高。与之相对的是Yahoo!的广告类目,只有几十个大类。Bluekai靠数据出售变现,并与提供数据的网站分成,并不直接运营广告业务。Bluekai也注意到了隐私的问题,它提供了一个接口,用户可以看到自己的资料被谁使用,也可以选择“捐给慈善机构”。