转载 计算广告 03

从本节开始,分五次左右的篇幅按照广告类型分别介绍文本广告和展示广告中的关键问题。

对于展示广告,从目标来说,主要分为两种:一是品牌广告,为了传播良性的品牌意识。二是直接营销广告,是为了获得DirectResponse。

Demand端投放展示广告的流程:

    • 选择一个推广目标
    • 定义目标人群:人群属性、地域属性...
    • 开发创意:视屏、富媒体...
    • 投送达到目标人群:通过Guarantee Delivery(GD)或Non-Guarantee Delivery(NGD)的合约
    • 评估效果

Supply端展示广告的流程:

    • 通过内容建设,吸引并维系一批用户
    • 为内容和用户分类,打包
    • 将流量按照两种不同的合同形式变现:通过GD的形式直接销售变现;接入Ad Network或Ad Exchange间接销售变现
本篇主要介绍GD合同的主要问题。GD广告的合同一般是根据用户定向属性签订,规定展示的时段和希望得到的最少展现次数。一般品牌广告会采用这种方式。GD的流量一般都比较优质,而且由于有guarantee,Demand端有把握可以实现定向的覆盖目标。一般的GD按照CPM的方式收费。
根据上述GD广告的描述,可以看到GD广告主要的几个问题。首先是流量预测,既然是有量的下限要求,就需要supply端在接GD的合同时,可以明确的评估未来的流量,而且是定向的流量。流量估少了,少变现了当然吃亏。估多了,实际没有达到展示量的合同就需要赔偿。对于supply端都是损失。
另外,并不是有流量出价高这就会卖给广告主。是否接受一个新的GD合同,除了流量预测外,supply端还需要有一个展现质量的标准模型。模型需要考虑,签不签这个合同,期望收益分别多少,签的话对于原有合同的展现质量是否有下降等。
签了了合同后,就会有另外一个比较复杂的问题,实际在线环境会面临在一个用户出现满足多个GD的合同条件时,如何选择广告impression。这个问题在Ad Network中也存在,一个流量是给GD还是NGD,给具体哪个Demand的投放计划。这些问题都是在线分配的问题。在供给限制和需求限制下,在线分配需要平衡多方的利益,supply,demand和user。如果是AdNetwork的参与,也要考虑自身利益。supply端的在线分配问题描述如下公式:

,目标是点击最大化,限制有广告展现量范围(NGD可小于账户上限,GD有下限要求),某次展现对于所有广告来讲,展现量是非0即1.
问题的求解方式不详细阐述了。yahoo采取的是叫做HWM(high warter mark)的方案。通过离线计算(基于历史数据)和在线分配两部分解决上述问题。
剩下一个问题就是GD定义中的定向问题。下一节单独讲。

 合约广告主要见于流量较大的媒体和品牌广告主之间。而另一部分的需求是长尾的中小网络媒体的流量变现以及广告主。所以,竞价广告也是一种重要的形式。

      竞价广告的第一个问题是竞价的规则,即对于一个流量,以怎样的规则售卖,能刺激得到成交价格最高,流量的收益最大化。这与线下的拍卖问题类似。所以,会复用到拍卖的理论。拍卖理论有很多,这里不一一介绍。在线广告中一般采用的是叫做维克里拍卖的方式,即投标者(广告主或dsp)密封出价,最终由出价最高的投标者获得,但实际交易价格是第二高的价格。

      解决了这个规则以后,竞价广告从广告业务上来讲就没有什么问题了。结合前面的概念,每一个流量到达supply端后,supply就将这个流量拍卖出来,demand端根据这个流量的特征结合自己的定向需求竞价,价高者得到此次展现机会而push出来自己的创意。因为对每个流量都能找到最需要的出价最高的广告主,所以对于supply端,能够得到最大化的变现。而demand端可以保证每一次展现都是reach到了营销计划的目标用户。

      那么剩下的问题就是工程问题了。这种形式的第一个问题是参与竞价广告的有大量的中小网络流量和广告主,他们之间的供需之间的联系没有办法类似品牌广告那样1对1的进行供需交易,是需要需要有一个进行流量拍卖和交易的场所。且竞价的策略、出价等,是需要大量的数据和计算的支持。

所以,在NGD中环境中,以下几种业态形式就应运而生:

        1、交易平台(Ad Exchange):广告交易的场所。主要的挑战是高qps和低rt。在高并发的情况下,能在秒级完成向所有接入的demand询价并按照rank规则返回。

        2、需求方管理平台(DSP):DSP提供给广告主创建广告推广计划(创意、目标受众选择)等,并实现程序化购买,接入不同的Ad Exchange,分析效果,用技术手段优化。由于是处在对每一个流量出价的实时竞价(RTB)的环境下,DSP的主要挑战是在一个询价到来时高rt的评估demand的需求,预估收益,以最低的价格为预估最大收益的demand营销计划获得展现机会,并且实时的反馈效果,调整投放计划

        3、供应方管理平台(SSP):帮助supply端进行流量管理的平台,接入不同的ad Exchange以实现帮助supply利益最大化。


除了效益最大化、效率高以外,这种方式还有对于广告效果还有一个好处。GD中的标签体系,是按照supply端的数据来构建的,supply端定义了标签体系将流量分类,售卖给广告主。但是,最契合demand端业务的定义,只有demand端自己知道,比如用户忠诚度,回头客这些。另一方面广告主掌握的数据是很少的,用户离开广告主域下在在全网的行为,是不能被广告主cover到的。所以,最好的方式是能将广告主的数据(第一方数据)与supply端的数据(第三方数据)结合,服务制定投放计划,并通过cookie mapping,实现全网retargeting,最大化投放效果。这部分需求就催生了数据管理平台(DMP)的产生。DMP实现了第一方、第三方数据的管理和交换(售卖)体系,并支持对audience的自定义细分和根据自定义细分人群的投放,以及效果分析。

最后,实时竞价有上述的诸多优势,但目前在中国仍然处在“看起来很美”的阶段。仍然是品牌广告的包位置包时段的形式为主。主要有几个问题,首先,supply端的环境良莠不齐是一个比较现实的情况。不能想象比如BMW的广告出现在有色小论坛上。另外,品牌广告比较注重的是曝光度,与GD相比,竞价的形式并不是优势。


接上篇,GD定义里的最后一个问题是定向。定向是帮助解决计算广告的核心问题(在给定的上下文和广告的情况下找到最合适用户)的途径。

       定向广告的第一个问题是用户偏好的挖掘,也就是给用户打标签。偏好的挖掘是基于几类的用户数据:一部分是用户的静态属性的信息,例如姓名性别出生年月注册兴趣等等,这类数据是由用户主动提供的,后续训练修正。还有大量的用户行为数据,这些行为数据根据行为中的信息价值排序,由高到底分别为:交易数据、交易前的行为数据(如商品浏览、收藏等)、广告点击行为数据、搜索和结果的点击数据、社交行为数据、浏览行为数据。其中广告和商品的浏览和点击数据中,可以从建立广告或商品本身的标签体系映射到用户标签上。同样,也可以通过建立浏览行为所在上下文达到目的。

       建立好AUC的标签体系后,接下来就是选择受众,为一个广告找到最佳的受众。这里的选择策略一般是由广告主来选择,而且选择不同的标签可能会有不同的定价或溢价。所以说,标签体系也是面向广告主的售卖体系。

       不同的定向方式的技术、数据和影响的广告传播的阶段也有所不同,效果也不尽相同。

  • 人口属性定向:主要依赖用户的静态属性信息产生的标签,如男女、年龄等。这种定向主要是为了符合用户的兴趣和要求,但是由于目标太不明确,单独使用的效果并不好,一般是与其他定向标签组合。
  • 地理位置定向:这其中包括两部分,传统的地域标签,可以通过浏览数据中采集的IP信息,得到对应的地域(省、市),单纯的地域定向同样效果并不好。但是在移动端,通过GPS数据采集得到的精准的当前位置数据,却可以很大程度的满足用户当前的兴趣和要求,hyper-local定向在移动广告的效果是不错的。
  • 行为定向:行为定向可以分为对用户意图和对用户兴趣的定向。意图是短期的、具体的、商业意图明显的。而兴趣是长期、广泛且较为大众化的。两者用到的数据源都是上文中提到的几类行为数据。但意图要求的数据实时性更高,采取准实时流式处理,且需要建立规则和模型来限定一个会话或在购买意图的范围。长期兴趣需要大量的历史数据训练,一般是采用批量离线处理的架构。实时意图一般准确性很高,但是覆盖的用户量很少,而另一个极端是仅适用静态的AUC的类别信息进行匹配,这样做覆盖率最高,但覆盖率低。
  • 社会化定向:主要利用社交网络信息为用户定向。可以用已掌握数据的样本人群出发,利用社交网络信息辐射到look-alike的未知人群的定向。
  • 上下文定向:实时的根据所访问页面的标签关键词等信息,匹配广告。利用爬虫等手段,爬取上下文页面,抽取关键词信息,建立在线cache服务,映射url到关键词。完全根据所用户的访问上下文,推送定向广告

搜索广告是以搜索关键词驱动的广告,广告主通过购买竞价词(某query触发时展现广告),或高级匹配与广告主相关的query展示广告。

同样,搜索广告也是一个三方博弈的过程,publisher关注每次搜索的收益,demand关注roi和流量,而Audience在搜索场景下,关注的是相关度。所以搜索广告就是优化三者最佳收益组合的问题。

在搜索广告中,demand提交广告素材,一般包含标题、创意和展示URL;指定竞价词,一般大客户竞价词比较多,可以根据自己的站内搜索词提取成竞价词投放;并竞价,由于搜索广告一般都是CPC计费,所以竞价就是为每次点击的PPC(Pay Per Click)出价。

Audience在publisher的入口输入query,表达搜索意图。

publisher执行Audience的查询串,在自然结果和广告库中分别检索,得到一个自然结果+广告结果的合成搜索结果页返回给用户。广告与查询的关系,有响应式,即直接满足查询意图的。也有附带式,即相关、竞品、关联商品等。

所以,搜索广告的领域的核心问题,最关键的是广告召回和排序这两个子问题,这也是两个阶段的广告选择,广告召回需要从广告物料库中选出最匹配的一批广告素材,这个阶段的目标函数是广告与query的相关性;而广告排序的目标函数是最大化ecpm。

在召回阶段,会采用查询改写技术解决相关性和竞价深度不足的问题。查询改写的方法有:

1、线上与线下改写:线下改写指得到一个从原始查询到改写查询的映射,但需要在高频的查询词上使用(足够的数据)。而需要改写的原始查询往往是需要市场深度的Query,而改写的目标词,是竞价深度足够的query。冷僻的查询一般使用线上改写做补充。

2、使用Web Serach Log进行查询改写:利用一个查询会话流中的信息进行查询改写,将用户的查询轨迹转化为知识,生成改写策略。这种方式也只适用于高频词的改写,因为需要有足够的查询会话数据来生成知识。

3、查询切片改写:长尾的查询中,使用提取其中的查询片段(query segments),在改写表中查询片段是否存在改写。根据结果生成的所有可能的改写结果(k个segments,每个s个改写结果,就有s的k次方个查询改写可能),根据竞价深度缩小可行控件,并用结果召回广告。

在排序阶段,一般有两种方式:反应式与预估式。顾名思义,反应式是使用已有线上数据的查询与广告,来预估本次展现的ecpm。而预估式,将提取查询和广告的特征,利用特征映射的方法,降维映射到另一个特征空间,预估尚未出现过查询与广告。

这部分跟搜索的问题很相似,涉及的技术和算法非常多,后续再详细记录。

文字链广告一般出现在浏览页面内容时,在广告位上出现的文本广告。主要挑战有:竞价低,利润率单薄;CTR低;转化低;流量大,带来广告引擎的性能问题;Audience的意图不明显。

所有这些挑战最核心的问题,其实都是物料选择的问题。物料选择方式主要有以下几种方案:

1、Supply从广告位上下文中提取关键词,用这些关键词做query请求广告。这就转化为了搜索广告的问题。

2、从信息检索的角度,将context页面拿到广告库中和所有广告做相似度匹配。

3、将广告和页面分类,再使用IR的方式。

第一种关键词抽取的方式,是将问题转化为一个逆搜索的问题,即给定一个页面,找到最匹配的query词,再用该query去召回广告。后续就可复用现有的搜索广告的框架。总体来说是两个步骤:1、抓取页面,分词;2、二分分类器判断候选词是否是关键词。

信息检索的方式,使用完整的Context作为查询串(包括页面内容、浏览用户的属性、偏好,以及环境等),而采用广告作为文档。根据文档和查询串的特征及权重给一个相关性得分,ranking得到评分最高的广告。相似度得分可以采用嘴馋用的相似度度量方式,即余弦相似度。

基于广告分类与页面分析的方法,首先页面和广告采用相同的分类体系分类,分类体系可根据商业意图。后续再计算得分时,考虑两个方面的线性分数之和。一方面是类目得分,即广告类目和页面类目的语义距离,另一方面是搜索串的相似度得分。广告的最终得分再ranking返回。



猜你喜欢

转载自blog.csdn.net/u014645433/article/details/80483467
03
今日推荐