无论是DMP中的地理位置标签,或是广告计划设置中的兴趣分类、关键词等,或是各种创意词包,都和今日头条的推荐系统有密切的关系。今日头条的推荐系统,根据内容分析来挖掘用户标签,是推荐系统的基石,而用户标签又能应用于DMP中。
推荐系统,本质上要解决内容与用户、场景的匹配,就像计算广告,本质上要解决广告与用户、场景的匹配(上一篇 核心问题 已讲到)。拟合一个用户对内容满意度的函数,需要三个维度的变量xi用户、xu场景、xc内容,函数y=F(xi,xu,xc),很经典的监督学习问题。
模型层面,沿用同一套强大的算法推荐系统,但根据业务场景不同,模型架构会有所调整。
特征层面,主要有四种特征对推荐系统产生影响,分别是:相关性特征(评估内容的属性和用户是否匹配)、环境特征(地理位置、时间等)、热度特征(全局热度、分类热度等)、协同特征(对相似用户进行协同推荐)。
各类特征中有很多和内容、用户兴趣相关的特征,这些特征从哪里来呢?从文本分析、视频分析、图片分析而来。
文本分析有三个主要应用方向,用户兴趣建模、辅助内容推荐和生成频道内容。通过文本分析挖掘出文本特征,包括显式语义标签类和隐式语义特征。
显式语义标签是人定义的,每个标签都有明确意义,用于用户画像、过滤频道内容、推荐召回、推荐特征,要求覆盖全,精确性要求不高。
topic特征属于概念体系,是对于词概率分布的描述,无明确意义,用于过滤频道内容、标签搜索、推荐召回,不要求覆盖全,负责表达比较精确,比较抽象。
关键词特征属于实体体系,是基于统一特征的描述,无明确集合,也用于过滤频道内容、标签搜索、推荐召回,只要覆盖每个领域的热门实体即可。
在今日头条,无论进行非程序化广告投放,还是程序化广告投放,都有可能竞得今日头条优质流量。很多同学会有疑问,今日头条DSP就已经支持RTB、GD、CPT等模式,为什么还要强调各个模式之间是平等的,难道一般这几种都是不平等的吗?
先和大家普及下交易模式的相关知识,在系列第一篇中我只说了程序化广告中包括RTB、PA、PDB、PD等多种形式,没有具体讲每个的特点,下面就细讲一下。
RTB、PA、PDB、PD之间的交易模式主要区别于是否保量和是否保价,保量是指保证其投放量,保价是指协商好固定价格进行交易,具体如下表:
从而可见,这几种广告模式,价格越高的广告主的准入门槛也越高,对广告主保量保价福利也越好,广告主的规模和质量也更高,品牌广告主也更多。毕竟品牌广告跟着行销计划走,早半年或者一年就规划好了,不可能参与可能竞价不到的RTB等模式。最终,就会导致参与RTB的是大家挑剩下的尾量。
今日头条相当于把优质流量,放在市场上让各种广告模式的都可以来竞价,并没有优先把流量给谁的一说。当然也可能存在给优先级高的调整算法,使其eCPM略高点,从而让它们有点小优势。
上文在介绍各类平台的时候特意强调了:DSP靠差价赚钱,准确预估eCPM。根据eCPM出价就能获得利润空间,DSP在出价方面,既要计算广告侧的点击率和点击价值,又要在预算约束下进行出价。
其中pCTR指预计点击率(点击量/展示量),pCVR指预计转化率(转化量/点击量)。
就是Optimized Cost Per Click ,以目标转化为优化方式的点击出价;就是系统向最有可能发生转化的用户展示广告,并且最后还是按照点击结算。
对于广告主来说:相比于CPC,在同样计价方式下oCPC的转化率肯定更高,因为CPC并没有考虑到后续的转化。相比于只针对SMB(中小客户)开放的CPA,对所有广告主都开放的oCPC明显更有利。
对今日头条来说:评估越准确转化率越高越好,最适合的流量给最适合的广告,达到平台最优。
下一篇《互联网广告的背后是什么(4):今日头条DSP的功能细节》敬请期待!
这些都是我自己的自我总结,也是我对世界的认知和总结,每个人的认知或多或少有所不同,希望能够帮助大家更好地认识这个世界。
《独家调查 技术公司的B Side:今日头条如何用1万名销售死磕450亿元广告KPI》