很多竞价童鞋都听说过A/B 测试,经常也会遇到过一些问题,不知道结果如何,而不敢冒然行动,单就运用在推广上,A/B测试就有很多用途,不说此法有多精确的预测结果,但至少可以给予一定指导方向,也在避免了在群里时不时抛出“XXX产品怎么样?效果好吗?”等疑问,也许群里有人会回答你他们的使用效果
然鹅,那毕竟是人家的测试结果,适合自己的,才是最好的,那么怎么知道适合自己呢?A/B test 就有一定的指导意义了!
A/B test在很多领域行业都有其对应的用法,仅以百度竞价推广作为例子,为各位童鞋总结整理在SEM推广中,遇到未知效果时,如何入手。
A/B 测试是什么?
这个问题就拿落地页面来举个例子,某同一类型的关键词分别放A和B两个落地页,这同一类型关键词可以是同账户,同计划下不同单元中,也可以是同账户,不同计划中,或者是不同的账户中,在其他条件都一致的情况下,比如,预算、推广时间段、排位(可能有童鞋会有疑惑,排位怎么相同,这个很好解决,先后上放不同的A、B落地页的关键词上线推广即可,比如前5天放A落地页的关键词,后5天上放B落地页的关键词上线推广)
统计这两个落地页的转化效果,结果发现放B落地页的转化率为30%,放A落地页的转化率为12%,如果测试中流量足够免费开户大的情况下,便可以判定B落地页胜出,后期次类关键词落地页参照B落地页制作即可维持一段时间,直到效果下降。
如果感觉自己的创意够丰富,可以继续测试C落地页,与B落地页进行A/B test。直到感觉满意为止。
注:虽然 A/B 测试名字中只包含 A、B ,但并不是说它只能用于比较两个方案的好坏,事实上,你完全可以设计多个方案进行测试,“A/B 测试”这个名字只是一个习惯的叫法。
A/B test 的可靠性
A/B测试其实是一种“先验”的实验体系,属于预测型结论,与“后验”的归纳性结论差别巨大。A/B测试的目的在于通过科学的实验设计、样本代表性、流量分割与小流量测试等方式来获得具有代表性的实验结论,并确信该结论在推广到全部流量可信。
A/B test 能测试什么?
一般来说,凡是和转化相关的都可以进行A/B测试。可以比较两个广告哪个点击率更高,可以比较哪个着陆页面转化率更高,可以比较哪创意转化高,可以比较百度新出的那个商业产品好等等,总之在测试之前会有一个明确的目标,这个目标是找到对某个转化环节的优化机会。
如何分散风险
但凡变动,必然有风险。除非当前的情况为零或者为负数,你可以大胆的改变外,其他情况的变革,可以选择把所有的流量一分为二,也可以选择拿出随机的十分之一流量去尝试新的变动。两者的优点缺点同样明显。前者可以更快得出结果,而后者更加安全。选择A/B测试的范围要在可控可承受损失的安全边际之内。
由宏观到微观
还拿着陆页来举个例子,我们对页面的布局可以有完全不一样的选择。
如果目前我们有的是一个马上注册按钮并且用户点击后开始填相关资料,而在新版本中我们可以直接把注册表单放到着陆页中呈现。等这个测试结果出来了,我们再考虑在页面上测试按钮形状,文字文案等细节的东西。因为细节的东西很多,但是对转化率的影响并没有整体性的变化带来的影响那样强烈。以着陆页为例,由影响强到弱排出这样一个测试的优先级(仅列出部分项仅供参考):
a.页面颜色和按钮颜色
b.页面布局(第一屏布局,宽度,长度,内容重心)
c.Call-to-Action位置
d.主照片选择
e.是否放置视频
f.页面标题文案
g.按钮文案
经过几轮测试一个较优的方案就明了。做竞价一定得细心,可能某一个小环节出问题,就会导致整个结果出现偏差。
遵循的原则
在做A/B测试的时候需要特别关注测试用例的一致性。倘若我们对两个版本使用不同成分的测试源,得出的结果往往不能让人信服。
举个例子,原版产品词排名第一,新版产品词排名靠后(排位不同);原版计划在工作日投放,新版计划在周末测(时间段不同)。因此我们在进行实验的时候最好两个版本随机进行。换句话说同样的时间,同样的来源,不同的版本。也就是保持唯一变量。
测试需要做多久
测试时间 一般结合推广预算分配,如果有充足的预算,投放到测试上流量获取就相对就会对,数据量基数大,得到的预测结果相对就会越精准,测试时长就相对的可以缩小,而如果预算有限,根据自己对结果预测的程度,灵活的调整测试时长。这方面,有一些专业实验数据,辉哥引用下,供各位童鞋参考
如果我在新版本上投入了100个访问转化了10个,是不是转化率就是10%,比我原来的5%的转化率高许多呢?答案是我们需要一个最小的样本数。因为之后的200个访问可能一个转化都没有。
实验对象的转化率会落在蓝色或者红色的“小山峰”里,曲线越高说明落在此处的概率越大。红色和蓝色的区别在于对实验对象转化率的确信程度。实验次数越多我们对结果就更有把握,因此这个小山峰就会越“瘦”。如果我们那个“小山峰”参照那根左面的参照线有95%都在参照线右边,那么我们判定转化率以某种程度大于参照转化率是可信事件。
为了能让95%都在参照线右边,也就是左边阴影面积要小于5%,我们需要让“小山峰”更瘦,需要让样本数量达到一定量。这样我们就理解了为什么我们需要一个最小样本搜狗非企开户 数量,也理解了什么时候我们的A/B测试可以结束了。
你可以填入你的参照转化率和期望的优化目标,它会自动算出结果。不过大多数的含有A/B测试概念的软件,包括Google AdWords和百度推广在进行点击率“优选”的时候都是采用这个方法。
SEM推广实际可以用A/B 测试的有哪些?
①渠道的转化效果
同账户物料(包括但不限于关键词、创意、落地页)、同时间段、同地域、同排位,但这里因为各个渠道(百度、好搜、搜狗、神马)占有的市场份额不同,可能对测试结果有点影响
②同渠道的商业产品转化效果
比如 百度的闪投,做之前和做之后效果转化如何,如果效果可以,可以继续投放
又如 好搜的凤舞,做之前和做之后效果转化如何,如果效果可以,可以继续投放
再如 搜狗的皇冠样式等。但凡渠道出新品,都可以在A/B 搜狗官方下载test原则下进行测试
③同渠道不同账户的效果
有时可能有些童鞋的在同一个渠道开了好几个户,但这些户转化不一定都好,虽然有时候每个户的物料相同,这时候就需要进行测试,分别以10天为一个周期,分别对不同的户进行投放测试,看转化结果那个好,后期分配预算时,多分配些。
④同渠道同账户各个维度的转化转化效果
不同的计划(可能是按照产品/服务分的计划,这样就可以测试不同产品/服务的转化效果)、在细分下去的不同单元(可能是产品型号或者服务种类转化效果),关键词,落地页,创意等