Ads.txt是什么

ads.txt是什么

前言

这几天查看网站的后台访问记录,发现有谷歌爬虫有这样一条访问记录:

66.249.73.89 - - [23/Jan/2019:23:50:03 -0500] "GET /ads.txt HTTP/1.1" 404 1040 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

从行为上看,是访问兔子先生的根目录的ads.txt文件,但是网站的内链里上并不存在这个链接,想必又是一个行业标准文件吧。

Ads.txt介绍

从网上找到的资料来看,Ads.txt是IAB(Interactive Advertising Bureau)批准的文本文件,旨在防止未经授权的广告商品销售。

简单点说,就是媒体在他们的网络服务器上放置一个文本文件,列出所有通过其授权出售广告位的公司。而这些广告资源公司,也能通过这个文件来确认网站的广告发布是否有效。

以HuffPost的ads.txt为例:https://www.huffingtonpost.com/ads.txt

#Ads.txt huffingtonpost.com
#2018-12-10

#NAR
google.com, pub-6245227841947028, RESELLER, f08c47fec0942fa0 #video, US
google.com, pub-5482278706573796, RESELLER #banner, CA
google.com, pub-5786243031610172, RESELLER #banner, US
indexexchange.com, 175407, RESELLER, 50b1c356f2c5c8fc #video, US
indexexchange.com, 183875, RESELLER, 50b1c356f2c5c8fc #banner, US
indexexchange.com, 183965, RESELLER, 50b1c356f2c5c8fc #video, US
indexexchange.com, 184110, RESELLER, 50b1c356f2c5c8fc #video, US
indexexchange.com, 184866, RESELLER, 50b1c356f2c5c8fc #video, US
openx.com, 537125356, RESELLER, 6a698e2ec38604c6 #banner, video, US
openx.com, 537143344, RESELLER, 6a698e2ec38604c6 #banner
pubmatic.com, 133799, RESELLER, 5d62403b186f2ace #banner, US
pubmatic.com, 156020, RESELLER, 5d62403b186f2ace #video, US
yahoo.com, 2c44cbf8d10e3e7e1a28056c484eac0bde0af585, DIRECT #native
yahoo.com, 29284317594, DIRECT #banner
yahoo.com, 20459933223, DIRECT #banner
yahoo.com, 20764982904, DIRECT #banner
yahoo.com, 25980889636, DIRECT #banner, CA
yahoo.com, 26720242308, DIRECT #banner, CA
yahoo.com, 29284317576, DIRECT #banner
yahoo.com, 29284317581, DIRECT #banner, video
yahoo.com, 29228548013, DIRECT #banner, US
btrll.com, 6836013, DIRECT #video, US
btrll.com, 6836439, DIRECT #video, US
rubiconproject.com, 17250, RESELLER, 0bfd66d529a55807 #banner
google.com, pub-7363566645038776, RESELLER, f08c47fec0942fa0 #video, US
pubmatic.com, 156198, RESELLER, 5d62403b186f2ace #banner, US
adtech.com, 11353, DIRECT #banner
pubmatic.com, 156674, RESELLER, 5d62403b186f2ace #video
yahoo.com, 42446, DIRECT #banner
google.com, pub-5480205708168063, RESELLER, f08c47fec0942fa0 #video
google.com, pub-9914992914910847, DIRECT, f08c47fec0942fa0 #video
google.com, pub-2557900687859377, RESELLER, f08c47fec0942fa0 #video
advertising.com, 18407, RESELLER #video
google.com, pub-0978064532142215, RESELLER, f08c47fec0942fa0
google.com, pub-9869390676837132, DIRECT
google.com, pub-1991679624331369, RESELLER, f08c47fec0942fa0 #video
google.com, pub-3015538794163384, RESELLER, f08c47fec0942fa0 #video
google.com, pub-3230759608956247, RESELLER, f08c47fec0942fa0 #video
google.com, pub-2679103605715789, RESELLER, f08c47fec0942fa0 #video
google.com, pub-2846699686180177, RESELLER, f08c47fec0942fa0 #video
google.com, pub-6209086188495781, RESELLER, f08c47fec0942fa0 #video
google.com, pub-5628310764637319, RESELLER, f08c47fec0942fa0 #video
google.com, pub-3844877863303739, RESELLER, f08c47fec0942fa0 #video
taboola.com, 1040526, DIRECT #native
taboola.com, 1050097, DIRECT #native
taboola.com, 1061071, DIRECT #native
taboola.com, 1064871, DIRECT #native
taboola.com, 1064872, DIRECT #native
taboola.com, 1064873, DIRECT #native
taboola.com, 1064875, DIRECT #native

我们看到了熟悉的google, yahoo和taobao的记录。

从行业角度来说未经授权的转售是网页广告的主要问题,除非买家直接与发布广告的源公司联系,否则他们无法知道目前看到的广告产品是否是有效授权。

但是目前对于ads.txt的使用并非强制性要求,也就是说如果你的网站没有它,也没有影响,例如网易、淘宝、百度的网站都没有该文件。

创建自己的Ads.txt

如果你的网站加入了Goolge Adsense,那么你可以写一个google.com的ads.txt。

每条数据包含四个字段:

字段 说明
<字段 #1> 广告投放系统的域名(必填)
<字段 #2> 发布商帐号 ID(必填)
<字段 #3> 帐号/关系类型(必填)
<字段 #4> 认证机构 ID(选填)

注意:

  • DIRECT - 发布商和广告投放系统之间达成了直接的业务合同
  • RESELLER - 发布商已授权另一实体来控制字段 #2 中指出的帐号,并通过字段 #1 中的系统来转销其广告空间

针对使用 Google 产品的发布商的示例:

google.com, pub-0000000000000000, DIRECT, f08c47fec0942fa0
google.com, pub-0000000000000000, RESELLER, f08c47fec0942fa0

其中f08c47fec0942fa0是认证机构是Trustworthy Accountability Group(TAG)给出的TAG ID,是固定的。

小结

目前国内其他爬虫尚未发现有对这个文件的抓取,所以行业标准还是需要谷歌这样的大厂来推动。

参考资料


相关主题:
相关推荐
  1. 青阳实验小学
  2. 小象和大伞
  3. 上海市奉贤区教师进修学院附属实验中学
  4. 事发武汉农夫山泉矿泉水内惊现大量虫卵
  5. 小神童双语幼儿园 - 石家庄幼儿园黄页
  6. 昆山市西塘街小学
  7. 瑞昌市第一中学
  8. 警方通报:武汉男子持刀至五死一伤,嫌犯已跳桥
  9. Python公开课 - Django自定义404/404/500页面的两种方法
  10. 易中天给英雄武汉的一首诗 - 武汉新鲜事
  11. 常州市怡康小学
  12. Python公开课 - 全文检索模块Whoosh详解(1)
  13. 面试之物联网卡与互联网卡的区别
  14. 新江镇中心学校
  15. 喷嚏狗和唱歌猫
  16. 解决django项目中py文件如何直接运行【NO module name xxx】
  17. 杭州市嘉绿苑中学
  18. 乾隆密谋偷情书
  19. 嘉诚幼儿园 - 广州幼儿园黄页
  20. 百名网媒总编辑登上知音号欣赏武汉夜色
  21. 深圳市南山区西丽小学
  22. 脱单!武汉的相亲角在哪你知道吗?
  23. 聊城市水城中学
  24. 武汉推出越王勾践剑交通卡
  25. 武汉一女子七天被骗220万
  26. Python公开课 - 数据抓取之Selenium使用(上)
  27. 鹿泉市第二中学(鹿泉二中)
  28. 长颈鹿的超市
  29. 武汉女子网上做兼职被骗六十五万
  30. 车联网 - CAN总线详解
  31. 北京景山学校远洋分校
  32. 武汉市博物馆一日游
  33. 武汉市五十二中学
  34. Python公开课 - 详解模块
  35. 美妙的空中小屋
  36. 国王和他的猴子
  37. 宁波江北区外国语学校初中部
  38. 西安市雁塔区爱华幼儿园 - 西安幼儿园黄页
  39. 邯郸市丛台区滏东小学
  40. 鞍山市铁东区健康小博士双语体育幼儿园 - 鞍山幼儿园黄页
  41. 红太阳幼儿园 - 哈尔滨幼儿园黄页
  42. 冬天里的温情
  43. 深圳市福田区园岭小学
  44. 智慧树幼稚园 - 成都市幼儿园黄页
  45. 央媒聚焦!国庆假期173.78万人次打卡大美黄陂
  46. 八爪鱼的吊床
  47. 贵州省贵阳市白云区蓝天第天三幼儿园 - 贵阳市幼儿园黄页
  48. 南宁市西乡塘区童星幼儿园 - 南宁幼儿园黄页
  49. 洋华幼儿园 - 哈尔滨幼儿园黄页
  50. 小马彪钻进老虎肚
  51. 郁南县建城中学
  52. 肇庆大旺中学
  53. 河北省邯郸市魏县霞光双语幼儿园 - 邯郸幼儿园黄页
  54. 徐州市姚庄小学
  55. 八都镇中心小学
  56. 上海市外国语大学附属外国语小学(上外附小)
  57. Python公开课 - 多线程使用
  58. 奥迪客户不满加价,被武汉4S店销售群殴
  59. 幼儿园入学准备物品清单
  60. 国外免费图床 - 好用体验
  61. 尼日利亚:猎人与人头