Как "Noindex:" в robots.txt работать?

Question

Как "Noindex:" в robots.txt работать?

Я наткнулся на эту статью в моих сегодняшних новостях SEO. Похоже, это подразумевает, что вы можете использовать директивы Noindex: в дополнение к стандартным директивам Disallow: в robots.txt.

Disallow: /page-one.html
Noindex: /page-two.html

Похоже, что это помешает поисковым системам сканировать первую страницу и не позволит им индексировать вторую страницу.

Это robots.txt директива, поддерживаемая Google и другими поисковыми системами? Работает ли это? Это задокументировано?

10

robots.txt googlebot noindex web-crawlers

Author: Stephen Ostermiller, 2015-09-10

Source

1 answers

score 9 · Accepted Answer

Google неофициально поддерживал директиву Noindex в robots.txt , однако в 2019 году они объявили , что директива больше не будет работать.

Вот что говорит Джон Мюллер из Google о Noindex: в robots.txt:

Мы использовали для поддержки директивы no-index в robots.txt в качестве экспериментальной функции. Но это то, на что я бы не стал полагаться. И я не думаю, что другие поисковые системы используют это в все.

До того, как Google объявил, что эта функция была прекращена, deepcrawl.com провел некоторое тестирование функции и обнаружил, что:

До 2019 года он все еще работал с Google
Это предотвратило появление URL-адресов в индексе поиска
URL-адреса, которые не были индексированы в robots.txt были помечены как таковые в поисковой консоли Google

Учитывая, что Google прекратил использование этой функции, ее не следует использовать больше не.

Вместо этого используйте мета-теги роботов, которые хорошо поддерживаются и документированы , чтобы предотвратить индексирование:

<meta name="robots" content="noindex" />