Как узнать, когда URL-адрес был впервые проиндексирован Google?


Как узнать, когда конкретный URL-адрес был впервые проиндексирован Google? Я бы предпочел решение, которое работает даже для URL-адресов конкурентов, которые мне не принадлежат.

Author: Sathiya Kumar, 2014-12-03

3 answers

Чтобы узнать возраст URL-адреса, вы можете перейти по этой ссылке, заменив www.example.com на нужный URL-адрес:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Например, вот результат Google для мета-сайта переполнения стека: enter image description here

В противном случае Машина обратной связи также является хорошим решением, но, по моему опыту, менее точным.

 17
Author: Zistoloen, 2014-12-03 19:42:03

Zistoloen нашел способ, чтобы Google отображал дату, когда он впервые проиндексировал содержимое страницы. Я также добавляю это к своему ответу, потому что думаю, что смогу объяснить это более ясно.

  1. Найдите в Google что-нибудь, что в результате откроет нужную вам страницу
  2. Используйте "Инструменты поиска"
  3. Выберите "Пользовательский диапазон..." из выпадающего списка "В любое время"
  4. Укажите большой диапазон дат, например от 1/1/1900 до 1/1/2020

Затем Google покажет дата обнаружения содержимого, которое находится на странице в результатах поиска.

first indexed

Если страница обновляется новым контентом, Google также обновляет эту дату. Таким образом, это скорее дата "первого индексирования этого контента", а не дата "первого индексирования этого URL".


Кэш Google для страницы показывает, когда страница была проиндексирована в последний раз. Вы можете увидеть, что домашняя страница Stack Exchange была проиндексирована в последний раз сегодня:

enter image description here


Другой вариант используя машину обратной связи Интернет-архива. Это показывает вам, как выглядела страница в прошлом. Вы можете узнать, когда эти страницы были впервые опубликованы. И Google, и Интернет-архив сканируют и используют страницу вскоре после ее первой публикации.

 8
Author: Stephen Ostermiller, 2017-04-13 12:33:20

Возможно, не существует какого-либо способа узнать, когда произвольная веб-страница была впервые проиндексирована Google - конечно, я не знаю никакого способа сделать это. Вполне возможно, что Google просто не хранит эту информацию, поскольку нет реальной причины, по которой им это было бы необходимо. Кроме того, даже если они хранят эту информацию, у них действительно нет особых причин предоставлять ее в свободный доступ третьим лицам.

(Если это ваша собственная страница, и у вас есть доступ к вашему старому веб-серверу журналы, это просто - просто найдите в журналах первое посещение этой страницы с помощью Googlebot. Но в противном случае может быть невозможно сказать наверняка.)


В любом случае метод, описанный Зистолоеном и Стивеном Остермиллером в их ответах, не обычно показывает дату, когда конкретный URL-адрес был впервые проиндексирован Google. Скорее, он показывает дату, когда Google считает, что содержимое по URL-адресу было опубликовано или обновлено в последний раз, и часто основывается на более или менее надежные попытки "обнюхать" датируются самим содержимым страницы.

В этом видео Мэтт Каттс из Google кратко рассказывает о том, как выбираются эти даты. Для удобства я переписал соответствующий фрагмент видео (примерно с 2:09 до 2:22) ниже:

"...часто вы будете видеть дату, как мы ее определяем, или когда мы впервые ее увидели, всякий раз, когда мы просматривали эту страницу, или если мы сможем найти ее где-нибудь на странице, и мы сможем извлечь эту дату, вы увидите, что прямо в самом начале фрагмента".

Для таких страниц, как сообщения в блоге, вики-страницы или вопросы по обмену стеками, где программное обеспечение, на котором запущен сайт, автоматически сообщает точную дату создания/изменения на самой странице, дата, указанная Google, скорее всего, совпадает с ней. Однако для других типов страниц анализатору даты Google приходится работать усерднее, и он не всегда делает это правильно (что бы ни означало "правильно" в данном контексте).

В частности, эти даты в основном бесполезны для определения того, как давно страница была проиндексирована, по двум причинам:

 4
Author: Ilmari Karonen, 2014-12-03 20:29:20