Как sitemap.xml влияет на индексацию?


Если страница отсутствует в sitemap.xml (но с возможностью обхода по гиперссылкам HTML), может ли это привести к тому, что он не будет проиндексирован? (Я имею в виду, что он будет проиндексирован без карты сайта, но не будет проиндексирован с картой сайта, потому что она отсутствует в карте сайта.)

Author: porton, 2012-07-02

4 answers

Если страница доступна для обхода, она будет проиндексирована, если вы явно не пометили ее как noindex. В sitemap.xml это еще один способ для Google находить страницы на вашем сайте, как упоминал Илмари Каронен в ответе. Единственное, что произойдет, это то, что страница будет найдена не через карту сайта, а другими способами.

 4
Author: Ravi, 2012-07-06 06:26:34

Нет, исключение URL-адреса из вашей карты сайта не помешает Google индексировать его.

Для цитирования Часто задаваемые вопросы о картах сайтов Google:

"Карты сайтов предоставляют нам дополнительный способ понять, какие страницы у вас есть на вашем сайте, и могут помочь ускорить обнаружение новых и обновленных страниц на вашем сайте. Но ни HTML, ни XML-карты сайтов не заменяют обычный процесс обхода".

На самом деле, наличие обновленной частичной карты сайта может в некоторых случаях даже ускорить обнаружение страниц, которые не включены в карту сайта. Например, если вы создадите новую страницу X и свяжетесь с ней со страницы Y в своей карте сайта, и обновите дату "последнего обновления" страницы Y в своей карте сайта, чтобы отразить тот факт, что была добавлена новая ссылка, тогда Google заметит обновление и запланирует обход страницы Y, что заставит их заметить ссылку на страницу X и добавить ее в свою очередь обхода.

Тем не менее, можно также подумать о сценариях, в которых частичная карта сайта может замедлиться вниз по индексации страниц, не перечисленных в карте сайта. Например, предположим, что ваш сайт был разделен на два отдельных раздела A и B, с небольшим количеством ссылок между ними, если таковые имеются, и ваша карта сайта охватывает только раздел A. Поскольку Google использует даты последних изменений в карте сайта для определения приоритетности повторного просмотра, по крайней мере, вероятно, что, если вы продолжали обновлять контент в разделе A (и его карту сайта) достаточно часто, чтобы Googlebot был занят его повторным просмотром, страницы в разделе B могут не получить переписывались так часто, как это было бы в отсутствие карты сайта.

Конечно, это своего рода искусственный сценарий, и его легко избежать. Тем не менее, это, по крайней мере, показывает, что теоретически частичная карта сайта может замедлить индексацию страниц, не включенных в нее.

 3
Author: Ilmari Karonen, 2012-07-02 14:12:43

Поскольку вам не нужно предоставлять XML-карту сайта для индексирования Google, я думаю, справедливо предположить, что удаление страницы из XML-карты сайта также не приведет к ее исключению.

С другой стороны, нет никаких доказательств того, что XML-карты сайтов что-либо делают для вашего рейтинга в Google. Просто подразумевается, что помощь Google, предоставляющая XML-карту сайта, должна помочь.

 2
Author: Ross Holloway, 2012-07-02 12:41:05

Метка lastmod с истекшей датой (стр.06-10-2013) является возможной причиной отсутствия индексации карт сайта.

У меня очень большой веб-сайт и мои карты сайтов в Google, где они вообще не индексируются. Google индексировал только небольшие части моих изображений сайтов. Сегодня я изменил все свои ярлыки lastmod, актуализировав их сегодня.

Существует вероятность того, что последний мод был причиной неправильной индексации страниц.

 0
Author: David, 2013-09-16 09:39:41