Можно ли использовать URL-адреса hashbang (#!) для SEO-атаки на веб-сайт?


По-видимому, Google индексирует URL-адреса hashbang: https://www.youtube.com/watch?v=kDs-MufuiAg

Может ли злоумышленник ссылаться на другой веб-сайт с вымышленными URL-адресами hashbang и использовать его для нанесения вреда этому веб-сайту (если веб-сайт жертвы не указывает канонический URL-адрес и отвечает кодом статуса 200)?

Пример: victimswebsite.example/somepage#!malicious-keyword

Author: Stephen Ostermiller, 2021-08-09

1 answers

Это видео устарело. Google устарел hash bang AJAX и с 2018 года прекратил его специальное сканирование. На данный момент URL-адреса hash bang не более особенные, чем любой другой URL-адрес фрагмента. Google теперь сканирует /somepage#!malicious-keyword и /somepage#malicious-keyword точно так же: он загружает /somepage и выполняет на нем JavaScript, который может загружать или не загружать другой контент на основе идентификатора фрагмента.

Существуют также другие способы добавления к URL-адресам. На многих серверах любое из следующих вероятно, вернет то же содержание /somepage:

  • /somepage/appended/path/
  • /somepage?query=string
  • /somepage#fragment-identifier

Обычно это не вредит SEO, даже если плохой актер добавит вредоносные ключевые слова к URL-адресу и создаст ссылку на него, которую сможет найти Google.

  • В наши дни Google не придает большого значения (если вообще придает) ключевым словам в самом URL-адресе. Простое использование ключевого слова в URL-адресе, похоже, не влияет на SEO ни положительно, ни отрицательно.
  • Добавление к URL-адресу обычно это не приводит к появлению ключевых слов на странице. Если добавление ключевого слова действительно приводит к его появлению в тексте страницы, это, скорее всего, может повредить SEO. Одно из мест, где это возможно, находится в поиске по сайту: /search?q=malicious+keyword
  • Когда Google обнаруживает два URL-адреса с одинаковым контентом, он обычно индексирует один из них и игнорирует другой. Версия, которая связана внутренне на вашем сайте и находится в вашей XML-карте сайта, с гораздо большей вероятностью будет выбрана в качестве канонической Google, даже если вы не используете канонические теги. Очень маловероятно, что ссылка на добавленное вредоносное ключевое слово приведет к индексации этой версии URL-адреса в Google.

Есть несколько способов борьбы с этим, если кто-то попытается спамить ваш сайт подобным образом:

  • Используйте канонические теги ссылок на каждой странице (как вы упомянули в своем вопросе)
  • Запретить обход некоторых добавленных URL-адресов в robots.txt, например Disallow: /search или Disallow: *?
  • Создайте и отправьте XML-карту сайта в Google, в котором перечислены все ваши предпочтительные URL-адреса, Google будет использовать его в качестве канонического сигнала.

Вкратце

  • Теперь в URL-адресах хэш-бана нет ничего особенного.
  • Существует несколько типов URL-адресов, которые могут быть отправлены спамом с добавленными ключевыми словами.
  • Добавление ключевых слов к URL-адресам не является методом рассылки спама, который обычно имеет какой-либо эффект.
  • Существуют способы борьбы с ключевыми словами, добавляемыми к URL-адресам, если это когда-либо вызывало проблемы.
  3
Author: Stephen Ostermiller, 2021-08-09 11:23:54