Можно ли использовать URL-адреса hashbang (#!) для SEO-атаки на веб-сайт?
По-видимому, Google индексирует URL-адреса hashbang: https://www.youtube.com/watch?v=kDs-MufuiAg
Может ли злоумышленник ссылаться на другой веб-сайт с вымышленными URL-адресами hashbang и использовать его для нанесения вреда этому веб-сайту (если веб-сайт жертвы не указывает канонический URL-адрес и отвечает кодом статуса 200)?
Пример: victimswebsite.example/somepage#!malicious-keyword
1 answers
Это видео устарело. Google устарел hash bang AJAX и с 2018 года прекратил его специальное сканирование. На данный момент URL-адреса hash bang не более особенные, чем любой другой URL-адрес фрагмента. Google теперь сканирует /somepage#!malicious-keyword
и /somepage#malicious-keyword
точно так же: он загружает /somepage
и выполняет на нем JavaScript, который может загружать или не загружать другой контент на основе идентификатора фрагмента.
Существуют также другие способы добавления к URL-адресам. На многих серверах любое из следующих вероятно, вернет то же содержание /somepage
:
/somepage/appended/path/
/somepage?query=string
/somepage#fragment-identifier
Обычно это не вредит SEO, даже если плохой актер добавит вредоносные ключевые слова к URL-адресу и создаст ссылку на него, которую сможет найти Google.
- В наши дни Google не придает большого значения (если вообще придает) ключевым словам в самом URL-адресе. Простое использование ключевого слова в URL-адресе, похоже, не влияет на SEO ни положительно, ни отрицательно.
- Добавление к URL-адресу обычно это не приводит к появлению ключевых слов на странице. Если добавление ключевого слова действительно приводит к его появлению в тексте страницы, это, скорее всего, может повредить SEO. Одно из мест, где это возможно, находится в поиске по сайту:
/search?q=malicious+keyword
- Когда Google обнаруживает два URL-адреса с одинаковым контентом, он обычно индексирует один из них и игнорирует другой. Версия, которая связана внутренне на вашем сайте и находится в вашей XML-карте сайта, с гораздо большей вероятностью будет выбрана в качестве канонической Google, даже если вы не используете канонические теги. Очень маловероятно, что ссылка на добавленное вредоносное ключевое слово приведет к индексации этой версии URL-адреса в Google.
Есть несколько способов борьбы с этим, если кто-то попытается спамить ваш сайт подобным образом:
- Используйте канонические теги ссылок на каждой странице (как вы упомянули в своем вопросе)
- Запретить обход некоторых добавленных URL-адресов в
robots.txt
, напримерDisallow: /search
илиDisallow: *?
- Создайте и отправьте XML-карту сайта в Google, в котором перечислены все ваши предпочтительные URL-адреса, Google будет использовать его в качестве канонического сигнала.
Вкратце
- Теперь в URL-адресах хэш-бана нет ничего особенного.
- Существует несколько типов URL-адресов, которые могут быть отправлены спамом с добавленными ключевыми словами.
- Добавление ключевых слов к URL-адресам не является методом рассылки спама, который обычно имеет какой-либо эффект.
- Существуют способы борьбы с ключевыми словами, добавляемыми к URL-адресам, если это когда-либо вызывало проблемы.