Несет ли Google ответственность за th1s 1s a 4o4.html?
Я проверил архивы сайта, но не смог найти ответа на свой вопрос. Недавно я исследовал, кто несет ответственность за th1s_1s_a_4o4.html
, но некоторые форумы, похоже, предполагают, что за этим стоит Google.
Есть ли что-то, что мне нужно сделать, в частности, с этим кодом, поскольку я регулярно генерирую журналы ошибок и продолжаю видеть это несколько раз в неделю. Я действительно управляю заказом 404.php файл в моих темах WordPress и когда я проверяю свой 404.php с помощью var_dump(http_response_code());
я получаю успешно возвращено int(404)
.
Нужно ли мне делать что-то еще, и было бы плохо заблокировать это в моем robots.txt, что-то вроде:
User-Agent: *
Disallow: /th1s_1s_a_4o4.html
Влияет ли вообще возврат сообщения для 404 на ваш ранг?
3 answers
Нашел это на странице блокировки сайта в Facebook.
Блокировка сайта - Безопасность веб-сайта Спасибо за информацию. После просмотра вашей учетной записи у вас действительно есть бесплатный сканер, предоставленный вашей хостинговой компанией. Чтобы убедиться, что ваша страница 404 чиста, мы фактически пытаемся спровоцировать ошибку 404, отправляя запрос на несуществующую страницу (например, th1s_1s_a_4o4.html). Пожалуйста, дайте нам знать, если у вас возникнут какие-либо дополнительные вопросы!
Что бы ни попало на ваш сайт с этим URL-адресом, это не похоже на Google. Я проверил журналы своего сервера, и ни на одном из моих сайтов этот URL-адрес не запрашивался в прошлом месяце. Если бы это был Googlebot, я бы ожидал, что тема запросит такой URL-адрес на всех сайтах, которые они просматривают.
Https://productforums.google.com/forum /#!тема/веб-мастера/mkfvfwotl5i содержит пользовательский агент из такого хита:Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/6.0)"
, который не является пользовательским агентом, который использовал бы Googlebot.
Ответчик в этом поток проверяет IP-адрес клиента и определяет, что это не тот IP-адрес, который использует Google.
Однако там есть ключ к пониманию того, почему это происходит. В случае, когда он был опубликован, вместе с запросом был указан URL-адрес ссылки: http://www.google.com/url?url=www.<censored-spam-site>.ca&yahoo.com
. Мне кажется, что это спамер, который пытается привлечь трафик на свой сайт, отправляя ваш отчет 404 и реферальный отчет. Они используют Google в качестве перенаправителя, чтобы URL-адрес выглядел более законным. Также добавляя к нему yahoo просто для пущей убедительности.
Безопасно игнорировать подобный спам.
Один из них ударился о ступеньку моей двери. Кто бы это ни был, это определенно не Google. он использует его, но похоже, что он взломал google и yahoo в соответствии с визитом. Я просто блокирую эти ip-адреса, когда они делают странный запрос или запрашивают то, что они не должны видеть.
here is that output from my visitors, feel free to block him:
IP: 67.212.188.154
URL: /th1s_1s_a_4o4.html
Bytes: 321
status: 301
referred: http://www.google.com/url?url=www.mywebsite.com&yahoo.com
UserAgent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/6.0)