web-crawlers

Должен ли я блокировать поисковые системы с помощью robots.txt в моем приложении на Facebook?

На моей домашней странице есть несколько поддоменов, где я могу воспользоваться robots.txt блокировать ... жений Facebook или мне следует игнорировать это? Любая веская причина для разрешить поисковым системам сканировать его?

Как "Noindex:" в robots.txt работать?

Я наткнулся на эту статью в моих сегодняшних новостях SEO. Похоже, это подразумевает, что вы можете ... robots.txt директива, поддерживаемая Google и другими поисковыми системами? Работает ли это? Это задокументировано?

Использование robots.txt чтобы запретить доступ к специальным страницам MediaWiki, используя сопоставление подстрок

Я запускаю Медиавики в домене someurl.com/wiki/. К сожалению, он генерирует кучу автоматически сгенер ... archengines? Если нет, то как я могу деиндексировать это огромное количество автоматически сгенерированных URL-адресов?

Роботы: блокировать /язык/страницу из индекса, но сохранять /страницу

Моя структура URL-адресов выглядит примерно так: /group1/ /group2/ /group3/ Group3 ( и это подстрани ... ешить /group3 и /lang/group3, но заблокировать /lang/group* из индекса. Каков правильный синтаксис роботов для этого?

Как работают канонические теги, когда у вас несколько версий веб-сайта?

Прошу прощения за то, как расплывчато звучит вопрос; Я не смог написать полный вопрос в названии, потом ... этого поста давайте предположим, что предыдущие канонические теги веб-сайта были признаны поисковой системой надежными.

Как я могу гарантировать, что ссылка, отправленная по электронной почте, открывается только с помощью кликов пользователя из почтового клиента, а не ботов?

В моем веб-приложении я создаю ссылки в следующем формате: https://example.com/^token^ Каждая ссылка ... ена? Мое приложение находится в Laravel, и я использую комбинацию nginx и php-fpm для предоставления контента браузеру.

Может ли пользователь или искатель увидеть источник страницы, которая была перенаправлена через 301?

Может ли пользователь или веб-искатель увидеть содержимое/исходный код веб-документа, который автоматич ... ругую страницу с помощью перенаправления 301? Возможно ли это? Как пользователь может видеть содержимое веб-документа?

Google периодически не удается загрузить CSS и JS с CDN CloudFront

Мы заметили много ошибок "Удобства использования мобильных устройств" в консоли поиска. Когда я нажимал ... rk.com/ Есть ли у вас какие-либо идеи, что можно изменить, чтобы бот Google всегда мог загружать CSS с CDN CloudFront?

Боты Google и iframe

Вот в чем проблема: Допустим, у меня есть mydomain.com. В externaldomain.com/article/mydomain есть i ... e/mydomain или он заблокирует mydomain.com, потому что externaldomain.com robots.txt запретить доступ к папке /article?

Мы блокируем ботов, сканеры, пауков и инструменты сканирования на наших серверах. Может ли это повлиять на DA (полномочия домена)?

Я не знал понятия авторитета домена/страницы в SEO еще 1 час назад. Мы блокируем ботов, сканеры, пауков ... ботов влияет на результаты DA, как на этой странице? https://websiteseochecker.com/bulk-check-page-authority/ Спасибо.

Как Выследить и остановить Ботов-изгоев?

Большая часть пропускной способности одного сайта используется неопознанным ботом. Согласно данным AWST ... редела пропускной способности и превышена загрузка процессора для моего хоста, поэтому мне было отправлено уведомление.

Консоль поиска Google: 404 ошибки на существующих страницах

Существует небольшой веб-сайт возрастом несколько лет с очень небольшим количеством страниц (~5), котор ... ни другое. Попытался отправить sitemap.xml но это дает мне 404 ошибки и для этого тоже. Что вызывает это проблема?

Количество запросов страниц любым ботом за 5 секунд

Я пишу скрипт, который заблокирует любого бота, который запрашивает страницы, например X раз в прошлом 5 ... нд. Мне нужно найти крестик здесь. Ребята, вы знаете какие-нибудь приблизительные значения, которые я могу использовать?

Могут ли веб-поисковики найти вторичный robots.txt в подкаталоге?

У меня есть подкаталог, который я хотел бы скрыть от веб-искателей. Один из способов сделать это - ис ... едует ли использовать относительный или абсолютный пути? User-agent: * Disallow: /X/ Или User-agent: * Disallow: /

Как мне "неиндексировать" текстовый (.txt) файл?

У меня есть каталог, полный файлов .txt, которые используются как часть более крупного приложения javas ... ст тегом? Существует ли какой-либо другой способ неиндексировать текстовый файл извне? Или нет индекса общего каталога?

Поисковые системы все еще сканируют страницу noindex

Сканируют ли поисковые системы страницу, у которой есть мета-атрибут "noindex"? Причина, по которой я ... наруживаться как дубликаты? Должен ли я добавлять атрибут "nofollow" к ссылке, пока мы делаем эти страницы уникальными?

Является ли поиск Yahoo таким же, как поиск Bing сейчас?

У нас были некоторые серьезные проблемы с (невероятно) плохо написанным пауком Yahoo в прошлом , и в р ... дует рассмотреть возможность их разблокировки, если они каким-то образом, вопреки всему, остановились так сильно сосет?

Есть ли какая-либо причина разрешить Yahoo! Хлебать, чтобы сканировать мой сайт?

Я думал, что год или больше назад Yahoo! будет использовать другую поисковую систему для получения резу ... это связанный с этим вопрос, но я не думаю, что он полностью отвечает на вопрос, следует ли добавлять новый блок бота.

Перемещение сайта из одного поддомена в другой поддомен, что делать со страницами, которые не являются "отображаемыми"?

В процессе перемещения сайта из одного поддомена в другой поддомен. Для многих вложенных папок 301 пере ... делать тот. Смогут ли мета-роботы noindex, nofollow достичь как потери бюджета при обходе, так и выпадения из индекса?

Как заблокировать самые популярные сканеры-пауки с помощью robots.txt?

Я хочу запретить индексацию моего веб-сайта через robots.txt с помощью ботов-пауков MSN/Bing, Yahoo, As ... Или, может быть, я добавил что-то лишнее? Есть ли какой-либо официальный robots.txt правила для каждого веб-искателя?