web-crawlers pg. 2

задержка обхода: x------- кому-нибудь здесь удалось понять, как там работает математика?

Из предыдущих исследований, посвященных чтению различных статей, я понимаю, что robots.txt задержка обх ... к 8 640 страницам в день. Мой вопрос crawl-delay: x; кому-нибудь здесь удалось понять, как там работает математика?

seo robots.txt web-crawlers

Как запретить индексирование, но разрешить обход?

На главной странице моего веб-сайта у меня есть несколько предварительных просмотров статей (с небольши ... вводил ссылки в них, но я просто не хочу, чтобы это сохраняло информацию (которая будет повторена в полных статьях).

robots.txt googlebot web-crawlers search-engine-indexing duplicate-content

robots.txt блокировка определенных файлов также блокирует ненужные URL-адреса

Я использую Magento для одного из своих сайтов. В Magento есть файл mage (только имя файла без расширен ... e, например magenta-color-item.html. Как я пишу в роботе, чтобы заблокировать mage только не URL, начинающийся с mage?

url magento robots.txt web-crawlers

Понимание Ajax-обхода поискового сайта

У меня есть пара вопросов об обходе Ajax веб-сайта, который сам по себе является своего рода поисковой ... бавить карту сайта со ссылками на все результаты поиска? Есть ли какой-нибудь пример решения, описанный в статье выше?

url ajax seo google web-crawlers

Статус обходимого Ajax?

Я увидел, что у Google есть хорошее предложение/стандарт для обеспечения возможности обхода приложений ... ложение" уже в реальном мире? Другие поисковые системы, в частности Bing, также используют или планируют использовать его?

ajax seo google web-crawlers

Запретить обход всех страниц поиска

С помощью robots.txt Я пытаюсь остановить весь обход URL-адресов поиска Disallow: /rest_of_url/search ... p;tour-duration=1/ Остановит ли приведенный выше код Disallow роботов от обхода всех моих страниц результатов поиска?

robots.txt googlebot google google-search-console web-crawlers

Почему боты постоянно сканируют страницы моего сайта, которые я никогда не создавал?

В своих журналах я заметил, что много запросов поступало от разных ботов и веб-сканеров, но меня смутил ... мер, запретить роботам посещать /fpss/ в файле robots.txt, но я хотел бы понять, почему они это делают в первую очередь.

robots.txt web-crawlers

Искатель Facebook без агента пользователя, отправляющего спам на наш сайт при возможной DOS-атаке

Поисковые роботы, зарегистрированные на Facebook (ipv6, заканчивающийся на:face:b00c::1), захлопнули на ... по ссылке и попали по URL-адресу только для сеанса. Правка3: Facebook, похоже, подтвердил ошибку и ищет исправление .

facebook cloudflare ddos cdn web-crawlers

Просматривают ли поисковые системы ссылки со строками запросов?

Если бы у меня был URL-адрес, подобный https://example.com/books, который содержал бы несколько ссылок ... d=baz Будет ли там будут ли какие-либо различия/предпочтения? Или поисковая система будет сканировать и то, и другое?

url-rewriting seo htaccess web-crawlers search-engine-indexing

Должен ли я стратегически использовать NoFollow для внутренних ссылок, чтобы сделать наш обход индексации более эффективным?

У нас хорошо продуманная система внутренних ссылок, которая гарантирует, что ни одна страница не превыш ... ить достаточно хорошо в покое или должен ли я использовать "Nofollow" для внутренних ссылок на соответствующий контент?

seo google links web-crawlers search-engine-indexing

Как запретить Google выползать с моего сайта через изображения?

Я забочусь о веб-сайте, на котором есть несколько изображений, поступающих по внешним ссылкам. Дело в ... ages/*.jpg$ Disallow: /*.jpg$ Поскольку все наши личные изображения находятся в определенной папке. Сработает ли это?

robots.txt google web-crawlers

Поддельные ссылки вызывают ошибку обхода в инструментах Google для веб-мастеров

Google сообщил об ошибках сканирования на прошлой неделе на моем крупнейшем сайте с помощью инструментов ... огласно инструментам веб-мастера Google, эти ошибки появились в течение 11 дней. Ранее не сообщалось об ошибках обхода.

links google-search-console web-crawlers

Будут ли у Googlebot проблемы с обходом сайта, если у нас есть такие международные перенаправления, основанные на местоположении и файлах cookie?

Итак, у нас есть международный сайт с несколькими поддоменами для каждого языка. У нас есть разметка hr ... Является ли этот сценарий перенаправления плохим для SEO и наших рейтингов SERP? Если ДА, то как именно это вредит нам?

internationalization seo googlebot web-crawlers redirects

web-crawlers

задержка обхода: x------- кому-нибудь здесь удалось понять, как там работает математика?

Как запретить индексирование, но разрешить обход?

robots.txt блокировка определенных файлов также блокирует ненужные URL-адреса

Понимание Ajax-обхода поискового сайта

Статус обходимого Ajax?

Запретить обход всех страниц поиска

Почему боты постоянно сканируют страницы моего сайта, которые я никогда не создавал?

Искатель Facebook без агента пользователя, отправляющего спам на наш сайт при возможной DOS-атаке

Просматривают ли поисковые системы ссылки со строками запросов?

Должен ли я стратегически использовать NoFollow для внутренних ссылок, чтобы сделать наш обход индексации более эффективным?

Как запретить Google выползать с моего сайта через изображения?

Поддельные ссылки вызывают ошибку обхода в инструментах Google для веб-мастеров

Будут ли у Googlebot проблемы с обходом сайта, если у нас есть такие международные перенаправления, основанные на местоположении и файлах cookie?

Как bing-бот (это правильное имя паука?) и googlebot интерпретируют перенаправление 301?

Google продолжает сканировать несуществующие страницы

Предоставлять различный контент для веб-поисковиков, чтобы исправить SEO для SPA?

Как сделать перенаправление JavaScript на ту же страницу, не повредив моему SEO?

Две страницы имеют одинаковое название, одинаковое описание, разное содержание. Являются ли они дубликатами?

Поисковик изображений Google не будет уважать мой robots.txt запись, чтобы не сканировать изображения

Учитывается ли регистр имен агентов пользователей в robots.txt?