Необходимо ли использовать HTML-объекты (для символов, зависящих от языка) в UTF-8?


Как в теме письма. Видел ситуацию на днях на странице, которая показалась мне странной. За исключением символов, разделяющих разметку, таких как заостренные скобки или амперсанд, экранирование, скажем, немецких умлаутов не должно быть необходимым, не так ли?

Проверил кодировку на стороне сервера, на странице и в заголовках HTTP, для меня она выглядит полностью UTF-8.

Как вы относитесь к этому и считаете ли вы, что это может негативно повлиять на SEO или размещение в поисковой выдаче?страница

Author: Jacob Hume, 2011-03-15

2 answers

Вы правы, до тех пор, пока вы можете быть уверены, что используете UTF-8 до конца, вам не нужно будет избегать ничего, кроме упомянутых вами XML-сущностей (, &).

Я думаю, что причина, по которой вы видите, как люди убегают от других персонажей, заключается в том, что они стали немного "контуженными", когда UTF-8 был преобразован в другую кодировку и все их красивые символы превратились в высокие прямоугольники или бриллианты с вопросительным знаком в них, что выглядит настолько непрофессионально, насколько это возможно.

Это должно произойти только один или два раза в производственной среде, чтобы вы начали рефлексивно изменять все на HTML-объекты.

Объедините это с тем фактом, что текстовые редакторы, языки сценариев и механизмы баз данных имеют возможность изменять кодировку текста на вас... Я не могу сказать, что слишком сильно их виню.

Но, короче говоря, если вы можете гарантировать, что у вас не будет ничего, кроме UTF-8 от источника до обслуживаемых страниц нет никаких технических причин что-либо избегать.

 3
Author: Jacob Hume, 2011-03-15 11:57:36

Вот почему существуют эти заголовки и атрибуты: чтобы указать, какой набор символов используется на странице. Документы XML/XHTML должны содержать его в открывающем теге xml, а документы HTML должны содержать его в метатеге . Если на странице указана правильная кодировка (и кодировка файла действительно совпадает), то поисковые системы должны быть достаточно умны, чтобы понять это - в конце концов, они претендуют на вознаграждение за соответствие стандартам и хороший дизайн (и UTF-8 в целом принято).

 3
Author: dmsnell, 2011-03-15 11:57:23