PHP iconv strlen вопрос


Что это значит, когда icon_strlen терпит неудачу в плохих последовательностях символов, в частностиcharacter sequences - вот что я хочу знать. Спасибо

Author: Stefan Gehrig, 2011-06-13

1 answers

A character sequence - это последовательность байтов. При использовании UTF-8 не все комбинации байтов допустимы.

Последовательность байтов \xc2\xbc образует символ Юникода U+00BC, который является символом VULGAR FRACTION ONE QUARTER (¼) при использовании кодировки UTF-8.

Последовательность байтов \xe2\x88\x9c образует символ Юникода U+221C, который является символом FOURTH ROOT (∜) при использовании кодировки UTF-8.

Плохой последовательностью символов для кодировки UTF-8 будет любая комбинация байтов, которая не вписывается в требуемую схему для UTF-8 байтовые потоки, например, последовательность байтов \xbc\xbc была бы незаконной, потому что два байтовых символа должны иметь 110xxxxx в первом байте, но \xbc10111100 записывается как биты.

 4
Author: Stefan Gehrig, 2011-06-13 11:42:38