PHP iconv strlen вопрос
Что это значит, когда icon_strlen терпит неудачу в плохих последовательностях символов, в частностиcharacter sequences
- вот что я хочу знать. Спасибо
1 answers
A character sequence
- это последовательность байтов. При использовании UTF-8 не все комбинации байтов допустимы.
Последовательность байтов \xc2\xbc
образует символ Юникода U+00BC
, который является символом VULGAR FRACTION ONE QUARTER
(¼) при использовании кодировки UTF-8.
Последовательность байтов \xe2\x88\x9c
образует символ Юникода U+221C
, который является символом FOURTH ROOT
(∜) при использовании кодировки UTF-8.
Плохой последовательностью символов для кодировки UTF-8 будет любая комбинация байтов, которая не вписывается в требуемую схему для UTF-8 байтовые потоки, например, последовательность байтов \xbc\xbc
была бы незаконной, потому что два байтовых символа должны иметь 110xxxxx
в первом байте, но \xbc
10111100
записывается как биты.