Как преобразовать все символы в их эквивалент html-сущности с помощью PHP
Я хочу преобразовать это [email protected]
в
hello@domain.com
Я пробовал:
url_encode($string)
Здесь содержится та же строка, которую я ввел, возвращенная с символом @, преобразованным в %40
Также пробовал:
htmlentities($string)
Это возвращает ту же строку обратно.
Я использую кодировку UTF8. не уверен, что это имеет значение....
15
3 answers
Вот так (предполагается UTF-8, но это тривиально изменить):
function encode($str) {
$str = mb_convert_encoding($str , 'UTF-32', 'UTF-8'); //big endian
$split = str_split($str, 4);
$res = "";
foreach ($split as $c) {
$cur = 0;
for ($i = 0; $i < 4; $i++) {
$cur |= ord($c[$i]) << (8*(3 - $i));
}
$res .= "&#" . $cur . ";";
}
return $res;
}
РЕДАКТИРОВАТЬ Рекомендуемая альтернатива с использованием unpack
:
function encode2($str) {
$str = mb_convert_encoding($str , 'UTF-32', 'UTF-8');
$t = unpack("N*", $str);
$t = array_map(function($n) { return "&#$n;"; }, $t);
return implode("", $t);
}
40
Author: Artefacto, 2010-06-20 12:20:47
Гораздо более простой способ сделать это:
function convertToNumericEntities($string) {
$convmap = array(0x80, 0x10ffff, 0, 0xffffff);
return mb_encode_numericentity($string, $convmap, "UTF-8");
}
Вы можете изменить кодировку, если используете что-то другое.
- Фиксированный диапазон карт. Благодаря Артефакту.
9
Author: SileNT, 2010-09-21 21:04:51
function uniord($char) {
$k=mb_convert_encoding($char , 'UTF-32', 'UTF-8');
$k1=ord(substr($k,0,1));
$k2=ord(substr($k,1,1));
$value=(string)($k2*256+$k1);
return $value;
}
Вышеуказанная функция работает для 1 символа, но если у вас есть строка, вы можете сделать так
$string="anytext";
$arr=preg_split(//u,$string,-1,PREG_SPLIT_NO_EMPTY);
$temp=" ";
foreach($arr as $v){
$temp="&#".uniord($v);//prints the equivalent html entity of string
}
1
Author: BenjaBoy, 2014-05-06 11:28:38