Как преобразовать все символы в их эквивалент html-сущности с помощью PHP


Я хочу преобразовать это [email protected] в

hello@domain.com

Я пробовал:

url_encode($string)

Здесь содержится та же строка, которую я ввел, возвращенная с символом @, преобразованным в %40

Также пробовал:

htmlentities($string)

Это возвращает ту же строку обратно.

Я использую кодировку UTF8. не уверен, что это имеет значение....

Author: Artefacto, 2010-06-09

3 answers

Вот так (предполагается UTF-8, но это тривиально изменить):

function encode($str) {
    $str = mb_convert_encoding($str , 'UTF-32', 'UTF-8'); //big endian
    $split = str_split($str, 4);

    $res = "";
    foreach ($split as $c) {
        $cur = 0;
        for ($i = 0; $i < 4; $i++) {
            $cur |= ord($c[$i]) << (8*(3 - $i));
        }
        $res .= "&#" . $cur . ";";
    }
    return $res;
}

РЕДАКТИРОВАТЬ Рекомендуемая альтернатива с использованием unpack:

function encode2($str) {
    $str = mb_convert_encoding($str , 'UTF-32', 'UTF-8');
    $t = unpack("N*", $str);
    $t = array_map(function($n) { return "&#$n;"; }, $t);
    return implode("", $t);
}
 40
Author: Artefacto, 2010-06-20 12:20:47

Гораздо более простой способ сделать это:

function convertToNumericEntities($string) {
    $convmap = array(0x80, 0x10ffff, 0, 0xffffff);
    return mb_encode_numericentity($string, $convmap, "UTF-8");
}

Вы можете изменить кодировку, если используете что-то другое.

  • Фиксированный диапазон карт. Благодаря Артефакту.
 9
Author: SileNT, 2010-09-21 21:04:51
function uniord($char) {

     $k=mb_convert_encoding($char , 'UTF-32', 'UTF-8');

     $k1=ord(substr($k,0,1));

     $k2=ord(substr($k,1,1));

     $value=(string)($k2*256+$k1);

     return $value;

}

Вышеуказанная функция работает для 1 символа, но если у вас есть строка, вы можете сделать так

$string="anytext";

$arr=preg_split(//u,$string,-1,PREG_SPLIT_NO_EMPTY);

$temp=" ";

foreach($arr as $v){

    $temp="&#".uniord($v);//prints the equivalent html entity of string

}
 1
Author: BenjaBoy, 2014-05-06 11:28:38