Как записать файл в формате UTF-8?
У меня есть куча файлов, которые не в кодировке UTF-8, и я конвертирую сайт в кодировку UTF-8.
Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохранены в старой кодировке:
header('Content-type: text/html; charset=utf-8');
mb_internal_encoding('UTF-8');
$fpath="folder";
$d=dir($fpath);
while (False !== ($a = $d->read()))
{
if ($a != '.' and $a != '..')
{
$npath=$fpath.'/'.$a;
$data=file_get_contents($npath);
file_put_contents('tempfolder/'.$a, $data);
}
}
Как я могу сохранять файлы в кодировке utf-8?
10 answers
File_get_contents/file_put_contents не будут волшебным образом преобразовывать кодировку.
Вы должны преобразовать строку явно; например, с помощью iconv()
или mb_convert_encoding()
.
Попробуйте это:
$data = file_get_contents($npath);
$data = mb_convert_encoding($data, 'UTF-8', 'OLD-ENCODING');
file_put_contents('tempfolder/'.$a, $data);
Или, альтернативно, с потоковыми фильтрами PHP:
$fd = fopen($file, 'r');
stream_filter_append($fd, 'convert.iconv.UTF-8/OLD-ENCODING');
stream_copy_to_stream($fd, fopen($output, 'w'));
Добавить спецификацию: UTF-8
file_put_contents($myFile, "\xEF\xBB\xBF". $content);
<?php function writeUTF8File($filename,$content) { $f=fopen($filename,"w"); # Now UTF-8 - Add byte order mark fwrite($f, pack("CCC",0xef,0xbb,0xbf)); fwrite($f,$content); fclose($f); } ?>
Iconv спешит на помощь.
В Unix/Linux в качестве альтернативы можно использовать простую команду оболочки для преобразования всех файлов из заданного каталога:
recode L1..UTF8 dir/*
Также может быть запущен с помощью PHPs exec().
//add BOM to fix UTF-8 in Excel
fputs($fp, $bom =( chr(0xEF) . chr(0xBB) . chr(0xBF) ));
Я получил эту строчку от Круто
Если вы хотите использовать рекурсивное перекодирование и фильтр по типу, попробуйте следующее:
find . -name "*.html" -exec recode L1..UTF8 {} \;
Это работает для меня.:)
$f=fopen($filename,"w");
# Now UTF-8 - Add byte order mark
fwrite($f, pack("CCC",0xef,0xbb,0xbf));
fwrite($f,$content);
fclose($f);
Я собрал все вместе и получил простой способ конвертировать текстовые файлы ANSI в "UTF-8 Без метки":
function filesToUTF8($searchdir,$convdir,$filetypes) {
$get_files = glob($searchdir.'*{'.$filetypes.'}', GLOB_BRACE);
foreach($get_files as $file) {
$expl_path = explode('/',$file);
$filename = end($expl_path);
$get_file_content = file_get_contents($file);
$new_file_content = iconv(mb_detect_encoding($get_file_content, mb_detect_order(), true), "UTF-8", $get_file_content);
$put_new_file = file_put_contents($convdir.$filename,$new_file_content);
}
}
Использование: filesToUTF8('C:/Temp /','C:/Temp/conv_files /','php, txt');
- Откройте свои файлы в записной книжке Windows
- Измените кодировку на кодировку UTF-8
- Сохраните свой файл
- Попробуйте еще раз! :O)