Проблема извлечения из текста с помощью PDFReader API
Я помешивая класс PDFreader для извлечения текста из PDF документа.
Я сделал документ, а просто сделать тест, где только я даю include в файл PDFreader.class.php
и прошел путь PDF с вызова, указанная в файле примера в папке examples
.
Когда я пытаюсь выполнить этот файл для меня, чтобы вернуть текст в PDF отображается следующее сообщение об ошибке:
Notice: Undefined index: Font in C:\setti\www\dg\t2\PDFreader\PDFpage.class.php on line 317
Следующий код в мой файл:
<html xmlns="http://www.w3.org/1999/xhtml" lang="pt-br" xml:lang="pt-br">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<body>
<?php
include ('PDFreader.class.php');
$PDF = new PDFreader();
try {
$PDF->open('t1t.pdf');
$text = $PDF->readText();
}
catch(PDFexception $e) {
echo '<p style="color: #FF0000; font-weight: bold; text-align: center;">';
echo "$e</p>\n";
}
echo "<h2>Decoded text</h2>
<p>\n";
foreach ($text as $row) {
echo "$row<br />\n";
}
echo "</p>\n";
?>
</body>
</html>
Как это исправить?
1 answers
Код, который вы опубликовали, работает в OS X. На веб - package мы видим следующее:
, Акцент мой: Может быть, что для работы в Windows.
И время последнего обновления 2010 года, думаю, что работать в системе (C:\
) будет... сложный.
Параметры:
Что Делает этот поиск, нашла Q&A в Stack Overflow с различными предложениями: Is there a PDF parser for PHP?. В дополнение к ответам, отображаемых, есть пара удалены, чьи ссылки могут быть полезны здесь: