Проблема извлечения из текста с помощью PDFReader API

Question

Проблема извлечения из текста с помощью PDFReader API

Я помешивая класс PDFreader для извлечения текста из PDF документа. Я сделал документ, а просто сделать тест, где только я даю include в файл PDFreader.class.php и прошел путь PDF с вызова, указанная в файле примера в папке examples.

Когда я пытаюсь выполнить этот файл для меня, чтобы вернуть текст в PDF отображается следующее сообщение об ошибке:

Notice: Undefined index: Font in C:\setti\www\dg\t2\PDFreader\PDFpage.class.php on line 317

Следующий код в мой файл:

<html xmlns="http://www.w3.org/1999/xhtml" lang="pt-br" xml:lang="pt-br">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<body>
<?php
include ('PDFreader.class.php');

$PDF = new PDFreader();
try {
    $PDF->open('t1t.pdf');
    $text = $PDF->readText();
}
catch(PDFexception $e) {
    echo '<p style="color: #FF0000; font-weight: bold; text-align: center;">';
    echo "$e</p>\n";
}

echo "<h2>Decoded text</h2>
<p>\n";
foreach ($text as $row) {
    echo "$row<br />\n";
}
echo "</p>\n";
?>
</body>
</html>

Как это исправить?

1

php

Author: brasofilo, 2014-06-11

Source

1 answers

score 1 · Accepted Answer

Код, который вы опубликовали, работает в OS X. На веб - package мы видим следующее:

, Акцент мой: Может быть, что для работы в Windows.
И время последнего обновления 2010 года, думаю, что работать в системе (C:\) будет... сложный.

Параметры:

Что Делает этот поиск, нашла Q&A в Stack Overflow с различными предложениями: Is there a PDF parser for PHP?. В дополнение к ответам, отображаемых, есть пара удалены, чьи ссылки могут быть полезны здесь: