Распознавание рукописного текста php
Я подумываю о создании определенной веб-системы. В нем участвует множество разных (случайных) людей, загружающих отсканированные документы того, что они написали.
Существует ли какой-либо способ PHP с открытым исходным кодом, преобразующий эти рукописные тексты в машинный текст?
Я нашел этот вопрос , но хотел бы знать, способен ли он распознавать множество случайных и разных людей, пишущих?
Есть ли у кого-нибудь опыт, которым можно поделиться в этой области?
3 answers
См. Связанный вопрос по SO: распознавание рукописного текста с помощью простого обучения
Распознавание рукописного текста на основе изображений также известно как Автономное распознавание рукописного текста .
Если рукописные символы всегда прописные буквы, стиль почтового отделения , это может быть обработано Интеллектуальным распознаванием символов (ICR), основанным на изображениях.
Разница между автономным (на основе изображений) и интерактивным (в реальном времени) распознаванием заключается в том, что последнее требует, чтобы вы записывали метку времени (положение и скорость) каждого штриха по мере его записи.
Механизм распознавания на основе изображений может обрабатывать оперативные данные путем преобразования штрихов с временной меткой в изображение. Напротив, механизм онлайн-распознавания не может обрабатывать входные данные на основе изображений. Таким образом, онлайн-распознавание технически проще, и доступны проекты с открытым исходным кодом.
Несколько статей Википедии содержат списки программного обеспечения OCR/ICR поставщики услуг:
- http://en.wikipedia.org/wiki/List_of_optical_character_recognition_software
- http://en.wikipedia.org/wiki/Intelligent_character_recognition
Пример механизма онлайн-распознавания рукописного текста (с открытым исходным кодом):
Я сделал распознавание текста с php с помощью tesseract-ocr
Http://code.google.com/p/tesseract-ocr/
Результаты были не так уж велики, и я сомневаюсь, что он поддерживает рукописный ввод, но мне было бы интересно посмотреть, что сделали другие
Это невозможно, так как почерк слишком сильно отличается, чтобы компьютерная программа могла найти шаблон для распознавания текста в нем. Вы можете попробовать использовать OCR, в идеале с библиотекой, которая хорошо взаимодействует с PHP, например, через оболочку для начала. См. Ocrad - Распознавание GNU.