Распознавание почерка всегда будет трудоемкой задачей. До получения значимого с
коммерческой точки зрения результата в этой области проходят годы - годы
исследований, годы разработки и годы воплощения теории в программу, которая могла бы
осуществлять хотя бы малую часть наглядной операции - преобразование начерченных
человеком кривых в буквы и цифры. Мы работаем над этим с 1996 года.
Наша позиция в распознавании почерка
Мы полагаем, что существует окончательное решение общей проблемы распознавания
почерка в режиме реального времени, которая может быть сформулирована как
"Преобразование набора цифровых рукописных траекторий в набор букв и/или
осмысленных слов на произвольном языке". Последние 5 лет исследований привели
нас к частному решению этой общей проблемы - мы получили технологию, которая
позволяет преобразовывать ряд цифровых траекторий в ряд букв для определенных
языков. Эта технология оказалась эффективной для распознавания алфавитов с различной
графической структурой - латинского, расширенного латинского, кириллического,
греческого и иврита.
Исследовательские обязательства
Ряд граничащих задач был поднят и разрешен для получения той технологии, которую мы
имеем к настоящему моменту. Список граничащих задач включает в себя разделение
близких/перекрывающихся рукописных символов, составление и распознавание составных
символов (из нескольких частей), разделение и сегментацию многострочного рукописного
текста, нормализацию наклона рукописных символов, нормализацию и предварительную
обработку цифровых рукописных траекторий, представление различных математических
функций в интегральной форме, быстрое целочисленное вычисление функций, дискретное
представление иррациональных кривых, автоматическое определение прописных букв,
автоматическое определение пробелов и многое другое. В стремлении предоставить
решение для слитного рукописного текста, мы продолжаем вести работу над технологией.
Последние исследования были сфокусированы на следующих проблемах: фрагментация и
композиция рукописных кривых в слитном (безотрывном) написании, интеграция
лингвистических и морфологических баз с модулем графического распознавания,
объединение графическо-лингвистического программного ядра для слитного
(безотрывного) написания.
Многоязычность
Мы считаем, что поддержка многоязычности - это необходимая часть задачи распознавания
рукописного текста. К настоящему моменту мы сделали наши решения применимыми почти
ко всем человеческим языкам. Слитное (безотрывное) написание возможно требует
включения лингвистических знаний в процесс распознавания. Тем не менее, первые
версии нашего ядра для распознавания слитного (безотрывного) написания помогли
выделить классы написаний, которые могут быть распознаны без лингвистического
анализа. Тема "широты" этих классов и тема их коммерческого использования
все еще находятся в процессе нашего исследования. Пока нет четких указаний на то,
что слитное написание требует лингвистической информации. Мы продолжаем
исследовательскую работу...
Демонстрация технологии
Одна из наиболее новых версий ядра распознавания PenReader доступна для онлайн-работы
в Java-апплете под Linux (SuSE) на нашем веб-сайте - попробуйте поработать с системой.
Стадия развития технологии и приложений
Технология, доступная в настоящий момент, выполняется на межплатформенном ядре C++ и
скомпилирована для следующих платформ: Wintel, Windows CE, Symbian и Palm OS.
Коммерческие продукты доступны для платформ Wintel и Windows CE. Следующая версия
разрабатывается для распространения в 2001 году: клиент-серверное Java-приложение
PenReader с поддержкой GPRS, PenReader для Symbian OS 6.0 и PenReader для Palm OS.