Аннотация:
В работе приведено решение для двух классических задач геометрической нормализации цифрового образа текста: компенсация глобального угла наклона документа и устранение локальных наклонов его текстовых фрагментов. Для обеих задач, отличающихся видом геометрических искажений, решение построено на базе единого метода анализа образа быстрого преобразования Хафа. Проведена конкретизация данного метода и предложены два алгоритма для решения указанных задач, а также проведена их апробация: для задачи нормализации наклона текста – на множестве как известных корпусов данных, так и на специально собранном и опубликованном корпусе кириллических фрагментов $K_{RUS}$; для задачи нормализации наклона документа – на популярном корпусе DISEC. Показано, что отличительной особенностью предложенного метода является высокое быстродействие с возможностью обработки большого диапазона углов, а сам метод может быть успешно применен в системах автоматической обработки изображений документов.
Ключевые слова:
нормализация изображений, быстрое преобразование Хафа, анализ изображений документов.