Растровая графика в Photoshop CS8

         

Варианты изображения, оцифрованные...


Варианты изображения, оцифрованные с разной яркостью. От установленной яркости зависит плотность литер, которая решающим образом влияет на результативность распознавания

Следует отметить, что невозможно задать оптимальный уровень яркости умозрительно, для этого требуется провести серию пробных сеансов оцифровки. Программы распознавания символов не приспособлены для такой работы, поэтому они не предоставляют пользователю удобных средств подбора яркости. Эта ситуация дает еще один весомый аргумент в пользу тезиса, который автор не раз отстаивал в этой книге. Всю препроцессорную обработку изображений лучше выполнять средствами специализированного растрового редактора. Применительно к распознаванию это означает, что документ следует сканировать в режиме Grayscale, затем открыть его в Photoshop и в его среде провести всю необходимую подготовку для успешного распознавания.
Алгоритмы работы систем распознавания закрыты от пользователя, но все программы этого класса демонстрируют несколько общих особенностей поведения. Идеальным оригиналом для любой программы распознавания является белая плотная страничка, набранная рубленым шрифтом 12 кегля (например, Arial или Prag-matica), не имеющая графических вставок, цветного фона, загрязненных фрагментов, малоупотребительных слов, фрагментов на иностранных языках, пометок на полях, математических и химических формул, перегибов и разрывов и при этом набранная в одну колонку. Все отклонения от этого идеала в большей или меньшей степени усложняют работу системы распознавания.



Содержание раздела