- Советыпо получению изображений
- Настройкапараметров сканирования и открытия изображений В программе ABBYY FineReader вы можете менять общиеопции автоматической обработки документа, а также опции сканирования и открытиястраниц документа: включать/отключать автоматический анализ и автоматическоераспознавание документа, предобработку изображений, выбирать интерфейссканирования.
- Выбор интерфейсасканирования
- Настройка яркостисканирования
- Если в исходномизображении мелкий шрифт
- Если вы видитесообщение о необходимости изменить разрешение
- Сканированиекнижного разворота
- Каксфотографировать текст
- Автоматическаяпредобработка изображений
- Как обработатьизображение вручную
- Рекомендации пораспознаванию документа
- Настройкапараметров распознавания
Советыпо получению изображений
Качество распознавания зависит от качества исходного изображения и отвыбранных настроек сканирования.
● Настройка параметров сканирования и открытияизображений
● Выбор интерфейса сканирования
Подробнее о сканировании через интерфейс ABBYY FineReader и через интерфейс драйвера сканера, особенностях
этих интерфейсов и способе переключения между ними.
● Настройка яркости сканирования
● Если в исходном изображении мелкий шрифт
● Если вы видите сообщение о необходимостиизменить разрешение
● Сканирование книжного разворота
● Как сфотографировать текст
Данная статья поможет вам выбрать режим работы фотоаппарата и получитьснимок документа, пригодный для
распознавания текста.
● Автоматическая предобработка изображений
● Как обработать изображение вручную
Настройкапараметров сканирования и открытия изображений В программе ABBYY FineReader вы можете менять общиеопции автоматической обработки документа, а также опции сканирования и открытиястраниц документа: включать/отключать автоматический анализ и автоматическоераспознавание документа, предобработку изображений, выбирать интерфейссканирования.
Выбрать необходимые параметры вы можете непосредственно в диалогах открытияили сканирования изображений (если вы используете для сканирования интерфейсABBYY FineReader ), а также на закладке С канировать/Открыть диалога Опции (менюСервис>Опции…).
Внимание! Если вы изменили настройки программы вдиалоге Опции , то необходимо отсканировать или открытьизображение заново. Только после этого ваше изображение будет обработано суказанными настройками.
На закладке С канировать/Открыть диалогаОпции вы можете изменить следующие настройки:
● Запуск автоматического анализа ираспознавания полученных изображений.
Анализ и распознавание документа ABBYY FineReader по умолчанию выполняются автоматически. При необходимости вы можете изменитьэтот режим. Возможны следующие варианты:
● Автоматически распознавать полученныеизображения
Анализ и распознавание документа будут производиться автоматически.
● Автоматически анализировать полученныеизображения
Анализ документа будет выполняться автоматически, а распознавание нужнобудет запускать вручную.
● Отключить автоматический анализ ираспознавание изображения
Отсканированные или открытые изображения будут добавлены в документ FineReader . Анализ и распознавание
документа нужно будет запускать вручную. Такой режим, как правило, используетсядля документов, имеющих
сложную структуру.
● Способы обработки изображений.
● Выполнять предобработку изображений
Если вы хотите отсканировать и распознать книгу или открываете изображение,полученное с помощью
фотокамеры, включите эту опцию. Тогда программа, в зависимости от типа входногоизображения, выполнит его
предобработку: удалит шумы с цифровых фотографий, исправит перекос, нечеткость , искажение перспективы,
выровняет документ по линиям текста.
● Определять ориентацию страницы
Включите эту опцию для автоматического определения ориентации страниц,добавляемых в документ FineReader .
● Делить разворот книги
Если вы сканируете разворот книги или открываете изображения сдвоенныхстраниц, включите эту опцию. Тогда,
в процессе добавления страниц в документ FineReader ,изображения будут разделяться на отдельные страницы.
Замечание. Вы можете не использовать опциипредобработки изображений при сканировании или открытии страниц документа, авыполнить необходимую обработку в уже открытом документе с помощью редактораизображений.
Подробнее см. «Как обработать изображение вручную».
● Интерфейс сканера, который будетиспользоваться при сканировании.
Выбор интерфейсасканирования
В программе ABBYY FineReader возможны следующиеварианты взаимодействия программы со сканером:
1. Через интерфейс ABBYY FineReader .
В этом случае для настройки режима сканирования используется диалогпрограммы ABBYY FineReader . Он
позволяет устанавливать:
● Разрешение, яркость и тип изображения.
● Опции предобработки изображений:
● Определять ориентацию страницы — включите эту опцию для автоматического определения ориентациистраницы при сканировании
● Делить разворот книги — включите эту опцию для автоматического разбиения сдвоенных страницна отдельные изображения
● Выполнять предобработку изображений — включите эту опцию для выполнения автоматической обработкиотсканированных изображений
● Опции для сканирования многостраничныхдокументов:
● Использовать автоподатчик (ADF)
● Применять автоматическое двустороннеесканирование (если данная возможность поддерживается сканером)
● Установить задержку между сканированиемстраниц на указанное количество секунд
Замечание. Для некоторых моделей сканеров опция И спользовать интерфейс ABBYY FineReader может быть недоступна.
2. Через интерфейс TWAIN–драйвера сканера или WIA–драйвера сканера.
Для настройки опций сканирования используется диалог драйвера сканера. Видокна и описание его элементов вы
найдете в документации, прилагаемой к сканеру.
Внимание! Для того чтобы правильно подключитьсканер, обратитесь к документации, прилагаемой к устройству.
При установке не забудьте установить необходимое программное обеспечение,поставляемое вместе со сканером.
По умолчанию сканирование выполняется через интерфейс ABBYY FineReader .
Вы можете легко переключать интерфейс сканирования:
1. Откройте диалог Опции на закладке С канировать/Открыть(меню Сервис>Опции…).
2. В группе Сканер установите переключатель в одно из положений: Использоватьинтерфейс ABBYY FineReader или
И спользовать интерфейс сканера.
Настройка яркостисканирования
Если яркость сканирования была подобрана неверно, при распознаваниивозникнет сообщение о необходимости
изменить яркость сканирования. Для сканирования некоторых документов вчерно–белом режиме может понадобиться дополнительная настройка яркости.
Как изменить яркость:
1. Нажмите кнопку С канировать.
2. В открывшемся диалоге укажите яркость.
В зависимости от используемого интерфейса сканирования, откроется диалогсканирования ABBYY FineReader или диалог драйверасканера. В большинстве случаев подходит среднее значение яркости — 50%.
3. Отсканируйте изображение.
Если в полученном изображении вы обнаружили большое количество дефектов(разрывов или склеек букв), то обратитесь к таблице, приведенной ниже. В ней указаны возможные способы их устранения.
Особенности входного изображения
Пример хорошего (пригодного для распознавания)
«разорванные»; светлые, тонкие буквы
● Уменьшите яркость (чтобы изображение стало темнее)
● Отсканируйте в сером (в этом случае осуществляется автоподбор яркости)
искаженные и залитые; склеенные символы; темные ,
● Увеличьте яркость (сделать изображение светлее)
● Отсканируйте в сером (в этом случае осуществляется автоподбор яркости)
Если в исходномизображении мелкий шрифт
Для успешного распознавания текста с мелким шрифтом необходимо отсканироватьдокумент с более высоким
разрешением.
1. Нажмите кнопку С канировать.
2. В открывшемся диалоге укажите разрешение.
В зависимости от используемого интерфейса сканирования, откроется диалогсканирования ABBYY FineReader или
диалог драйвера сканера.
3. Отсканируйте изображение.
Сравните результаты сканирования одного и того же документа с разнымизначениями разрешения. Для этого просмотрите полученные изображения в окне Крупныйплан в масштабе С точностью до пикселя (менюВид>Окно Крупный план>Масштаб):
Особенности входного изображения
300 dpi — для обычных текстов (размер шрифта 10 и более пунктов).
400–600 dpi — для текстов, набранных мелким шрифтом (9 и менее пунктов).
Если вы видитесообщение о необходимости изменить разрешение
Разрешение изображения показываетнасколько детальным является данное изображение.Разрешение обычно
измеряется в dpi ( dots per inch ) — количестве точек,приходящихся на один дюйм.
Разрешение, оптимальное для распознавания, равно 300 dpi .
Внимание! Для качественного распознавания текстанеобходимо, чтобы разрешение изображения по вертикали и по горизонталисовпадало.
Слишком большое разрешение (более 600 dpi )приводит к увеличению времени распознавания текста. При этом качествораспознавания существенно не улучшится. Слишком маленькое разрешение (менее 150 dpi ) может приводить к ухудшению качествараспознавания.
Ситуации, когда может появляться сообщение о коррекции разрешения:
● Если разрешение изображения меньше 250 dpi или больше 600 dpi .
● Если изображение имеет нестандартноеразрешение.
Например, факсы могут иметь разрешение 204*96 dpi .
Как изменить разрешение:
1. Нажмите кнопку С канировать.
2. В зависимости от используемого интерфейса сканирования, откроется диалогсканирования ABBYY FineReader или диалог драйверасканера.
В диалоге сканирования выберите нужное разрешение.
3. Отсканируйте изображение.
Совет. Также вы можете исправить разрешение вдиалоге Редактор изображений (меню Страница >Р едактироватьизображение страницы…).
Сканированиекнижного разворота
При сканировании книжного разворота две страницы попадают на одноизображение.
Для повышения качества распознавания необходимо разделить такое изображение надва. В программе существует специальный режим, при котором книжный разворотавтоматически разделяется на две части и превращается в две отдельные страницыдокумента ABBYY FineReader .
Как отсканировать книжный разворот или сдвоенные страницы:
1. Откройте диалог Опции на закладке С канировать/Открыть(меню Сервис>Опции…).
2. В группе Обработка изображения отметьте опцию Д елитьразворот книги.
3. Отсканируйте страницы.
Опция автоматического разделения сдвоенных страниц имеетсятакже в диалоге открытия изображений (меню
Файл >О ткрыть PDF/изображение… ) и в диалоге сканирования ABBYY FineReader . Подробнее см. «Выбор интерфейса сканирования».
Внимание! Если изображение содержит текст накитайском или японском языке, воспользуйтесь редактором изображений для разделения страниц вручную. Автоматическое разделение страницы длятаких изображений не поддерживается.
Как разделить страницу на две вручную:
1. Откройте диалог Редактор изображений (меню Страница >Р едактироватьизображение страницы…).
2. С помощью опций группы Р азбить разделитестраницу.
Каксфотографировать текст
Фотосъемка документов требует определенной подготовки фотографа, а также налагает ограничения на характеристики
фотоаппарата и режим съемки .
Замечание. Технические параметры вашего фотоаппаратаи инструкции по работе с ним приведены в описании вашего устройства и другойприлагаемой к нему документации.
Перед съемкой убедитесь в том, что:
1. Страница целиком умещается в кадре.
2. Свет достаточно ровный, без теней на фотографируемом тексте.
3. Объектив располагается параллельно поверхности съемки и по центру фотографируемого изображения. Неровности бумаги (например, укорешка книги) нужно по возможности разгладить.
Ниже приведены требования к фотоаппарату и рекомендации по выбору режима съемки .
Требования к фотоаппарату
● Размер матрицы: вычисляется пропорциональноформату страницы изображения, из расчета 2 млн.пикселов для формата А 4 . Соответственно, для съемки страниц небольшого формата, например, визитныхкарточек, размер матрицы может быть меньше.
● Переменная дистанция фокусировки. Нерекомендуется использовать фотоаппараты с фиксированным фокусом
( сфокусированные на гиперфокальное расстояние).Такие камеры обычно встречаются в сотовых телефонах и КПК.
● Размер матрицы: вычисляется пропорциональноформату страницы изображения, из расчета 5 млн.пикселов для формата А 4 .
● Возможность отключения фотовспышки.
● Возможность установки диафрагмы вручную —т.е. наличие режима приоритета диафрагмы или ручного режима.
● Режим ручной фокусировки.
● Объектив с оптической стабилизациейизображения, при его отсутствии рекомендуется использовать штатив.
Рекомендации по проведению фотосъемки
По возможности обеспечьте хорошее освещение, лучше всего дневное. Еслииспользуется подсветка, то лучше
использовать подсветку двумя лампами с разных сторон, чтобы избежатьобразования теней.
Как располагать фотоаппарат
Для съемки документов рекомендуется использоватьштатив. Объектив должен располагаться параллельно поверхности съемки и по центру фотографируемого изображения.
Фотоаппарат должен быть удален от страницы настолько,чтобы при максимальном оптическом увеличении страница полностью умещалась вкадре. Обычно это расстояние около 50–60 см.
Если освещение позволяет, вспышку лучше всего отключить, поскольку она создает пересвеченные области ирезкие
тени. При недостаточном освещении, если съемка ведется с достаточного расстояния (
50 сантиметров), можноиспользовать вспышку.
Замечание. При использовании вспышки желательноподсветить документ.
Внимание! Категорически не рекомендуетсяиспользовать вспышку при съемке документов,отпечатанных на глянцевой бумаге.
По возможности установите баланс белого по цвету бумаги. Если вашфотоаппарат не позволяет произвольно задавать
баланс белого, выберите режим, максимально отвечающий условиям съемки .
Что делать если.
Недостаточно освещения для фотосъемки
При недостаточном освещении рекомендуется:
● Выбрать небольшое значение диафрагмы,т.е. максимально открыть диафрагму. Если съемка ведется при ярком дневном свете, значение диафрагмы лучшеувеличить, чтобы получить более резкий снимок.
● Выбрать большую чувствительность матрицы (большеезначение ISO).
● Использовать ручную фокусировку, так какавтоматический фокус может срабатывать плохо (аппарат не можетсфокусироваться).
Снимок слишком темный и неконтрастный
Постарайтесь улучшить освещение. Если такой возможности нет — установитеменьшее значение диафрагмы.
Возможно, автофокус плохо срабатывает из–за отсутствия света. Попробуйтеулучшить освещение. Если это не помогает, используйте ручную фокусировку.
Если нерезкая только часть снимка — попробуйте выставить большее значение диафрагмы.Снимайте с большего расстояния при максимальном оптическом увеличении. Наводитефокус на точку, расположенную между центром и
краем изображения.
При недостаточном освещении в автоматическом режиме используются большиевыдержки, что отрицательно сказывается на резкости получаемого изображения.Поэтому рекомендуется дополнительно:
● Использовать стабилизатор изображения.
● Использовать автоспуск. Это позволитизбежать подрагивания камеры при нажатии на кнопкуспуска. Такие проблемы могут возникать даже при наличии штатива.
Вспышка создает пересвеченную область в центре кадра.
Отключите вспышку. Если нет возможности использовать другие источники света,снимайте с большего расстояния.
Автоматическаяпредобработка изображений
На качество распознавания могут отрицательно влиять искажение строк,перекос, наличие шумов и другие дефекты,
которые свойственны отсканированным изображениям и цифровым снимкам.
Для устранения подобных дефектов в программе предусмотрена опция автоматическойпредобработки изображений.
Если она включена, то, в зависимости от типа входного изображения, программасама определит, какая корректировка необходима, и выполнит её: удалит шумы сцифровых фотографий, выровняет изображение при перекосе, выровняет документ полиниям текста, исправит искажение перспективы.
Замечание. Для выполнения данной операции можетпотребоваться значительное время.
Чтобы при сканировании и открытии изображений выполнялась их автоматическаяпредобработка:
1. Откройте диалог Опции (меню Сервис>Опции…).
2. Убедитесь, что на закладке С канировать/Открыть вгруппе Обработка изображения отмечена опция Выполнять предобработкуизображений.
Внимание! Включать/отключать опцию автоматическойпредобработки можно также в диалоге открытия изображений
(меню Файл >О ткрыть PDF/изображение…) и вдиалоге сканирования ABBYY FineReader . Подробнее см.«Выбор интерфейса сканирования».
Замечание. Если в процессе сканирования или открытияизображений опция В ыполнятьпредобработку изображений
была отключена, вы можете отредактировать изображение вручную с помощьюредактора изображений.
Как обработатьизображение вручную
ABBYY FineReader 10 позволяет проводитьавтоматическую предобработку изображений — когда программа сама
определяет, какая корректировка необходима для данного изображения, и выполняет ее .
Но иногда бывает нужно обработать изображение вручную, например, еслинеобходимо распознать не всё изображение,
а только его часть, или обработать не все страницы документа, а выборочно.
Как обработать изображение вручную:
1. Откройте диалог Редактор изображений (меню Страница >Р едактироватьизображение страницы…).
В левой части данного диалога отображается текущая страница открытого в данныймомент документа ABBYY FineReader , под ней расположеннавигатор по страницам, а в правой части диалога расположены инструменты дляобработки изображений.
2. Инструменты редактора изображений позволяют:
● Исправить перекос —выровнять перекос изображения
● Фотокоррекция — устранить неровность строк текста, шумы и нечеткость изображения
● Трапециевидные искажения — исправить искажение перспективы
● Повернуть и отразить —повернуть изображение, чтобы привести те кст к ст андартномунаправлению
(горизонтально, слева направо)
● Разбить — разбитьизображение на отдельные изображения, например, разделить сдвоенную страницу
● Обрезать — удалитьненужные края изображения
● Инвертировать —инвертировать цвета на изображении, чтобы привести те кст к ст андартномувиду ( темный текст на светлом фоне)
● Разрешение изображения — изменить разрешение изображения
● Ластик — удалитьчасть изображения
Нажмите кнопку нужного инструмента и выполните необходимые операции.Результат можно сразу увидеть в левой
части диалога. Большинство инструментов вы можете применить сразу ко всемизображениям страниц документа,
отметив опцию П рименить ко всем изображениям.
3. После выполнения всех необходимых действий закройте диалог системной кнопкой .
Рекомендации пораспознаванию документа
В этом разделе описывается, как настроить параметры распознавания,приводятся нестандартные ситуации, решение
которых может потребовать некоторых дополнительных настроек. Вы узнаете овозможных причинах возникновения ошибок и ухудшения качества распознавания, атакже о том, как устранить некоторые проблемы и, по возможности,
избежать их возникновения.
● Настройка параметров распознавания
● Если в исходном документе сложная структураи после распознавания она не сохранилась
● Редактирование формы и положения областей
● Если картинка на странице выделенанеправильно
● Если штрих–код на странице не найден
● Если таблица на странице не найдена
● Если в таблице неправильно выделены ячейки
● Как отредактировать свойства текста
● Если вертикальный или инвертированный текстне распознался
● Если в исходном документе есть декоративные(нестандартные) шрифты
● Если в распознанном тексте некорректноотображается шрифт или на месте некоторых букв стоят значки «?» или
Настройкапараметров распознавания
Правильно установленные параметры распознавания помогут вам быстро получить качественныйдокумент, пригодный
для дальнейшего редактирования. Выбор параметров зависит не только от объема и сложности исходного документа, но и от того, каквы намерены использовать распознанный документ.
Выбрать необходимые параметры вы можете на закладке Р аспознатьдиалога Опции (меню Сервис>Опции…). Внимание! Распознаваниестраниц, добавленных в документ ABBYY FineReader ,выполняется в автоматическом режиме с текущими настройками программы. Вы можетеотключить автоматический анализ и распознавание добавленных изображений назакладке С канировать/Открыть диалога Опции(меню Сервис>Опции…).
Замечание. Если вы изменили язык распознавания,выделили области на изображении вручную или изменили другие настройкипрограммы, выполните распознавание заново.
На закладке Р аспознать диалога Опциивы можете изменить настройки для следующих групп опций:
Выберите один из режимов распознавания.
В ABBYY FineReader 10 предусмотрено два режимараспознавания:
Данный режим пригоден для распознавания как простых, так и сложныхдокументов. Например, для документов,
содержащих текст на цветном фоне, или для документов, содержащих таблицы, в томчисле таблицы без линий сетки и таблицы с цветными ячейками.
Замечание. По сравнению с Быстрым режимом распознавания, Тщательный режим требуетбольше времени,
но обеспечивает лучшее качество распознавания.
Данный режим рекомендуется для обработки больших объемов документов с простым оформле
Источник