Лекция №18

ТЕМА: Сканируем документы, FineReader

 

1. ЦЕЛЬ РАБОТЫ

Ознакомиться со сканированием документов. Вставкой рисунков в текст. Распознавание текста. Сохранением документов в виде графики и текста. Использование сканера как копира.

 

2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

 

2.1. Коротко о главном

Программы, поставляемые со сканером

Вы купили сканер. Перед этим Вы должны были решить для чего он Вам. Сканер нужен для ввода в компьютер бумажной документации (оцифровка документов, чертежей, графиков, распознавания текста). Это в общем. Что он будет делать конкретно у Вас?

         Если сканер нужен для распознавания текста, то в этом случае подойдет любой, даже самый дешевый. Нет смысла покупать дорогой, потому что возможности, заложенные в дорогом (например, сканирование фотопленки), Вами никогда (возможно) не будут востребованы. А стоить эти возможности могут не одну «лишнюю» тысячу.

         В зависимости от поставщика, производителя сканера, Вы получаете вместе с ним еще небольшую кучку программ, на одно, двух или даже нескольких дисках. Всегда со всеми сканерами вместе идут драйвера для различных операционных систем, руководство пользователя, написанное в файлах с расширением .pdf, которые открываются программой «Акробатом». Как правило, директ-скан менеджер сканера, Твайн-драйвер, специальная программа для работы со сканером, что бы операционная система его понимала, какой-нибудь простенький нерусифицированный графический редактор и «немолодая» (не последняя) версия программы для распознавания текста под названием FineReader.

            Нет особого смысла ставить все. Ограничьтесь только драйверами. Программы от третьих разработчиков будут работать и быстрее и лучше и на русском языке. Хотя не факт, что наше мнение обязательно должно совпадать с Вашим. Совместимость у программ сверху вниз, а не наоборот. А это значит, что файл созданный в более ранней программе всегда откроется более современной. Но файл созданный современной версий программы уже не откроется более старой версией. Акробат установленный с диска, конечно, откроет те файлы, что записаны на этом диске. Но не факт, что завтра к Вам не попадут файлы акробата шестой версии, а все программы до шестой, уже не смогут их открыть. Так какой смысл, ставить акробат версии ниже шестой? Это же касается и архиваторов. Только третья версия и выше. Речь идет о WinRar, но это касается абсолютного большинства программ работающих на компьютере, и Офис не исключение.

Сканирование в Microsoft Office

После установки Microsoft Office, если Вы сделали полную установку всех его компонентов, а не подрезали его по своему усмотрению, у Вас в папке (строке) Все программы, Главного меню, появилась строка Microsoft Office. При наведении на нее курсора мыши, откроется меню, в котором самая верхняя строка Средства Microsoft Office, а в нем есть строка Microsoft Office Document Scanning с таким вот значком:

Все на русском языке и до безобразия понятно. На то он и Офис. Предполагаем, что у Вас стоит версия Офиса 2003. Тогда все сказанное выше верно, если нет, извините, что-то подобное все равно есть.

После сканирования рисунок картинки будет сброшен в программу Microsoft Office Document Imaging, находясь в которой Вы имеете возможность распознать текст из картинки и сбросить его прямо в Microsoft Word. Свою работу программа сделала добросовестно, одна беда, писана она в Америке, и качественно распознать (выделить из рисунка русские буквы, так как это делает FineReader) она не может. Текст распознан, но ошибок в нем многовато. Поэтому мы далее поговорим, как это делает другая программа, а работу Офиса по распознаванию текста давайте оставим новичкам.

Вставка картинки в текст (документ)

            Зато очень удобно использовать Офис, если Вам надо вставить в документ, набираемый в Worde, картинку со сканера. Тут он блещет во всей красе. Запускаем Word. Жмем на слово Вставка в строке меню, Рисунок, Со сканеры или камеры …. Открывается окно, показанное на рисунке:

            Естественно, вверху Ваш сканер. Вы определяетесь, что желаете делать с фото дальше: печатать или передать через Интернет. Если для печати, то размер файла будет большим, качество высокое. Если для Интернет, то файл получится поменьше и качество поскромнее. Если желаете, можете добавить рисунок в коллекцию картинок, для истории. Далее выбираете Вставка или Специальная вставка. Специальная вставка дает дополнительные возможности, если они Вам нужны.

            Запускается программа сканирования, которая в конечном итоге сбросит отснятый рисунок в то место файла, где находился курсор в момент вызова этой возможности.

            Есть смысл щелкнуть правой клавишей мыши по полученному рисунку и выбрать строку Отобразить панель настройки изображения. В появившейся панели есть много кнопок, которые Вам без сомнения помогут. Например, такие как: светлее, темнее, увеличить (уменьшить) контрастность, изменить обтекание объекта текстом, обрезать, и т.д. Используйте Обтекание текстом по контуру или перед текстом.  Многие пользователи не могут представить своей жизни без этих кнопочек, они решают все Ваши проблемы на этом участке борьбы с компьютером.

Распознавание отсканированного текста

                        Это работа для программы FineReader. Кстати, лучшая программа в мире по распознаванию текста из картинки (оцифровке текста). Многие пользуют пиратскую версию, в то время как производители программы, видя повсеместный грабеж и идя навстречу пожеланиям трудящихся, уже снизили цену домашней версии (седьмой) уже до цены в 15 долларов, или менее 500 рублей. За официальную лицензионную программу!!! Давайте поддержим отечественного производителя!

            Итак. Вы приобрели (украли) дистрибутив (установочный пакет) этой программы. Поставили ее на свой компьютер, согласившись с лицензионным соглашением. Сканер, перед этим, должен быть уже установлен и нормально работать под операционной системой. Запускаем программу. В левом верхнем углу находим самую большую кнопку Scan&Read (как нетрудно перевести с английского, отсканировать и прочитать). Давим на нее. Запускается Мастер сканирования, который уже не даст Вам не получить требуемый результат. Как бы Вы не сопротивлялись, он все равно шаг за шагом проведет Вас по всем ступенькам и выдаст Вам то, что Вы желали. Делает он это в высшей степени профессионально. Ничего, кроме восторга, Вы не получите работая с таким прекрасным программным продуктом. Все на русском языке. Есть масса настроек, для особо привередливых. Максимальная простота, для эстетов. Результат всегда превосходный. Если все нормально он делает не более 3 – 5 ошибок на страницу. При работе не забывайте про язык. Если Вы распознаете чисто русский текст, то переключите опцию на русский, вместо русско-английский. Иначе он при распознавании текста просматривает два словаря, русский и английский, тратя на это Ваше время.

            Вам может быть трудно лишь в начале, но когда Вы в десятый, сотый, тысячный раз будете проходить по одному и тому же маршруту, Вы наверняка, будете чувствовать себя уже профессионалом и знающим много тонкостей в этом деле.

     Есть небольшие рекомендации:

·           Сканируйте с разрешением от 300 до 400 точек на дюйм. Сканирование с более высоким разрешением уже не улучшает качество распознавания, но замедляет работу компьютера. Сканирование с меньшим разрешением приводит к увеличению ошибок при распознавании текста;

·           Используйте черно-белый режим. Он дает максимальную производительность и отличное качество распознавания. Включать оттенки серого надо лишь тогда, когда у Вас отвратительный оригинал (старый, выцветший, серый и т.д.);

·           Распознавания цветного текста, это уже редкость (может пока).

При покупке сканера, старайтесь купить такой, чтобы у него были русифицированные драйвера. Например, Epson. Это пригодится. Нет смысла платить за то, что Вы никогда не будете использовать. Например, если на сканере имеется слайд модуль для сканирования пленок, а Вы этим никогда не будете заниматься, то не стоит слушать продавца, как это замечательно, а поищите другую версию (место) где можно взять (купить) сканер. Такое дополнительное украшение удорожает его на несколько тысяч, а вот качество отсканированной пленки Вас разочарует. Если Вы не заплатили за этот модуль более 30 000 рублей, то такое приобретение – баловство. Вам не удастся распознать текст с фотопленки. Сейчас, обязательно, нужно покупать только сканер с USB портом, лучше USB2. И не какой другой. Качество и надежность сканера тем выше, чем он толще. Старайтесь не покупать тонких и ультратонких сканеров. Это наше мнение.

Использование сканера как копира

          Еще одна замечательная функция любого сканера. На моем сканере стоит программа Директ скан. При открытии крышки сканера, поверх всех окон выскакивает окошко, следующего вида:

Где Вас спрашивают, что желаете?

Желаете использовать как ксерокс, нажмите на вторую сверху кнопку в левом ряду, сканер отснимет то, что лежит на стекле и выдаст картинку на принтер.

         Если в Вашем сканере нет такой программы, какая беда. Есть много программ, и на русском языке тоже, которые позволяют использовать сканер, как ксерокс. Причем, если принтер цветной, то и ксерокопию Вы получите то же цветную. Не размножайте деньги, игра не стоит свеч!

 

1.    ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

1.  Откройте Word. Отсканируйте изображение и поверните его на 2 градуса влево. Для этого Вам потребуется щелкнуть правой клавишей  мыши на полученной картинке, выбрать строку – Формат рисунка, - на вкладке Размер найти поле Поворот где и указать угол поворота на 2 градуса против часовой стрелки.

2.  Отсканируйте и распечатайте 3 экземпляра какого-либо документа. Надеюсь, Вы не сканировали 3 раза, а то я попрошу распечатать еще 97 экземпляров.

3.  Отсканируйте и распознайте газетный текст, лучше на иностранном языке.

4.  Положите на стекло сканера круглую батарейку любого размера (пальчиковую) и отсканируйте ее. Поэкспериментируйте с другими не плоскими объектами. Получаются забавные вещи. Это еще одна характеристика сканера - возможность оцифровки 3Д(объемных)  объектов. Чем лучше сканер (дороже) тем этот показатель выше. Однако, часто ли Вы будете пользоваться такой экзотикой?

 

4. КОНТРОЛЬНЫЕ ВОПРОСЫ

1          Для чего нужен сканер?

2          А нужно ли столь высокое разрешение, на которое он способен?

3          Играет ли большое значение скорость сканирования сканера?

4          Какой максимальный формат могут сканировать сканеры?

5          А как сканировать чертежи?

6          Какое должно быть разрешение при распознавании текста, почему?

7          А размер сканируемого изображения, какой может быть?

8          А если нужно сканировать рулон, как быть?

9          Посмотрите, какой размер файла получится, если сканировать с максимальным разрешением максимальный размер, у Вас диска хватит?

10              Какое программное обеспечение поставляется в комплекте со сканером и для чего?