. News. ABBYY Releases FineReader 7.0 OCR Software Share Moscow, Russian Federation (September 2, 2003) Next Generation Product Line Sets New Standards With 25% OCR Accuracy Improvements, PDF Recognition, Microsoft Office Word 2003 Support ABBYY, a leading provider of document recognition and linguistic technologies, today announced the global availability of the new FineReader® 7.0 optical character recognition (OCR) software product line. This new version of ABBYY's award-winning document recognition application improves the process of converting paper documents and PDF files into manageable electronic data by adding an average of 25 percent increased overall recognition accuracy. ABBYY FineReader 7.0 comes in two editions - FineReader 7.0 Professional Edition, designed for home users and small businesses, and FineReader 7.0 Corporate Edition, developed specifically for network environments. Based on a complete enhancement to ABBYY's core recognition platform, FineReader 7.0 is designed to make the process of transforming 'static' or uneditable files, into information that can be edited, sent, searched, or tabulated. According to Sergey Andreyev, CEO of ABBYY, 'Paper documents come back to life, or are 'revived,' when a user can once again work with them - either by making changes to the text, searching for key words and information, sorting them electronically, or storing them in accessible files.
ABBYY FineReader 7.0 Professional Edition включает все возможности современной системы оптического.
With FineReader 7.0 we enhance a user's ability to efficiently share and communicate information with a focus on three core areas: increased accuracy, PDF handling, and integration with the most recent Microsoft Word tools to make the editing process simple.' ABBYY FineReader 7.0 helps users achieve greater productivity through the following new enhancements: Improved Recognition Accuracy FineReader 7.0 delivers a 25 percent average accuracy improvement over the previous version, further saving users time and energy spent retyping or checking documents.
Accuracy improvements are achieved through: the addition of new structural models for comparing and analyzing characters, and improvements in image-preprocessing, and the addition of new legal and medical dictionaries for the English and German languages. Significant areas of improvement include recognition of text on colored or textured backgrounds. Improved Layout Retention Accuracy Because recreating an original document's layout can be even more time consuming than retyping, ABBYY also develops technologies for layout retention. FineReader 7.0 is supported with new algorithms added to its Multilevel Document Analysis (MDA) process.
Examples of improvements include recognition of documents with complex spreadsheets and tables (such as those without printed grid lines and tables with color cells) and documents with bullets of different types. PDF Recognition ABBYY FineReader 7.0 also delivers significant improvements in PDF handling that include:.
Increased PDF Recognition Accuracy. Accuracy of PDF files is increased by an average of 45 percent due to new 'intelligent PDF recognition,' a two-step method for PDF recognition.
In the two steps, FineReader recognizes the PDF file and then extracts the PDF text layer to perform a comparison to 'double-check' accuracy. As a result, accuracy is increased. In addition, PDF conversion is not a problem when files include special encoded fonts. Linearized PDF.
PDF documents created by FineReader are now saved as 'linearized PDFs' that are optimized for Web publishing. The PDF files are structured so that the first page of the PDF file to be displayed in a user's Web browser before the entire file is downloaded from the Web server. Edited PDF. Users can edit recognized PDF files (as well as all recognized documents) in the FineReader's Editor window. With this feature, users will be able to take an existing PDF document, open it in FineReader, make changes, and save it back into any number of PDF formats. FineReader supports output in any of the four standard PDF file formats (text and pictures only, text over image, text under image, and image only) with additional controls such as whether or not to replace suspect words with images.
This gives users six PDF saving options - more PDF formats than any other OCR software. FineReader 7.0 is also the only OCR program that is able to create text over image PDF files, essentially eliminating the pixilated text outcome that often results without this capability. To preserve text and font characteristics, FineReader 7.0 first 'paints' the original image, and then carefully layers the recognized text over the image, requiring flawless layout retention in the OCR program. The resulting document will have impeccable layout retention and crisp text, making it ideal for printing, Web publishing and archiving. XML Output ABBYY FineReader 7.0 allows users to export recognized document as XML using native Microsoft Word 2003 defined schema, widely anticipated to be an emerging standard for file use.
This allows users to take advantage of the XML file format which can be manipulated and searched using any program that can process industry standard XML. In addition, it provides the basis for data reporting, publishing and submitting data to business processes. New Integration with Microsoft® Office Applications.

Инструкция по термообработке. Integration with Microsoft Word 2003. FineReader 7.0 also streamlines the process of recognizing and editing word documents. When exporting documents to Microsoft Word 2003, FineReader automatically opens an embedded view of the original document, allowing users to concurrently edit and view their original documents, thus eliminating the need to toggle between the two applications. Insertion of Recognized Text into MS Word.
When working on a document using Microsoft Word, users can launch FineReader 7.0, recognize a document and insert the recognized text into the active document right at the point where the curser is placed. This means that users will be able to collect information from different source documents and eliminate the extra steps of copying to a clip board and pasting to the active document. PowerPoint Support. FineReader recognizes PowerPoint printed slides and handouts as images, and exports to PowerPoint XP and 2003, making it easy for users to update older PowerPoint presentations.
Professional Tools ABBYY FineReader 7.0 Professional Edition now includes a set of professional tools that were previously only available for corporate users. These specialized tools are powerful utilities that can increase productivity and provide support for certain office applications. They include:. Image Splitting Tool for Management of Multi-Image/Element Documents. With FineReader 7.0's new image splitting tool, users can segment a document into several areas and save each area as a separate page. This feature is helpful when recognizing multiple business cards, pages in a book, or PowerPoint handouts. Full-text Search with Morphology Support for 34 languages.
By using the search with morphology support tool in FineReader 7.0, users can create mini-databases with full-text search capabilities of any recognized batch. Morphology support allows users to search for words using any iteration of that word's grammatical form. For example, searching for one conjugated form of a verb will find other forms of the verb. Barcode recognition.
FineReader Professional Edition supports recognition of barcodes, including PDF-417 2D barcodes. Hyper-Threading Technology Support. When running FineReader 7.0 on computers with Hyper-Threading Technology in background mode, the program will launch as many processes as there are virtual processors, which increases the speed of operation. This technology can greatly increase productivity when recognizing large numbers of documents. Duplex Scanning.

When scanning a two-sided document using a duplex scanner, FineReader 7.0 automatically provides separate images for each side of the document. Corporate Edition for Networks Building upon the functionality of FineReader 7.0 Professional Edition, ABBYY is announcing a version designed for corporate networks. FineReader 7.0 Corporate Edition includes all of the functionality of FineReader 7.0 Professional Edition with functionality just for offices on a local area network (LAN). Specialized functions include support for networked scanners and Multifunction Peripherals (MFPs), automated network installation, concurrent licence management, and distributed document processing. For further information, see today's press release entitled 'ABBYY Ships FineReader 7.0 Corporate Edition.'
System Requirements FineReader 7.0 Professional Edition supports Intel® Pentium®, Celeron®, and Xeon™, and AMD K6, Athlon™, Duron™, or compatible 200MHz or higher processor. Microsoft® Windows XP, Windows 2000, Windows NT® 4.0 with Service Pack 6 or later, Windows Me/98; it requires 64 MB of RAM for Windows XP/2000/NT 4.0, 32 МB of RAM for Windows Me/98, 220 MB of hard-disk space for typical installation and program operation, TWAIN-compliant scanner, digital camera, fax-modem (optional). Super VGA (800x600) or higher-resolution video adapter and a monitor. Availability ABBYY FineReader 7.0 Corporate Edition is available now from select retail stores, resellers, and online outlets.

A free 15-day Try&Buy software version of ABBYY FineReader 7.0 Professional Edition will be available for download at the Web site. For additional information on resellers carrying FineReader 7.0 Corporate Edition, visit the.
15 марта 2005 FineReader: уже седьмая версия Несмотря на проникновение в нашу жизнь большого количества электронных документов, бумажные источники не теряют актуальности - по-прежнему существуют газеты, журналы, книги, мы получаем факсы, письма отчёты. Но для дальнейшей работы часто необходимо эту информацию редактировать. И для этого предназначена программа FineReader, способная превратить полученный факс или письмо в документ Word.
Основные отличия 'семёрки' от предыдущей версии (6.0) заключаются в повышенной, примерно на 25%, точности распознавания (в том числе документов сложной вёрстки), поддержке формата XML и достигнутой за счёт этого интеграции с Microsoft Office, добавлении нескольких специализированных словарей (юридическая и медицинская лексика), позволяющих заметно улучшить обработку документов соответствующей тематики. Кроме того, в систему добавлены возможности экспорта в Microsoft PowerPoint и Microsoft Word, а также в HTML; улучшен экспорт в PDF - получающиеся файлы теперь оптимизированы для постраничной загрузки из Интернета. Добавлено также несколько функций, которые раньше были доступны только пользователям версии Corporate Edition: распознавание штрих-кодов, инструменты для разбиения изображения, морфологический поиск, двухстороннее сканирование и поддержка новейших процессоров Intel. Комплект поставки В коробке ABBYY FineReader 7.0 находились: установочный диск, 112-страничное руководство пользователя, сокращённый вариант руководства (8-страничный буклет), лицензионный договор (по условиям которого разрешается использовать программу на двух компьютерах: одном настольном и одном портативном или одном офисном и одном домашнем) и регистрационная карточка. Установка не вызвала никаких затруднений и заняла менее 10 минут, последующая активация через Интернет - менее 15 секунд. Активация в FineReader 7.0 стала обязательной. Надо отметить, что если предыдущие версии ABBYY FineReader можно было установить без активации, с помощью ключевой дискеты, то здесь без активации уже не обойтись.
Работа с программой После запуска FineReader перед нами отображаются две панели инструментов: 'Стандартная' и главная панель программы 'Scan&Read'. На последней размещены четыре пронумерованные кнопки, обозначающие действия пользователя при переводе документа в текст. Главная панель программы 'Scan&Read'.
Кнопки на этой панели отображают основные операции: сканирование (либо открытие графического файла), распознавание, проверка и сохранение результатов распознавания. Каждое из этих действий можно произвести отдельно, или объединить все действия в одно, запустив Мастер 'Scan&Read' нажатием левой кнопки. Мастер выполнит полный цикл работ и, в итоге, выдаст электронную версию бумажного документа. Мастер 'Scan&Read' Для большинства пользователей мы рекомендуем пользоваться Мастером. За предыдущие версии ABBYY намного улучшила Мастер, поэтому никаких сложностей вы не испытаете. Запускаем Мастер. Первый этап работы - сканирование (либо открытие графического файла).
Сканируем текст или получаем из файла. Далее появляется интерфейс программы сканирования (на этом этапе надо проконтролировать установки сканирования - рекомендуется разрешение не меньше 150 dpi, чёрно-белый режим для документов высокого качества, серый - для большинства документов и цветной - при необходимости сохранения цветных картинок, цвета подложек и букв) Интерфейс сканера. У каждой модели он свой. Следующий шаг - распознавание. Сначала необходимо установить язык документа: Выбираем язык.
Затем можно запускать распознавание. Наш тестовый листок с текстом дал следующий результат: Так FineReader разбила наш текст на блоки. Отметим, что FineReader разделяет содержимое страницы на три типа - распознаваемая часть попадает либо в текстовый блок (на рисунке блок с зелёной границей), либо в табличный блок (с синей границей), либо блок считается картинкой и не распознаётся (блок с красной границей). Картинки сохраняются в финальном документе в графическом формате. Если внутри картинки будет текст, он будет распознан, но саму картинку автоматически воспроизвести не удастся.
Чтобы правильно обработать документ, где есть наложенный на картинку текст, нужно сделать следующее: вручную создать блок 'Картинка', содержащий всё изображение, а затем создать новый, текстовый блок, захватывающий весь интересующий вас текст. Тогда после распознавания FineReader вставит в документ картинку, а поверх неё наложит распознанный, редактируемый текст. Ниже мы рассмотрим выделение блоков подробнее. Затем текст следует проверить: Проверяем текст: всё ли распозналось правильно? Наконец, последний этап - сохранение. Здесь можно сохранить распознанный текст с картинками и таблицами в файл, либо передать в другое приложение.
Выбрав один из предложенных вариантов (например передачу в MsWord), получаем распознаваемый документ в привычном формате, который теперь можем редактировать. Передаём файл в Microsoft Word. Работа без Мастера Многие пользователи предпочитают работать без Мастера, выбирая действия самостоятельно. Для этого следует воспользоваться кнопками главной панели 'Scan&Read', каждая из которых имеет несколько режимов работы. Выбрать один из них можно, нажав на стрелку справа от кнопки. У каждой кнопки есть дополнительные режимы работы. После получения изображения - либо путем сканирования, либо выполнением команды 'Открыть изображение' (программа поддерживает следующие входные форматы:.bmp,.pcx,.dcx,.jpeg, jpeg 2000,.png,.tiff,.pdf) FR автоматически создаёт пакет.
По сути, пакет - это папка (в нашем случае, например C: Documents and Settings sms Local Settings Temp Untitled0), в которой хранятся необходимые данные, в том числе открытые изображения, преобразованные в формат.tif. Пакет значительно облегчает работу с многостраничными документами: вы можете сделать перерыв на любом этапе (при сканировании, распознавании, редактировании) и сохранить пакет, а впоследствии в любой удобный момент продолжить работу с того же места. При создании пакета перед нами появляется следующие 4 окна: Четыре окна пакета. Самое левое окно 'Пакет' отображает страницы, находящиеся в открытом пакете. Возможны два режима отображения страниц - 'Пиктограммы ' (по умолчанию), как на рисунке выше, либо вид 'со свойствами' на рисунке ниже, когда вместо пиктограммы появляется дополнительная информация о страницах пакета.
При выделении двойным щелчком страницы пакета она появляется в окне 'Изображение'. Режим отображения страниц 'со свойствами'. Окна 'Изображение', 'Крупный план' и 'Текст' связаны между собой. При выделении щелчком участка в окне 'Изображение', в окне 'Крупный план' можно наблюдать, соответственно, (в зависимости от выбранного масштаба) увеличенное изображение участка. Причём, в окне 'Текст' курсор переместится на текст выбранного участка (при условии, что данная страница распознана).
Отметим, что увеличенное изображение бывает полезно для точного выделения блоков. Пункты 'Распознать' и 'Проверить' мы подробнее рассмотрим ниже, в параграфе 'Распознавание документов с большим количеством иллюстраций '. Наконец, четвёртый пункт - 'Сохранить'. Результат распознавания можно передать в приложения: MsWord (версии 6.0-11.0), Excel (версии 6.0-11.0), Power Point (версии 9.0 и 10.0), Corel WordPerfect (версии 7.0-11.0), Lotus Word Pro 9.5, 97, Millennium Editions, Star Writer 4.x, 5.x, 6.x, Promt 98 и во все приложения, поддерживающие стандарт ODMA, сохранить в файл HTML или PDF. Настроить параметры сохранения можно в диалоге форматы (меню 'СервисФорматы') на соответствующей закладке.
Настраиваем формат сохранения. В FineReader 7.0 появился новый формат сохранения - MsWord XML, который позволяет проверять и редактировать результат распознавания с помощью привычных инструментов Word, при этом можно сверить переданный текст с оригинальным изображением (окно 'Крупный план' открывается прямо в Word): Окно 'Крупный план' открывается прямо в Word.
Помимо большой панели инструментов, в программе имеются еще две панели. Панель 'Стандартная'. Кнопки панели 'Стандартная' управляют работой с файлами и изображением (отмена и повтор действия, перемещение по страницам пакета, выбор языка распознавания). Панель 'Форматирование'. Кнопки панели 'Форматирование' позволяют изменить оформление распознанного текста. Дополнительные возможности Распознавание книг Хотелось бы отметить очень полезную в данном случае опцию 'Делить разворот книги'. Опция 'Делить разворот книги'.
Если включить эту опцию, то при добавлении отсканированных файлов в пакет FR мы получаем вместо текста в две колонки две обычных странички, с которыми потом работать значительно легче. Текст в две колонки. Текст в две страницы. Сложный текст Если мы работаем с текстом более сложным, чем двухстраничный разворот книги, например, у нас отсканировано несколько визитных карточек, то мы сможем разбить текст на отдельные страницы самостоятельно (меню 'Изображение Разбить изображение') Разбиваем сложный текст на страницы.
Руководство по качеству йогуртов. Распознавание документов с большим количеством иллюстраций К распознаванию текста у нас не возникло никаких замечаний. К сожалению, ABBYY FineReader 7.0, как и предыдущие версии, не всегда корректно автоматически выделяет иллюстрации и подписи к ним, в результате чего приходится прибегать к ручному выделению. Пример неудачного выделения иллюстраций и подписей. На иллюстрации показан пример некорректного автоматического выделения. На первой странице одна иллюстрация просто проигнорирована, вторая, состоящая из 5 рисунков, снабжённых подписями, была распознана как три рисунка, часть подписей отошла к рисункам, часть была распознана как текст. Напомним, что блоки, помеченные как рисунок, не распознаются, поэтому в финальном документе они будут представлены картинками. Таким образом, в работе с текстами, подобными приведённому на рисунке, не обойтись без ручной обработки блоков.
Здесь очень хочется отметить несколько крайне полезных инструментов для работы с подобными текстами. Кнопки для коррекции выделения текста. Кнопки на приведённой панели подразделяются на три группы: Верхняя группа 'Создание новых блоков' - содержит кнопки 'Выделить текстовый блок', 'Выделить табличный блок', 'Выделить изображение', 'Выбор объекта'. С помощью первых трёх кнопок вы можете самостоятельно выделить блок требуемого формата, а последняя кнопка позволяет выбрать один из существующих блоков на экране. С помощью кнопок следующей группы 'Редактирование формы и положение блоков' ('Добавить часть к блоку', 'Удалить часть блока') можно создать блоки достаточно сложной формы, а на приведённом выше примеры переформировать блоки например так: Удаляем созданные программой блоки и с помощью кнопки 'Выделить рисунок' создаем один прямоугольный блок, затем с помощью кнопки выделяем рисунок, не попавший в блок (так, чтобы граница выделения примыкала к границе выделенного блока): и получаем блок такой формы: Фигурно разбиваем страницу на блоки. Следующая группа кнопок - 'Редактирование табличных блоков' понадобится при формировании таблицы.
Этими кнопками можно добавить недостающие границы ячеек, либо удалить ненужные. Например, при плохом качестве печати (либо если в таблице границы просто не нанесены) часть границ в таблице может не распознаться: Не все границы в таблице были определены. Воспользуемся кнопкой и добавим недостающую границу: Теперь таблица правильная. И последняя группа - кнопки поворота изображения по и против часовой стрелки (если вы неправильно расположили документ в сканере, то его можно не пересканировать) и 'ластик', позволяющий очистить изображение от мусора (помарки, тени при сканировании и т.д.).
Все инструменты данной панели можно использовать не только в окне 'Изображение', но и в окне 'Крупный план'. Например, в окне 'Изображение' мы видим картину страницы в целом, а в окне 'Крупный план' аккуратно поправляем границы блоков: Подправляем границы блоков. Справочная система Помимо обычной справки, хотелось бы обратить внимание на интересный раздел 'Справка' 'Обучение на примерах'. Обучение на примерах. Здесь на примерах разобраны случаи, которые могут вызвать затруднение пользователя, и, соответственно, указаны пути решения проблем. Выбираем тип документа: и получаем описание ситуации при распознавании такого типа документов и указания по решению возможных проблем.
Сигна на теле с именем алексей. About site sig-na.ru Tag: H1 H2 H3 H4 H5 1 10 9 0 0 Image: You have 93 images on this website.
Заключение Компания ABBYY вновь порадовала выпуском первоклассного продукта, который необходим каждому пользователю, работающему с распознаванием текста. Следует отметить, что ABBYY FineReader пользуется заслуженной популярностью не только в России, но и в мире. И причин тому немало: удобный интерфейс, поддержка многих языков, высокая точность и скорость работы. Нас очень порадовала скорость работы программы - распознавание 200 страниц заняло порядка 10 минут - меньше, чем время, потраченное на сканирование. К самому крупному недостатку можно отнести цену профессиональной версии FinerReader 7.0, которая довольно высока.
Но за качество приходится платить. В то же время, для домашних пользователей есть более доступная версия - FineReader Home Edition. Она столь же успешно справляется с распознаванием несложно оформленных документов и сохранением их во всех популярных офисных форматах. Информацию о функциональности FineReader Home Edition вы можете получить на странице, а версии FineReader Corporate Edition для корпоративных пользователей - по адресу. Тестирование программы проводилось на платформе AMD. Редакция благодарит Российское представительство AMD за предоставленную платформу. КОНЕЦ СТАТЬИ Координаты для связи с редакцией: Общий адрес редакции:; Размещение рекламы:; Другие координаты, в т.ч.
Адреса для отправки информации и пресс-релизов, приглашений на мероприятия и т.д.