TurboScan - сеть магазинов сканеров

11.12.2012 | Распознавание сканированных текстовых документов

Оптическое распознавание символов (OCR) эта технология получения данных с отсканированных изображений, основанная на использовании определенного тип шрифта и набора символов для преобразования их в редактируемый текст. Американский Национальный Институт Стандартов или ANSI, определяет тип шрифта посредством набора символов 0-9, букв алфавита и нескольких специальных символов, каждый из которых имеет определенный размер и форму. OCR шрифты являются воспроизводимыми, люди и OCR сканеры могут различать буквы и позволяют проводить их преобразование к редактируемому виду.

OCR сканеры, либо по-другому сканеры ввода текста позволяют проводить сканирование документа и автоматическое преобразование текста документа в редактируемый вид сразу после сканирования. Сбор данных и изучение формата данных происходит в процессе сканирования. В связи с этим к подобного рода сканерам предъявляются повышенные требования к качестве распознавания символов.

Виды OCR сканеров

Такие сканеры бывают различных типов, они могут быть как стационарным, так и ручными. Стационарные сканеры также подразделяются на бортовые, листовые и барабанные. Они в основном используются для ввода текста, обработки и хранения данных изображения на компьютере. Ручные сканеры, таких как цифровые ручки или сканеры штрих-кода, используются для ввода текста и последующей его обработки на компьютере.

OCR сканер делает снимок документа, а затем OCR программное обеспечение преобразует его в текст. Символ определяется путем его сопоставления с символами, хранящимися в матрице программы.

Все новости

 

Меню