Definição – o que significa o reconhecimento óptico de caracteres (OCR)?
O reconhecimento óptico de caracteres (OCR) refere-se à tecnologia e ao processo de leitura e conversão de caracteres digitados, impressos ou manuscritos em texto codificado por máquina ou algo que o computador possa manipular. É um subconjunto do reconhecimento de imagem e é amplamente utilizado como forma de entrada de dados, sendo a entrada algum tipo de documento impresso ou registro de dados, como extratos bancários, faturas de vendas, passaportes, currículos e cartões de visita. O documento é digitalizado ou uma foto é tirada e cabe ao programa reconhecer os caracteres e fornecer uma saída na forma de um documento de texto.
Definirtec explica o reconhecimento óptico de caracteres (OCR)
O reconhecimento óptico de caracteres é o reconhecimento de caracteres específicos do idioma por um computador por meio da análise de uma imagem, que já pode ser lida por computador. Geralmente, isso é feito capturando primeiro uma imagem do documento, digitalizando-o ou tirando uma foto digital. Isso cria uma imagem raster composta de dados que o computador entende e, por meio de algoritmos especificamente programados, a maioria dos quais são usados no campo da inteligência artificial, o computador reconhece os padrões na imagem e, neste caso, os padrões são personagens. O programa então cria ou produz códigos de caracteres, geralmente ASCII, que são equivalentes aos caracteres reconhecidos da imagem de entrada. A maioria dos programas de OCR deve ser treinada para se tornarem melhores no reconhecimento de caracteres.