# OCR e autopreenchimento de campos

## Visão geral

Quando os campos do documento serão preenchidos com o mesmo conteúdo presente nos arquivos, é possível utilizar a funcionalidade de extração de texto (também conhecida como OCR) e sugestão de preenchimento em campos.

Um exemplo é a importação de uma CNH para uma biblioteca de documentos pessoais. O documento no Zeev docs espera receber alguns dados que existem na CNH, como:

* Nome completo;
* CPF;
* Data de nascimento;
* Nome da mãe;
* Nome do pai.

A extração pode ser realizada em:

* Qualquer arquivo em formato de imagens;
* PDF (exclusivo para OCR Google Vision)

{% hint style="info" %}
**Dica**: o OCR também pode ser utilizado na [edição](/zeevdocs/dia-a-dia-no-zeev-docs/como-consultar-documentos/como-editar-documentos.md) do documento, após ser importado para a biblioteca.
{% endhint %}

### Requisitos mínimos de qualidade da imagem

Para um bom uso desta funcionalidade com imagens, recomendamos que ela tenha o texto nítido e siga os seguintes requisitos mínimos de qualidade para o reconhecimento mais assertivo do texto:

* Resolução em 300 DPIs;
* A imagem deve estar em tons de cinza (coloração);
* Alinhamento do texto na horizontal;
* Fundo da imagem com o texto deve estar limpo.

{% hint style="warning" %}
**Importante**: para o correto funcionamento do OCR em documentos PDF (utilizando o Google Vision), o tamanho máximo do arquivo deve ser de 100 páginas.
{% endhint %}

### Como funciona o OCR do Zeev docs

Ao carregar um arquivo será exibido um quadro abaixo do visualizador, com o conteúdo textual extraído (caso o arquivo possua textos ou o motor do OCR reconheça o texto). Ao mesmo tempo, os campos do tipo texto presentes no formulário receberão a funcionalidade de autopreenchimento: ao iniciar a digitação de uma palavra serão apresentadas sugestões de texto para o preenchimento, conforme o conteúdo textual reconhecido no arquivo que está sendo visualizado.<br>

![](/files/F5fWSaMmuxAQePSXvqcl)

A extração de texto, com o uso de expressões regulares, também permite que os campos sejam automaticamente preenchidos, sem que o usuário precise iniciar a digitação do seu conteúdo; entretanto, é necessário efetuar algumas configurações no módulo.<br>

![](/files/qZlnAIILQ5cIyFk3HNSe)

{% hint style="info" %}
**Dica**: essa funcionalidade não é suportada em campos do tipo texto configurados para dupla digitação.
{% endhint %}

{% hint style="warning" %}
**Importante**: o texto extraído dos arquivos não será automaticamente salvo no banco de dados ao salvar um documento numa biblioteca. Para que isso aconteça é necessário ativar o serviço de Indexação de conteúdos.
{% endhint %}

Também é possível configurar para que o OCR dos arquivos seja realizado utilizando a [API do Google Vision](/zeevdocs/customizacoes/tesseract-vs.-google-vision.md), ao invés do recurso nativo disponível na ferramenta.

Caso a extração de texto esteja sendo realizada em um arquivo PDF (disponível apenas para a API do Google Vision), é possível que a mesma demore algum tempo para retornar resultados, principalmente se o arquivo utilizado na extração possuir um tamanho grande. Nesses casos, a extração poderá ser realizada em segundo plano. Em casos excepcionais, pode ocorrer erro na leitura do arquivo. Em ambas as situações o usuário será informado no box de reconhecimento do OCR.

Ainda no caso de extração de textos em arquivos PDFs, é possível configurar a quantidade de páginas do arquivo que será reconhecida.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://kb.stoque.com.br/zeevdocs/dia-a-dia-no-zeev-docs/como-capturar-documentos/como-carregar-documentos-digitas/ocr-e-autopreenchimento-de-campos.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.