Smart Scan
OCR significa Reconocimiento Óptico de Caracteres. Es una tecnología que convierte diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF, o imágenes capturadas por una cámara digital, en datos editables y buscables. El propósito principal de OCR es reconocer y extraer texto de estos formatos no editables para que pueda ser almacenado electrónicamente, manipulado y buscado.
Resumen
Escaneo Inteligente proporciona soluciones OCR (Reconocimiento Óptico de Caracteres) poderosas que transforman documentos en contenido digital, buscable y editable. Nuestra tecnología avanzada soporta tipos de documentos globales y ofrece métodos de extracción flexibles para cumplir con tus necesidades específicas.
Características Principales
🔍 Alta Precisión
Tecnología OCR avanzada con capacidades de reconocimiento y extracción de texto de alta precisión.
🌍 Soporte Global
Procesa documentos de cualquier país con soporte para múltiples idiomas y formatos de documentos.
⚡ Procesamiento en Tiempo Real
Procesamiento rápido de documentos con extracción de texto en tiempo real y resultados inmediatos.
🎯 Extracción Flexible
Elige entre métodos de extracción basados en prompts o modelos entrenados según tus necesidades.
📊 Campos Ilimitados
Extrae campos ilimitados de documentos sin restricciones en puntos de datos.
🔧 Integración Fácil
Integración API simple con documentación integral y soporte para desarrolladores.
Cómo Funciona OCR
Así es como OCR típicamente funciona:
1. Adquisición de Imagen
El proceso comienza capturando el documento o imagen usando un escáner, cámara u otros dispositivos de imagen.
2. Preprocesamiento
Antes de que OCR pueda ser aplicado, la imagen capturada es preprocesada para mejorar su calidad. Esto puede involucrar tareas como reducción de ruido, ajuste de contraste y enderezamiento de imagen para asegurar precisión óptima de reconocimiento.
3. Reconocimiento de Texto
El software OCR analiza la imagen preprocesada e intenta identificar patrones y formas que corresponden a caracteres individuales. Compara estos patrones con una vasta base de datos de caracteres y fuentes conocidas.
4. Identificación de Caracteres
El software OCR luego hace coincidir los patrones reconocidos con las coincidencias más cercanas en su base de datos e identifica los caracteres.
5. Salida de Texto
Una vez que los caracteres son identificados, el software OCR reconstruye los caracteres reconocidos en texto editable y buscable. Esta salida puede ser guardada en varios formatos como texto plano, documentos Word, o PDFs con texto embebido.
La tecnología OCR se ha convertido en una herramienta esencial para digitalizar grandes volúmenes de documentos impresos, automatizar procesos de entrada de datos, y habilitar búsquedas basadas en texto dentro de documentos escaneados. Es ampliamente usada en industrias como finanzas, salud, legal y sectores administrativos para mejorar la eficiencia y accesibilidad de la información.
Soluciones OCR de Verifik
📝 Escaneo con Prompt
Prueba nuestra API Escaneo con Prompt con cualquier documento que tengas. Perfecto para extracción de texto flexible basada en prompts.
Aprender Más🎨 Estudio de Escaneo
Prueba nuestra API Estudio de Escaneo con los modelos entrenados que tenemos. Ideal para procesamiento de documentos especializado de alta precisión.
Aprender MásInterfaz de Soluciones OCR
Comparación de Servicios
En la siguiente tabla encontrarás algunas consideraciones de cada servicio, esto te ayudará a hacer una elección en qué servicio específico es adecuado para ti y tu proyecto:
| Propiedades | ESCANEO CON PROMPT | ESTUDIO DE ESCANEO |
|---|---|---|
| Precisión | Media | Alta |
| Número de campos de escaneo | Campos Ilimitados | Campos Ilimitados |
| Compatible con prompts | ✓ | ✗ |
| Entrenamiento requerido del Equipo Verifik | ✗ | ✓ |
| Solución sin código | ✗ | ✗ |
| Documentos soportados | Global | Global (Necesita entrenamiento) |
Eligiendo el Servicio Correcto
🎯 Elige Escaneo con Prompt Cuando:
- Necesitas flexibilidad en extracción de texto
- Quieres usar prompts personalizados
- Estás trabajando con tipos de documentos diversos
- Necesitas configuración rápida sin entrenamiento
- La precisión media es aceptable para tu caso de uso
🎨 Elige Estudio de Escaneo Cuando:
- Necesitas extracción de alta precisión
- Estás trabajando con tipos de documentos específicos
- Puedes invertir tiempo en entrenamiento de modelos
- Tienes formatos de documentos consistentes
- La precisión es crítica para tu aplicación
Comenzando
Autenticación
Todas las solicitudes de API requieren un token JWT válido. Incluye el token en el header de Authorization:
Authorization: Bearer <your_jwt_token>
URL Base
https://api.verifik.co/v2/scan
Endpoints de API
Escaneo con Prompt
Extraer Texto con Prompt
POST /prompt/extract
Content-Type: application/json
Authorization: Bearer <your_jwt_token>
{
"document": "base64_encoded_image",
"prompt": "Extrae todo el texto de este documento",
"fields": ["name", "date", "amount"]
}
Casos de Uso:
- Extracción de texto flexible con prompts personalizados
- Configuración rápida para tipos de documentos diversos
- Extracción de campos dinámicos basada en prompts
Estudio de Escaneo
Extraer Texto con Modelo Entrenado
POST /studio/extract
Content-Type: application/json
Authorization: Bearer <your_jwt_token>
{
"document": "base64_encoded_image",
"model_id": "your_trained_model_id",
"confidence_threshold": 0.8
}
Casos de Uso:
- Extracción de alta precisión para tipos de documentos específicos
- Resultados consistentes para documentos estandarizados
- Aplicaciones listas para producción que requieren confiabilidad
Formato de Respuesta
Todas las respuestas de API siguen un formato consistente:
Respuesta de Éxito
{
"success": true,
"data": {
"extractedText": "Contenido de texto extraído completo",
"confidence": 0.95,
"fields": {
"name": "Juan Pérez",
"date": "2024-01-15",
"amount": "$1,250.00"
},
"processing_time": "2.3s",
"model_used": "scan-prompt-v1"
},
"message": "Extracción de texto completada exitosamente"
}
Respuesta de Error
{
"success": false,
"error": "Formato de documento inválido",
"code": "INVALID_DOCUMENT",
"details": {
"supported_formats": ["jpg", "png", "pdf"]
}
}
Mejores Prácticas
Preparación de Documentos
- Calidad de Imagen: Asegura que los documentos sean claros, bien iluminados y de alta resolución
- Soporte de Formato: Usa formatos soportados (JPG, PNG, PDF) para resultados óptimos
- Orientación de Documento: Asegura que los documentos estén correctamente orientados antes del procesamiento
- Tamaño de Archivo: Mantén tamaños de archivo razonables (bajo 10MB) para procesamiento más rápido
Uso de API
- Procesamiento por Lotes: Procesa múltiples documentos en lotes para eficiencia
- Manejo de Errores: Implementa manejo de errores apropiado para extracciones fallidas
- Umbrales de Confianza: Establece umbrales de confianza apropiados basados en tus necesidades
- Limitación de Velocidad: Respeta los límites de velocidad de API para evitar interrupciones del servicio
Seguridad
- Privacidad de Datos: Asegura que los documentos sensibles sean manejados de forma segura
- Gestión de Tokens: Mantén los tokens JWT seguros y rótalos regularmente
- Solo HTTPS: Siempre usa HTTPS para comunicaciones de API
- Retención de Datos: Implementa políticas apropiadas de retención de datos
Límites de Velocidad
- Escaneo con Prompt: 50 solicitudes por minuto
- Estudio de Escaneo: 30 solicitudes por minuto
Comienza con Escaneo con Prompt para pruebas rápidas y prototipado, luego muévete a Estudio de Escaneo para aplicaciones de producción que requieren alta precisión.
Siempre prueba tu implementación OCR con documentos de muestra antes de desplegar a producción para asegurar que la precisión cumple con tus requisitos.
Soporte
Para soporte técnico y documentación de API, contacta a nuestro equipo de soporte o visita nuestro portal de desarrolladores.
Casos de Uso
Servicios Financieros
- Procesamiento de Facturas: Extrae datos de facturas para contabilidad automatizada
- Análisis de Estados Bancarios: Procesa estados bancarios para análisis financiero
- Digitalización de Recibos: Convierte recibos en papel a registros digitales
Salud
- Registros Médicos: Digitaliza registros de pacientes y formularios
- Reclamos de Seguros: Procesa documentos de reclamos de seguros
- Procesamiento de Recetas: Extrae información de formularios de recetas
Legal
- Análisis de Contratos: Extrae términos clave y fechas de documentos legales
- Documentos Judiciales: Procesa archivos legales y registros judiciales
- Formularios de Cumplimiento: Digitaliza documentos de cumplimiento regulatorio
Administrativo
- Procesamiento de Formularios: Extrae datos de varios formularios administrativos
- Archivo de Documentos: Convierte documentos en papel a archivos digitales buscables
- Automatización de Entrada de Datos: Reduce entrada manual de datos con extracción automatizada
¿Listo para comenzar a usar Escaneo Inteligente? Revisa nuestra documentación de API y guías de integración para comenzar rápidamente.