Estado Global de Validación Documental
| Tarea | Descripción | Documento actual | Estado | Progreso |
|---|---|---|---|---|
| OCR | Extraer texto de PDF, imágenes y escaneos, generación de vectores. | contrato_2025.pdf | No iniciado | 0% |
| NER | Identificar entidades (nombres, fechas, montos) | informe_riesgos.docx | No iniciado | 0% |
| Clasificación | Categorizar documento por tipo y categoría | factura_abril.xlsx | No iniciado | 0% |
| Metadatos | Extraer y normalizar propiedades (autor, fecha) | plan_proyecto.pptx | No iniciado | 0% |
| Anomalías | Detectar valores atípicos y campos faltantes | base_datos.csv | No iniciado | 0% |
| Dedupe | Eliminar duplicados en registros extraídos | registro_clientes.json | No iniciado | 0% |
| Esquema | Validar estructura acorde al modelo de datos | esquema_base.xml | No iniciado | 0% |
| Calidad | Ejecutar reglas de negocio y métricas de calidad | resumen_financiero.pdf | No iniciado | 0% |
Opciones avanzadas de reindexación
Forzar re-extracción
Re-descarga y re-extrae texto aunque exista en BD.
Revectorizar
Regenera embeddings tras la extracción.
Solo faltantes
Procesa únicamente documentos sin texto/embeddings.
Reconocimiento Óptico de Caracteres (OCR)
Extrae texto de imágenes y PDF escaneados.
Extracción de Entidades Nombradas (NER)
Detecta nombres, fechas, ubicaciones, etc.Listo para ejecutar.
Clasificación de Documentos
Agrupa por temática o tipo.
Extracción de Metadatos
Recupera atributos clave.
Detección de Anomalías
Identifica valores atípicos.
Eliminación de Duplicados
Filtra entradas repetidas.
Inferencia de Esquemas
Descubre estructura y tipos de campo.
Validación de Calidad
Chequea formatos y rangos.
Reglas de Validación Dinámicas
Crea y aplica reglas sin escribir JSON.
Ejecución Programada y On-Demand
Agendamiento inteligente y chequeos urgentes.
Monitoreo del Proceso
Visualiza estado y logs de la validación.- Estado del Proceso En Espera
- Última Ejecución -
- Errores Detectados 0