Saltar al contenido Nuevo Te presentamos nuestra oferta Perfect Docs Guaranteed — +99% de precisión para equipos de alto volumen. Plazas limitadas. Saber más

Cómo Invofox mide la precisión en la extracción de documentos.

Evaluamos, normalizamos y validamos la precisión de extracción sobre millones de documentos — con un proceso de benchmarking transparente y basado en ground truth, pensado para evaluaciones reales.

Por campo
99.4%
Precisión por campo
Por doc
99.2%
Precisión por documento
Volumen
12.4M
Documentos evaluados
+18% MoM
Calidad
0%
Falsos positivos
SLA bound

Procesamos documentos para equipos de

Ground truth: el punto de partida para medir la precisión.

Un benchmarking preciso empieza por una baseline precisa — lo que llamamos ground truth. Define los datos correctos para cada campo, para que podamos medir la precisión de extracción de forma objetiva. Cuando el cliente comparte sus datos etiquetados, los usamos como referencia estándar.

Documento
Ground truth
Comparación
Output del modelo
1{
2  "document_number": "INV-2024-1837",
3  "issued_at": "2024-08-14",
4  "tax_base": 1452.30,
5  "vat_rate": 0.21,
6  "total": 1757.28
7}
Ground truth
1{
2  "document_number": "INV-2024-1873",
3  "issued_at": "2024-08-14",
4  "tax_base": 1452.40,
5  "vat_rate": 0.21,
6  "total": 1757.28
7}

Cómo Invofox maneja datos complejos en la evaluación de precisión.

Los datos de un documento rara vez se ven idénticos, incluso cuando son correctos. Nuestra lógica de evaluación se adapta a cada tipo de dato — para que las comparaciones sean justas y consistentes.

numbers

Números

1.234,56 1,234.56
Tolerancia ±0.01

Comparados dentro de rangos de tolerancia. Ceros a la derecha, separadores y formato de moneda no rompen el match.

dates

Fechas

14/08/24 2024-08-14
ISO 8601

Normalizadas a ISO 8601. Las diferencias de zona horaria y formatos locales se reconcilian automáticamente.

booleans

Booleanos

false
Sin marcar ⇒ false

Contemplan estados ausentes o sin marcar. "—" se trata como false salvo que el esquema fuerce lo contrario.

arrays

Arrays y tablas

[A, B, C] [C, A, B]
Sin orden

Evaluadas por contenido, no por orden — salvo que el orden sea crítico para el caso de uso.

strings

Textos y strings

  • INV-1873 INV-1873 Exacto
  • Acme Co. ACME CO Normalizado
  • C/. Mayor 1 Calle Mayor 1 Levenshtein 0.92

Match exacto, normalizado o por similitud (Levenshtein) según el tipo de campo.

De la precisión por campo a la fiabilidad por documento.

La mayoría de IDPs solo reportan precisión por campo. Invofox va más allá midiendo precisión por documento — porque un solo campo mal extraído puede frenar un flujo automatizado. Calculamos las dos: por campo para analítica granular, por documento para fiabilidad end-to-end, además de reglas de validación custom por caso de uso.

Por documento 99.0%

Fiabilidad end-to-end

Todos los campos deben ser correctos para que un documento cuente. La señal en la que un workflow realmente puede confiar.

Precisión a nivel de documento completo en el pipeline
Por campo 99.5%

Analytics granular

Precisión y recall a nivel de campo sobre millones de claves extraídas. Perfecto para monitorización y dashboards.

Precisión y recall por clave, comprometidos por contrato

¿Quieres saber cómo se compara tu proveedor?

Compara tu sistema IDP o interno con Invofox — te mostramos los resultados, lado a lado.

Benchmarks consistentes cuando tu esquema evoluciona.

Añadir o quitar un campo puede hacer que los benchmarks antiguos sean imposibles de comparar. Invofox versiona los esquemas y normaliza los cambios automáticamente — para que tus resultados de precisión sigan siendo válidos en el tiempo. Cuando aparecen nuevas claves, marcamos los documentos afectados para que mantengas visibilidad de tu modelo de datos en evolución.

v1.0 Jan 4 fields
  • document_number
  • issued_at
  • tax_base
  • total
v1.1 Mar 5 fields
  • document_number
  • issued_at
  • tax_base
  • total
  • currency
+1 campo añadido Compatible
v2.0 Jun 5 fields
  • document_number
  • issue_date
  • tax_base
  • total
  • currency
1 campo renombrado Normalizado

Evaluación de precisión basada en transparencia.

Creemos que las métricas de precisión deben ser verificables, no subjetivas. Cada evaluación corre en casa con parámetros consistentes y reglas transparentes. Cada cliente recibe métricas resumen y los datos raw que las generan — sin cajas negras ni supuestos ocultos.

Cliente Invofox
Nº de documento
89.4%
Falsos positivos 5.4%
99.3%
Falsos positivos 0.0%
Base imponible
87.9%
Falsos positivos 3.8%
98.8%
Falsos positivos 0.0%
OrderRef
88.7%
Falsos positivos 6.2%
99.1%
Falsos positivos 0.0%
+10.4pp Ganancia media de precisión
−5.1pp Falsos positivos reducidos
3 Campos medidos

Preguntas frecuentes sobre evaluación de precisión.

~/invofox / faq.json
schema.json
1
2 ··"question" "¿Qué pasa si cambiamos el esquema a mitad del test?"
3
4 ··"answer" "Invofox versiona los esquemas automáticamente y alinea las definiciones de campos entre versiones para que los resultados sigan siendo comparables. Siempre sabrás si los cambios vienen de mejoras reales o de ajustes de esquema."
5
Precisión schema.json
main 0 errors 0 warnings UTF-8 LF JSON

¿Aún tienes dudas? Habla con nosotros