La paradoja del papel: por qué la IA documental todavía no ha sustituido el trabajo manual
De piloto a producción · 01
El 61 % de los flujos de procesamiento inteligente de documentos aún implican papel. Casi la mitad de las empresas prevé que sus volúmenes de papel aumenten el año que viene. No que disminuyan. Que aumenten.
Fuente: AIIM / Deep Analysis · Market Momentum Index: IDP Survey 2025 · n=600
Estos datos proceden de una encuesta de 2025 de AIIM y Deep Analysis a 600 empresas de Estados Unidos y Europa. Todas con ingresos superiores a 10 millones de dólares, más de 500 empleados, abarcando finanzas, sanidad, fabricación, seguros, energía y administración pública. No son empresas que no hayan oído hablar de la IA. El 78 % ya la tiene operativa. El 65 % está buscando activamente nuevas iniciativas de procesamiento documental.
Saben que la tecnología existe. La han comprado. Muchas de ellas la están comprando otra vez.
Fuente: AIIM / Deep Analysis · Market Momentum Index: IDP Survey 2025
Dos de cada tres nuevas operaciones de IDP son sustituciones de herramientas que ya fracasaron. Eso no es un problema de adopción. Es un problema de confianza. Y es la factura de un sector que optimizó para demos en lugar de para producción.
El 80 % de los datos empresariales sigue atrapado en documentos
Tanto Gartner como IDC estiman que aproximadamente el 80 % de los datos empresariales no están estructurados: correos electrónicos, PDFs, formularios escaneados, contratos, imágenes. Solo alrededor del 18 % de las organizaciones está aprovechando eficazmente alguno de ellos. McKinsey cifra la oportunidad en un 40 % menos de costes de procesamiento y un 70 % de reducción en los plazos cuando los flujos documentales están realmente automatizados.
Pero las cifras de AIIM revelan cómo es "realmente automatizado" en la práctica. Las máquinas de fax siguen siendo parte del proceso en el 37 % de los casos. No solo en la sanidad estadounidense: la estadística se mantiene en todas las regiones encuestadas. Más de la mitad de los encuestados afirma que carece de la experiencia técnica para que sus inversiones en IDP funcionen.
Y cuando se pregunta a los directivos qué es lo más importante en su estrategia de automatización, la precisión gana. No la velocidad. No la reducción de costes. La precisión. Porque sin ella, solo estás cometiendo errores más rápido. El presupuesto de experimentación se ha agotado. Los consejos de administración quieren ROI dentro del año fiscal. O generas impacto medible o pierdes la financiación. Ese es el clima.
La pregunta nunca fue "¿puede la IA leer un documento?" Es "¿puede la IA leer tus documentos, de forma fiable, a escala, sin que alguien revise su trabajo cada vez?"
La trampa de la extracción: por qué la extracción documental falla en producción
Un proveedor hace una demo de su plataforma. Entra una factura en PDF limpia, sale JSON estructurado. La métrica de precisión dice 98 %. El comprador firma.
Entonces llega producción.
Todo comprador de IDP reconoce este patrón
Los documentos reales no son documentos de demo. Están escaneados en ángulo, llegan en tres idiomas en la misma página, tienen anotaciones manuscritas, maquetaciones no estándar, tablas que se parten entre páginas. El sistema que obtuvo un 98 % en el benchmark obtiene un 70 % con los datos reales del cliente. La "automatización" se convierte en una cola de validación. Humanos corrigiendo lo que la máquina hizo mal, campo por campo.
La herramienta no falló porque la IA sea mala. Fue construida para entradas limpias y desplegada contra entradas sucias. Funcionó en la demo. No funcionó en producción.
Así que la empresa compra una herramienta nueva. Tasa de sustitución del 66 %.
Antes de convertirte en otra estadística de sustitución
Si estás evaluando infraestructura de procesamiento documental, ya sea construyéndola internamente, uniendo parsers de código abierto o comprando una plataforma, los datos de AIIM deberían cambiar lo que pides.

01 · "¿Qué ocurre cuando el sistema se equivoca?"
Todos los proveedores afirmarán tener una precisión superior al 95 %. Esa cifra no significa nada sin contexto. ¿Precisión sobre qué documentos? ¿Medida cómo? ¿Con qué umbral de confianza? Lo que importa es la puntuación de confianza a nivel de campo: que el sistema te diga cuánto confía en cada valor extraído. "99 % de confianza en el total de la factura, 62 % de confianza en el número de pedido" le da a tu equipo algo con lo que trabajar. Un sistema que arroja valores y cruza los dedos es la razón por la que la mayoría de los flujos de trabajo siguen atados al papel.
02 · "¿Puedo ver de dónde en el documento viene esto?"
El visual grounding vincula cada campo extraído con su ubicación exacta en el documento fuente. Esto es lo que hace auditables las decisiones de la IA. Con las regulaciones de la UE endureciéndose (ViDA, DORA, mandatos de facturación electrónica por país), no puedes gobernar lo que no puedes rastrear. Si tu sistema de extracción no puede mostrarte qué región de qué página produjo un valor determinado, no tienes una pista de auditoría. Tienes una caja negra.
03 · "¿Funciona esto con mis datos reales, hoy?"
No con un dataset de demo. No con un benchmark. Tus documentos: los problemáticos, los que están en tres idiomas con notas manuscritas y maquetaciones rotas. Si un proveedor no puede demostrar su rendimiento con tus datos reales antes de que firmes, estás comprando un piloto destinado al ciclo de sustitución del 66 %. Pide una prueba de concepto con tus documentos más difíciles. Esa prueba te dice todo lo que la presentación comercial no te dirá.
Qué separa realmente los sistemas de producción del software de demo
El sector IDP plantea su evolución como el paso de la entrada de datos al "motor de decisiones". Es una dirección correcta, pero yo lo enfocaría de otra manera.
La línea divisoria está entre sistemas que funcionan en producción y sistemas que funcionan en demos. Herramientas que gestionan el 80 % limpio frente a infraestructura que gestiona el 100 % problemático. Extracción que necesita validación humana frente a extracción que se gana la confianza mediante transparencia: puntuaciones de confianza, visual grounding, pistas de auditoría.
Las empresas que están sustituyendo sus sistemas IDP no están atascadas porque la IA sea mala. Están atascadas porque el sector vendió herramientas de calidad de demo y las llamó preparadas para empresa. La solución no es un modelo más inteligente. Es un modelo más honesto. Un sistema que te diga lo que sabe, lo que no sabe y dónde mirar.

Eso es lo que estamos construyendo en anyformat. Puntuación de confianza a nivel de campo, visual grounding hasta el documento fuente, >97 % de precisión con datos reales de clientes en producción. Sin necesidad de entrenamiento. El tipo de sistema donde "funciona en la demo" y "funciona con tus datos" significan lo mismo.
Este es el primer artículo de "De piloto a producción", una serie sobre cómo es la IA documental cuando tiene que funcionar de verdad. Próximamente: por qué los benchmarks de precisión están rotos y qué debería sustituirlos.
Envíanos tus documentos más difíciles →
Compara anyformat: vs Google Document AI · vs AWS Textract · vs ABBYY · vs Reducto · Todas las comparaciones →
Juan Huguet · CEO y cofundador, anyformat.ai · Ingeniero Nuclear · Doctor en Física


