Mejoras en la extracción de información visual de documentos bancarios con modelos multimodales y LLaMA-Factory en Amazon SageMaker HyperPod

Elena Digital López

La industria bancaria enfrenta desafíos significativos debido a la ineficiencia en procesos repetitivos, afectando operaciones cruciales como la extracción de información y la auditoría de documentos. Estas tareas demandan recursos humanos sustanciales, ralentizando procedimientos esenciales como las normativas de Conozca a Su Cliente (KYC), solicitudes de préstamos y análisis de crédito. Así, las instituciones financieras enfrentan limitaciones operativas, como baja escalabilidad, lentitud en procesamiento y altos costos de formación y rotación de personal.

Para mitigar estos problemas, se está recurriendo a sistemas avanzados de extracción de información. Estos sistemas permiten extraer datos rápidamente de documentos financieros, reduciendo errores manuales y tiempos de procesamiento. La tecnología de extracción de información se vuelve crucial para agilizar la incorporación de clientes, mantener el cumplimiento normativo y fomentar la transformación digital del sector bancario, especialmente para procesar grandes volúmenes de documentos.

La complejidad de los documentos bancarios demanda soluciones especializadas para asegurar alta precisión al manejar datos sensibles. Apoidea Group, una empresa de software independiente con sede en Hong Kong, ha desarrollado innovadoras soluciones de inteligencia artificial generativa y aprendizaje profundo para satisfacer las necesidades de los bancos multinacionales. Su producto estrella, SuperAcc, es un servicio avanzado de procesamiento de documentos que utiliza modelos patentados de comprensión documental para manejar diversos tipos de documentos.

Con SuperAcc, el proceso de expansión financiera, que antes tomaba 4 a 6 horas, ahora se completa en solo 10 minutos, y el personal necesita solo 30 minutos para verificar los resultados. En la banca para pequeñas y medianas empresas, la revisión de estados de cuenta de seis meses se ha reducido a solo 10 minutos. Esto acelera los flujos de trabajo y minimiza el riesgo de errores manuales.

Pese a la eficacia de tecnologías como SuperAcc, la transformación digital en banca enfrenta obstáculos en seguridad y cumplimiento regulatorio. Se requiere que las instituciones financieras cumplan con estándares como ISO 9001 e ISO 27001. Además, la integración con sistemas bancarios heredados presenta desafíos, ya que muchas de estas infraestructuras son obsoletas frente a los rápidos avances tecnológicos.

Para potenciar las capacidades de extracción de información, se necesita infraestructura avanzada de aprendizaje automático. Amazon SageMaker HyperPod proporciona un entorno eficiente para ejecutar cargas de trabajo de ML y desarrollar modelos de última tecnología, acelerando el desarrollo al eliminar tareas complicadas en la construcción y mantenimiento de clústeres computacionales.

Los recientes avances en modelos multimodales han mostrado una notable capacidad para procesar información visual y textual compleja. Estos modelos representan un cambio significativo en la comprensión de documentos, combinando procesamiento robusto de texto con comprensión visual avanzada, mejorando la precisión y eficiencia computacional.

Se ha colaborado para explorar el uso de modelos de lenguaje visual de gran tamaño junto con las capacidades de SageMaker HyperPod. Experimentos han demostrado que estos modelos mejoran el reconocimiento de estructuras tabulares en documentos financieros. La adaptación de estos modelos para tareas específicas de comprensión documental aporta ventajas significativas, transformando cómo las instituciones financieras manejan y procesan sus documentos operacionales.

Scroll al inicio