Compartir:
En un entorno donde el contenido digital debe ser accesible a nivel global, 123RF, un líder en el suministro de activos digitales libres de regalías, ha hecho progresos notorios en la democratización del acceso multilingüe. Durante el año 2023, 123RF dio un paso adelante al implementar Amazon OpenSearch Service, mejorando el reconocimiento de imágenes mediante una búsqueda semántica basada en vectores. Este avance colocó a la empresa en una posición ideal para integrar Amazon Bedrock y el modelo Claude 3 Haiku de Anthropic, incrementando la eficiencia en la moderación de contenido y acelerando la traducción.
La compañía enfrentó desafíos relacionados con la traducción de contenido a 15 idiomas adicionales. Aunque gozaban de popularidad entre los angloparlantes, el uso exclusivo de inglés en títulos y palabras clave restringía el acceso a su vasta colección de activos digitales. Google Translate, con su traducción continua, se consideró insostenible, mientras que modelos como Claude Sonnet de Anthropic o GPT-4 de OpenAI no eran rentables. El modelo GPT-3.5 de OpenAI calmó las preocupaciones de costos, pero no ofrecía consistencia en la calidad de salida, lo que llevó a 123RF a perseguir una solución más fiable.
Con la incorporación de Amazon Bedrock y Claude 3 Haiku, y una estructura de almacenamiento vectorial, 123RF logró traducir los metadatos de manera eficiente, reduciendo enormemente los costos e incrementando la accesibilidad global a su contenido. El principal obstáculo para 123RF fue combinar calidad y costo en la traducción masiva. La traducción precisa de títulos y descripciones generados por usuarios a 15 idiomas era vital para maximizar la utilidad de su biblioteca, lo que presentó desafíos técnicos y financieros.
Uno de los desafíos técnicos más destacados fue la resolución de entidades nombradas, que consistía en identificar y mantener nombres propios, marcas y referencias culturales intactos al trasladarse entre idiomas. Por ejemplo, el nombre de un punto de referencia como la Torre Eiffel debe conservarse a través de las traducciones.
123RF probó diversos modelos de lenguaje. Los modelos avanzados como GPT-4 y Claude Sonnet proporcionaban calidad superior pero eran demasiado costosos. Mientras que los modelos más económicos, como GPT-3.5, sacrificaban la calidad. Eventualmente, Amazon Bedrock ofreció el equilibrio necesario entre calidad de salida y costo.
Además, el equipo de 123RF desarrolló técnicas de ingeniería de prompts avanzadas para optimizar el desempeño del modelo de lenguaje, mejoradas con un almacenamiento vectorial para resultados óptimos. Gracias a estas innovaciones, 123RF consiguió una reducción del 95% en sus costos de traducción, mejorando la calidad y permitiendo una expansión ágil hacia nuevos mercados.
Mirando hacia el futuro, 123RF planea ampliar su cobertura a más de los 15 idiomas iniciales y explotar mayores integraciones de IA generativa. Esto fortalecerá la moderación y personalización de recomendaciones de contenido, posicionando a 123RF como un ejemplo de cómo la inteligencia artificial puede facilitar la globalización del contenido digital, superando con éxito las barreras lingüísticas.