Compartir:
Microsoft ha dado un paso importante en la mejora de la accesibilidad y productividad de sus dispositivos al introducir una nueva funcionalidad multimodal en su modelo de lenguaje pequeño, Phi Silica. Este avance está diseñado específicamente para los dispositivos Copilot+ que utilizan procesadores Snapdragon y se extenderá a futuros modelos de Intel y AMD.
La actualización destaca por su capacidad de comprensión visual, permitiendo al modelo no solo interpretar texto, sino también imágenes. Esto es especialmente útil para tecnologías de asistencia como los lectores de pantalla, ya que genera descripciones visuales que pueden ser utilizadas por personas con discapacidades visuales.
Una de las características sobresalientes de esta nueva funcionalidad es su eficiencia. A diferencia de las implementaciones tradicionales que requieren un modelo de visión dedicado, Phi Silica optimiza los recursos utilizando componentes ya existentes, y solo agrega un modelo proyector de 80 millones de parámetros. Esto asegura un funcionamiento efectivo sin comprometer el rendimiento.
Además, el sistema ofrece la opción de generar descripciones de imágenes con diversos niveles de detalle. Las pruebas han demostrado que el modelo optimizado puede proporcionar descripciones breves en unos cuatro segundos y descripciones más detalladas en aproximadamente siete segundos. Esta rapidez es posible gracias a la utilización de capacidades locales, lo que hace que las descripciones sean más accesibles y rápidas en comparación con las que dependen exclusivamente de la nube.
La calidad de las descripciones generadas ha sido cuidadosamente evaluada comparando a Phi Silica con modelos de referencia como Florence. Los resultados confirman que las descripciones de Phi Silica son más precisas y completas, lo que amplía su utilidad para quienes dependen de estas herramientas.
En el futuro, Microsoft planea incluir más idiomas en este sistema, reforzando así su compromiso con la inclusión y accesibilidad en el ámbito tecnológico. Con estas mejoras, Microsoft subraya su dedicación a reducir las barreras para los usuarios que enfrentan desafíos en el uso de tecnologías digitales.