El gigante de Redmond ha anunciado hoy la presentación preliminar de Windows Vision Skills, una serie de paquetes de NuGet que permitirá a los desarrolladores solucionar de manera más fácil algunos problemas en la creación de proyectos de visión por computadora a través de un conjunto sencillo de API.

A través de una publicación en su blog, Microsoft explicó que el lanzamiento estará disponible para habilidades de detección de objetos, reconocimiento de emociones y detección de esqueletos. En este sentido, Eliot Cowley, escritor de desarrolladores de la compañía, explicó en un documento:

La industria se está moviendo a un ritmo acelerado, y la cantidad de soluciones personalizadas que están surgiendo hace que sea difícil para los desarrolladores de aplicaciones mantenerse al día. El marco de Windows Vision Skills está diseñado para facilitar el uso de la visión artificial. Estandariza la forma en que los módulos de visión artificial se utilizan en una aplicación de Windows que se ejecuta en el dispositivo local.

Asimismo, se conoció que los desarrolladores pueden incorporar estas habilidades a cualquier aplicación Win32, .NET y UWP. Las API de WinRT son de fácil uso y no necesita que los desarrolladores tengan conocimiento previo sobre aprendizaje automático o visión artificial. Además, los desarrolladores de visión artificial tendrán la posibilidad de utilizar DirectML y DirectX en dispositivos con Windows luego de configurar sus soluciones como habilidades.

En la publicación, Microsoft explica que Windows Vision Skills puede ser ampliado para operar con frameworks de aprendizaje automático existentes y bibliotecas de la talla de OpenCV. En este sentido, las habilidades pueden unificarse dentro de una misma aplicación para enfrentarse a escenarios de gran complejidad o ser agrupadas en un mismo paquete.

Esta herramienta llega para complementar el soporte actual de Windows para la inferencia de modelos ONNX a través del uso de WinML para la inferencia local. Este marco permitirá desarrollar aplicaciones inteligentes mientras explota la optimización de dicha plataforma.