Chez les grands acteurs du marché, les plateformes de cloud computing ne cessent de s’enrichir en accueillant de nouveaux services et outils pour le développement d’applications, le développement web, le développement mobile, l’internet des objets, les analyses, l’intelligence artificielle, le machine learning, etc.
En ce qui concerne l’intelligence artificielle et le machine learning, Google vient de lancer une nouvelle API baptisée Cloud Vision qui vient compléter les services et outils fournis par sa plateforme Google Cloud. D’après la firme de Mountain View, l’API Cloud Vision permet aux développeurs d’exploiter le machine learning et la reconnaissance d’images dans leurs applications. « Les développeurs peuvent désormais créer des applications puissantes qui peuvent voir et le plus important, comprendre le contenu des images », a écrit Ram Ramanathan, Product Manager chez Google. « L’API Cloud Vision classifie rapidement les images dans des milliers de catégories, détecte les visages avec les émotions associées, et reconnaît les mots imprimés dans de nombreuses langues. Avec l’API Cloud Vision, vous pouvez construire des métadonnées sur votre catalogue d’images, modérer du contenu offensant, ou permettre de nouveaux scénarios marketing par le biais de l’analyse d’images de sentiment. »
D’après Ramanathan, l’API est le résultat des progrès de Google dans le domaine du machine learning. Ces progrès seraient alimentés par des plateformes telles que TensorFlow, le tout dernier système de machine learning que la société a également rendu open source. Ces plateformes ont permis de construire des modèles sophistiqués capables d’apprendre et d’identifier le contenu des images. Lesquels modèles ont été encapsulés dans l’API Cloud Vision comme une API REST facile à utiliser.
Pour en venir aux fonctionnalités de l’API de Google, il faut noter :
- la détection Étiquette/Entité : elle permet de choisir l’entité dominante dans une image, à partir d’un large éventail de catégories d’objets. Avec l’API, vous pouvez aussi créer facilement des métadonnées sur votre catalogue d’images, permettant de nouveaux scénarios comme les recherches basées sur les images ou des recommandations ;
- la reconnaissance optique des caractères : elle permet d’extraire du texte à partir d’une image. L’API Cloud Vision peut en plus détecter automatiquement la langue du texte, et elle prend en charge une variété de langues ;
- « Safe Search Detection » : alimentée par Google SafeSearch, cette fonctionnalité vous permet de modérer facilement les contenus, grâce à sa capacité à détecter un élément inapproprié au sein d’une image ;
- la détection faciale : cette fonctionnalité permet de détecter l’apparition d’un visage sur des photos, avec les traits du visage associés tels que le placement des yeux, du nez et de la bouche, et quelques attributs comme la joie et la tristesse ;
- la détection des points de repère : la fonctionnalité permet d’identifier les structures naturelles et artificielles populaires, qui se démarquent dans leur environnement proche et qui peuvent donc servir de point de repère dans cet environnement. Pour un point de repère détecté, l’API Cloud Vision fournit également la latitude et la longitude associées ;
- la détection de logo : la fonctionnalité permet d’identifier les logos de produits au sein d’une image.
L’API Cloud Vision est actuellement disponible en préversion limitée via la plateforme Google Cloud. Pour ceux qui sont désireux de la tester, en plus de disposer d’un compte Google Cloud Platform, ils doivent s’enregistrer sur une page dédiée.
S’enregistrer pour essayer l’API Cloud Vision
Source : Blog Google Cloud Platform
Et vous ?
Qu’en pensez-vous ?
Voir aussi
Forum Cloud Computing