En guise de rappel, nous précisons que l’apprentissage automatique fait partie du domaine de l’intelligence artificielle et permet à une machine dotée de certaines capacités de s’appuyer sur des méthodes d’apprentissage afin d’effectuer des tâches qu’il serait difficile ou impossible à réaliser avec des algorithmes plus classiques.
La tendance actuelle étant à l’apprentissage automatique, Google vient d’annoncer la mise à la disposition du public d’une nouvelle famille de produits baptisée Cloud Machine Learning. L’annonce a été faite lors de la conférence des utilisateurs de la plateforme cloud de Google qui s’est tenue cette semaine aux États-Unis.
Cloud Machine Learning est un ensemble d’outils qui « fournit des services modernes d’apprentissage automatique avec des modèles préentrainés et une plateforme permettant de générer vos propres modèles sur mesure ». Il s’appuie sur la bibliothèque d’apprentissage automatique open source TensorFlow qui utilise des graphes de flux de données pour les calculs numériques.
Selon Google, ces nouveaux services cloud accessibles au public permettent de construire facilement de grandes échelles de modèles précis d’apprentissage automatique dans un court laps de temps. Les personnes ou entreprises qui le souhaitent peuvent donc s’appuyer sur ces modèles pour développer rapidement des applications intelligentes.
Par ailleurs, afin d’offrir aux clients de cette plateforme des services plus complets, Google vient d’annoncer la disponibilité d’une nouvelle API de reconnaissance vocale. En plus donc des API telles que Google Translate pour la traduction textuelle en diverses langues ou encore Cloud Vision pour la reconnaissance du contenu des images, Google ajoute cette nouvelle API afin d’offrir aux développeurs la possibilité de convertir de l’audio en texte.
Google affirme que cette nouvelle API nommée Google Cloud Speech se base sur de puissants modèles de réseaux neuronaux et est capable de reconnaitre plus de 80 langues et variantes. Elle peut être utilisée pour « transcrire le texte des utilisateurs parlant au micro d’une application, pour activer la commande de contrôle vocal, pour transcrire des fichiers audio » et bien plus encore.
Pour l’heure, elle est offerte gratuitement. Toutefois, le produit étant encore à ses débuts, Google le propose en tant que préversion limitée. Pour pouvoir donc tester cette fonctionnalité, il va falloir s’inscrire en ligne et espérer être retenu parmi les personnes qui auront le privilège de tester cette API.
En outre, il faut noter qu’en proposant cette fonctionnalité, Google s’invite sur le terrain de chasse de l’entreprise Nuance qui constitue l’un des leaders sur ce marché. Et pour cause, c’est sa technologie qui propulse l’assistant vocal Siri disponible sur les appareils d’Apple. C’est le même qui permet à l’assistant vocal de Samsung S-Voice de fournir des réponses aux utilisateurs. Même les constructeurs d’automobiles tels que BMW, Chrysler, Ford et plusieurs autres encore font appel à l’expertise de ce dernier.
L’argument sur lequel Google pourra s’appuyer dans un premier temps pour titiller Nuance sur son terrain de prédilection est le nombre de langues supportées. L’API de Google supporte plus de 80 langues tandis que celle de Nuance semble supporter un peu plus d’une quarantaine.
Mais en plus de Nuance, Google aura également à faire face à d’autres concurrents tels que IBM qui offre également des services similaires à travers sa plateforme d’intelligence artificielle Watson ainsi que Microsoft et AWS pour ne citer que ceux-là.
Source : Blog Google Cloud Platform
Et vous ?
Que pensez-vous des nouveaux services cloud de machine learning proposés par Google ?
Google pourra-t-il faire face à la concurrence dans le domaine de la reconnaissance vocale et au-delà, des services d’apprentissage automatique ?
Voir aussi
Forum Intelligence artificielle