Talk To Me Computer: le contrôle vocal prend son envol

Si des paquets inattendus commencent à apparaître à votre porte, vous voudrez peut-être avoir un mot avec l'un de vos appareils intelligents.

Plus tôt ce mois-ci, un enfant de six ans à Dallas a demandé à sa famille Amazon Echo haut-parleur intelligent pour une maison de poupée. Et Alexa, l'assistant artificiel Siri-like d'Amazon, rapidement a ordonné un à leur maison.

Un reportage de San Diego TV a repris l'histoire, et l'a répétée par inadvertance quand l'un des présentateurs a commenté: «J'aime la petite fille, en disant:« Alexa ordonne-moi une maison de poupée. »Entendant cela, plusieurs autres appareils Amazon dans les maisons San Diego tenté d'acheter plus de maisons de poupées.

CW6 San Diego rapport de nouvelles sur l'achat accidentel de maison de poupée d'Alexa.

{youtube}oI2KLIULjXc{/youtube}

L'histoire peut paraître étrangement familière à quiconque a essayé d'avoir une conversation avec Siri d'Apple ou Cortana de Microsoft. Nos appareils sont devenus très bons à nous écouter, mais cela ne signifie pas toujours qu'ils comprennent.

Des chercheurs de Microsoft l'ont récemment identifié comme un problème potentiel avec les interfaces parlantes d'aujourd'hui: ils sont commercialisés comme des assistants «intelligents», avec des blagues intelligentes et des connaissances du monde, mais ils nous frustrent souvent avec leur manque de bon sens.


graphique d'abonnement intérieur


Dans un petite étude, les chercheurs ont constaté que les personnes qui continuaient à parler à leurs assistants numériques au fil du temps étaient celles qui avaient commencé avec les attentes les plus faibles.

Que fait réellement une interface vocale?

Lorsque vous parlez à une interface vocale, elle doit:

  • "Entendez" le son de votre voix, et le distinguez du bruit de fond
  • comprendre où chaque mot commence et se termine, en ignorant vos "umms" et "ahhs"
  • faire correspondre le son de chaque mot avec un mot du dictionnaire, en sélectionnant le bon du contexte s'il y a homophones
  • interpréter correctement la signification de la phrase entière
  • générer une réponse significative et utile qui correspond à votre demande.

Chacun d'entre eux est un défi technique complexe, et différentes sociétés de technologie ont progressé dans différents domaines.

Google Now est en mesure d'apporter des réponses pertinentes à un large éventail de demandes, car il bénéficie des données de Google sur le Web et de vos activités personnelles si vous utilisez les services Google.

Amazon Echo est particulièrement à l'écoute de vos demandes à travers une pièce bruyante, grâce à une matrice de microphone à champ lointain antibruit. Bien sûr, il est également bon à faire des achats via Amazon.

Au cours des dernières années, les interfaces vocales sont devenues beaucoup plus efficaces pour comprendre la parole quotidienne ou «naturelle» plutôt que seulement des commandes guillochées et soigneusement formulées. Ils sont toujours mieux à gérer des questions simples, comme "Qui joue dans l'Open d'Australie?", Et ont tendance à se battre avec des demandes plus complexes, comme "Qui joue à l'Open d'Australie pour la première fois cette année?" questions, comme "va-t-il pleuvoir pendant les finales?".

La situation est encore plus contrastée pour les langues autres que l'anglais: alors que Siri prend en charge plus de langues et de dialectes 40, jusqu'ici, Alexa n'est disponible qu'en anglais et en allemand. Mais toutes ces fonctionnalités sont en constante amélioration.

Où les interfaces vocales bégaient

Ainsi, les interfaces vocales prendront bientôt toute notre technologie, comme le prédit le film Son? Gartner, une société de recherche en technologie, a des prévisions que d'ici l'année prochaine, 30% de nos interactions avec la technologie seront des conversations avec des interfaces vocales.

Mais les interfaces vocales ont des limites, et toutes ne peuvent pas être résolues par une meilleure technologie.

La voix est un moyen central d'interfaçage avec la technologie dans le film Her de Spike Jonze.

{youtube}ne6p6MfLBxc{/youtube}

La pollution sonore est un obstacle majeur. Votre appareil peut-il distinguer ce que vous dites du bruit de fond qui vous entoure? La technologie peut aider avec cela, y compris la réduction du bruit, la reconnaissance vocale personnalisée et la lecture des lèvres.

Mais qu'en est-il du bruit de fond que vous créez pour les autres en parlant à votre appareil intelligent? Imaginez une personne assise à côté de vous au bureau - ou dans un avion - discutant avec Siri pendant que vous essayez de lire, et vous pouvez voir pourquoi les interfaces vocales ne sont pas toujours socialement acceptables.

Une autre série de problèmes vient des exigences mentales des interfaces vocales. Apprendre à utiliser un système basé sur la voix peut être difficile, surtout s'il n'y a pas d'écran, comme avec Amazon Echo.

Si vous avez déjà appelé une banque ou une compagnie de téléphone, vous savez que la combinaison misérable de la concentration et de l'ennui provenant de l'écoute d'une voix synthétisée liste toutes vos options pendant que vous attendez celle dont vous avez besoin et essayez de ne pas les mélanger en haut Les interfaces graphiques traditionnelles évitent ce problème en vous montrant les options disponibles et en vous permettant d'appuyer rapidement sur votre choix.

Après avoir appris les commandes vocales, les utiliser peut être source de distraction. Les chercheurs ont trouvé que les commandes vocales dérailler votre train de pensée plus qu'une souris et un clavier.

Ceci est particulièrement dangereux pour les interfaces vocales embarquées: deux études de l'Université de l'Utah ont montré que distrait pendant jusqu'à 27 secondes après avoir utilisé les commandes vocales.

University of Utah / Fondation de l'AAA pour la sécurité routière: recherche sur la distraction du conducteur.

{vimeo} 108281698 {/ vimeo}

Trouver sa voix?

Il est donc peu probable que les interfaces vocales prennent entièrement le relais, mais elles trouveront des niches utiles dans nos vies. Ils sont déjà fréquents dans les voitures, où ils deviendront moins gênants lorsque la technologie s'améliorera.

Dans la cuisine, vous pouvez demander à Alexa de vous parler à travers une recette ou de mettre à jour votre liste de courses pendant que vos mains sont en train de cuisiner. En réalité virtuelle et augmentée, les interfaces vocales peuvent vous permettre de contrôler le système lorsque vous ne pouvez plus voir vos mains.

Dans l'apprentissage des langues, ils peuvent être utilisés pour pratiquer la prononciation. Plus important encore, les interfaces vocales aident les utilisateurs ayant une déficience motrice, un RSI ou une dyslexie à surmonter leurs handicaps.

Les interfaces vocales sont une technologie attendue depuis longtemps et il y a de bonnes raisons de penser que leur temps est enfin arrivé. Rappelez-vous juste qu'ils ne peuvent pas encore être aussi intelligent qu'ils en ont l'air. Et vous pourriez vouloir mettre un code PIN sur les achats de voix si les enfants sont autour.

The Conversation

A propos de l'auteur

Fraser Allison, candidat au doctorat en interaction homme-machine, Université de Melbourne

Cet article a été publié initialement le The Conversation. Lis le article original.

Articles Similaires

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market et Amazon