Usages de la technologie vocale : enfin des chiffres parlants

Image 1.001

Cet article est une adaptation libre de la conférence SuperBot de Dashbot, particulièrement éclairante sur les usages de la technologie vocale. Dashbot est une entreprise spécialisée dans les analytics chatbot et voice, elle a levé 3 millions de dollars en janvier dernier. Créée il y a 3 ans, celle-ci a d’ores et déjà traité une quantité de données colossale soit 67 milliards, collectées sur plus de 17 000 chatbots et skills Amazon.

Au sujet des utterances

Les utterances concernent tout ce qu’un utilisateur peut être amené à dire à l’occasion d’une interaction avec un assistant vocal, une skill ou une action. Dashbot relève que seul Google voice permet d’accéder aux utterances les plus récurrentes. Là pas de surprise on retrouve les « hello », « hi », « yes », « no » ainsi que les commands & controls « stop », « repeat », etc. 

Ces observations sont édifiantes en ce qu’elles permettent d’identifier les comportements humains pour in fine, les restituer dans les skills. Ainsi, dans le cas de la technologie vocale, un utilisateur ne se contentera pas de dire « yes » ou « no ». En réalité les négations et affirmations peuvent revêtir des formes très diverses. De fait, en lieu et place d’un simple « yes », l’utilisateur pourra être amené à se répéter « yes, yes » voire « no, no, no » s’il est pressé. 

Cette observation valide donc la pratique d’UX design qui consiste à faire jouer le rôle de la skill ou de l’action par un interlocuteur humain. Cette bonne pratique vise à rendre l’interaction la plus concise et la plus claire possible. 

À l’issue d’un échange, la skill ou l’action aura répondu correctement à l’intent (Utterance reflétant l’intention de l’utilisateur, qui doit entraîner une réaction de la part de l’assistant) d’un utilisateur. Celui-ci sera alors susceptible de vouloir quitter la skill. Or, certains ne se contenteront pas de dire « stop » mais auront recours à des éléments de langage hauts en couleur, de « shut it off » à « shut the f*** up ». Ces constats sont riches d’enseignements en ce que les UX designers ne prennent pas toujours en compte ces cas de figure. 

Autre point règle fondamentale de l’UX design mise en lumière par Dashbot : ne pas laisser l’utilisateur dans l’incompréhension. Les analytics de Dashbot relèvent que c’est un des points principaux de frustration pour l’utilisateur. Aussi, il convient de décider à l’avance si la skill ou l’action doit rester active à l’issue de la response à un intent. Faut-il attendre une utterance de l’utilisateur ou au contraire, la suspendre en le signifiant clairement à l’utilisateur. 

Il en va de même si celle-ci reste active. En effet, de nombreux cas illustrent le fait que l’utilisateur ne sait pas si celle-ci est toujours active ou non. 

Qu’en est-il des chiffres relatifs aux usages de la technologie vocale ?

En parallèle de ses analytics, Dashbot a mené un sondage auprès d’utilisateurs de devices connectés. En ressort d’abord une ambivalence concernant le sentiment de l’utilisateur à l’égard de la device. D’une part, ils sont surpris de se voir si bien compris par cette technologie nouvelle. D’autre part, eux même ne comprennent pas toujours la response du device à leur intent. Cela illustre la nécessité de personnaliser la response renvoyée à l’utilisateur en fonction du contexte. 

Un autre point intéressant car spécifique aux interfaces vocales veut que les utterances des utilisateurs soient sans filtre. Elles varient ansi du « I love you » au « F*** off ». En réalité, elles reflètent parfaitement le sentiment de l’utilisateur à l’égard de la technologie. Elles s’avèrent donc très constructives car révélatrices de ce que l’utilisateur pense, ce qui donne des clés pour améliorer l’UX. 

Au sujet des chiffres relatifs à la fréquence d’utilisation d’un device et de leur éventuel impact sur les habitudes de l’utilisateur, Dashbot relève que 60% des sondés y ont recours plusieurs fois par jour. Par ailleurs, ils sont 15% à l’utiliser une seule fois par jour. Aussi, on constate que trois-quarts des sondés l’utilisent au moins une fois par jour, ce qui est notable !

Quant au changement des habitudes : deux tiers pensent que cette utilisation des skills et actions a modifié leurs habitudes. A l’inverse, ils sont 19% à considérer que cela n’a pas modifié leurs habitudes. 

Pourtant, un tiers de ces 19% utilisent leur device plus d’une fois par jour et 17% l’utilisent au moins une fois par jour. En clair, la moitié (50%) des 19% affirment que cela n’a pas changé leurs habitudes. Pourtant, ils ont recours au moins une fois par jour à la technologie vocale. Ce qui prouve paradoxalement que cela a bel et bien modifié leurs habitudes ! 

Quels usages pour la technologie vocale ?

Là encore, pas de surprise, d’autres études avaient déjà mis en lumière ces usages. À savoir : écouter de la musique, puis consulter la météo et enfin obtenir des informations. Dashbot relève une égalité des usages en fonction des sexes bien qu’ils relèvent certains usages plus genrés. Ainsi, les hommes affichent une appétence pour les sports et la consultation des actualités sportives. Plus étonnant encore : les hommes sont aussi plus portés sur shopping que la gent féminine. 

On constate également une évolution en ce qui concerne les commandes passées via un device. D’une part, ces commandes concernent des produits disponibles sur Amazon ou Google Shopping (à 80%). D’autre part, 50% de ces commandes correspondent à des livraisons de repas. 

Plus intéressant encore : ces commandes constituent généralement une répétition d’une commande déjà effectuée par le passé. Ce comportement est compréhensible car il est plus facile de procéder de la sorte plutôt que passer une nouvelle commande. Ce comportement est d’ailleurs observé par les entreprises de la food tech qui notent un comportement habituel chez leurs clients. 

A la question de savoir s’ils étaient prêts à recommander la même chose, 40% des sondés ont répondu que c’était très probable. Une part de 20% a reconnu que c’était (seulement) probable. Or, s’il s’agit d’une commande qu’ils avaient déjà effectuée par le passé, le chiffre passe à 75%.

Le plus gros indicateur au sujet des commandes consiste à savoir si l’utilisateur possède deux devices ou un seul. Ainsi, 60% de ceux qui avaient déjà effectué une commande via leur device possédaient un Google Home et un device connecté à Alexa. Le chiffre tombe à 40% pour ceux qui ne possèdent qu’un seul des deux devices. Il en va de même pour la possibilité d’une commande future. Ainsi, 60% des sondés possédant deux devices répondent favorablement contre 25-30% pour ceux qui n’en ont qu’un seul. 

On peut donc considérer que les utilisateurs ayant deux devices ont une appétence plus prononcée pour la technologie vocale. Ils y ont par conséquent plus recours. Les hommes semblent aussi être plus attachés au fait de commander via leur device.

Quels taux de satisfaction pour les skills, actions et devices connectés ?

Il s’avère que 45% des utilisateurs sont très satisfaits de leur device et 30% en sont assez satisfaits. Aussi, 75% (45% + 30%) des utilisateurs en sont satisfaits (de manière modérée à plus marquée). En ce qui concerne les skills, il ressort que la découverte des skills pose problème. En effet, moins de 50% des utilisateurs ont utilisé une, deux ou trois skills maximum. Pour 14% d’entre eux, ils n’en ont jamais utilisé ! A ce propos, nombre de gens ne savent même pas que cela s’appelle une skill ! Pareil pour Google, d’autant qu’ils ont changé plusieurs fois le nom des actions..

La première source d’information des utilisateurs pour les skills semble être les médias sociaux. Particulièrement grâce au paid content, de même que les vidéos des influencers qui montrent comment utiliser la skill.

Il apparaît donc comme nécessaire de construire sa communication et de l’axer sur l’utilisation de la technologie. Sur 60 000 skills, 65% n’ont pas été notées et 80% de celles qui ont été notées 1 étoile, ne l’ont été que par un seul utilisateur. Pareil pour celles qui ont été notées 5 étoiles (à 60+%).

Enfin, 95% des skills n’obtiennent pas plus de 15 notations. Les jeux remportent la première place. Toutefois, les skills business et musique obtiennent des notations plus élevées, de même que les skills dédiées à la domotique. 

Ci-dessous, retrouvez la vidéo de la conférence SuperBot de Dashbot dans son intégralité :

Inscrivez-vous à la newsletter vokode

Recevez chaque semaine le meilleur de l’actualité à propos des assistants vocaux et des innovations liées à l’audio digital. 

Les articles similaires