Site icon Vokode

Jarvis, l’IA qui donne un visage et une voix aux marques

Jarvis

Nvidia, entreprise leader de la conception de cartes graphiques introduit Jarvis.

Jarvis est une création de Nvidia, leader mondial dans la conception de cartes graphiques. Cette technologie – dont le nom n’est pas sans rappeler une certaine saga de la franchise Marvel – permet aux entreprises de créer leur propre avatar conversationnel.

Jensen Huang, CEO de Nvidia justifie la création de Jarvis du fait que l’IA conversationnelle représente « le futur de nombreuses industries ». D’autant plus maintenant que « les applications comprennent mieux et communiquent de manière nuancée en prenant en compte le contexte« .

Jarvis, une IA pour le support client ?

La Keynote de présentation de Jarvis par Nvidia

Les entreprises peuvent développer leur propre IA grâce au framework de Jarvis, qui exploite des données vidéo et vocales. A ce propos, l’IA est en mesure de modéliser un visage à partir d’un enregistrement vocal. À la manière des facemojis, l’avatar restitue le mouvement des lèvres et les expressions faciales de manière plutôt convaincante.

De fait, Jarvis peut être utilisé pour de nombreux secteurs : de l’éducation aux services financiers en passant par la santé. Pour la modélisation 3D d’un avatar, l’IA exploite les données vocales et les restitue à la manière d’un film en motion-capture. À l’exception près qu’il utilise des données vocales traitées par la technologie GPU de Nvidia. Plus elle dispose de données audio, plus la modélisation est subtile.

Or, cette modélisation « audio-to-face » n’est qu’une des centaines possibilités offertes par Jarvis.

IA conversationnelle et monde post-pandémie

Nous l’avons déjà évoqué à plusieurs reprises : avec les contraintes liées au coronavirus le conversationnel – donc plus largement le vocal – a sa carte à jouer.

L’IDC (International Data Corporation) prévoit que les investissements dédiés à l’IA conversationnelle passeront à 13,8 milliards en 2023. L’année dernière, ils s’élevaient à 5,8 milliards. Même si Nvidia semble cantonner Jarvis aux fonctions support, n’oublions pas que le vocal ne se limite pas à l’efficience il est aussi et surtout expérientiel. L’exemple récent de la skill Alexa MoonPie MoonMate en est la preuve. Or, jamais l’expérience-client n’a revêtu une telle importance qu’aujourd’hui.