Informatique

Microsoft progresse un peu plus dans le domaine des chatbots : XiaoIce

Son chatbot chinois, parvient à tenir une conversation qui semble naturelle

De nos jours, lorsque les gens échangent avec des assistants numériques ou des chatbots, la conversation suit généralement le même schéma : l’une des parties écrit ou dit quelque chose tandis que l’autre partie prend connaissance de cette information puis répond. Si cela s’avère efficace, pour Li Zhou, ingénieur responsable de XiaoIce, le chatbot social populaire en Chine, note que cela a un gros inconvénient : « Les gens ne parlent pas comme ça. »

Au lieu de cela, note-t-il, quand la plupart des gens sont au téléphone ou bavardent en personne, ils parlent et écoutent en même temps – prédisant souvent comment l’autre pourrait finir une phrase, pouvant interrompre quelqu’un quand c’est approprié ou rompre un silence gênant en s’orientant vers une nouvelle réflexion basée sur les informations qu’ils collectent.

Et Microsoft pense avoir réalisé la première percée technologique qui va permettre aux humains d’avoir une conversation avec un chatbot alimenté par une IA qui ressemblera davantage à la seconde expérience (conversation plus naturelle donc) qu’à la première (qui est plutôt classique pour le domaine).

L’entreprise a récemment incorporé ces avancées dans XiaoIce, un chatbot social de Microsoft qui compte plus de 200 millions d’utilisateurs en Asie, et elle travaille à appliquer les mêmes avancées à d’autres chatbots sociaux, dont Zo de Microsoft aux États-Unis.

Dans le langage des télécommunications, la percée permet à XiaoIce de fonctionner en « full duplex » (il s’agit ici d’un terme qui désigne la capacité à communiquer simultanément dans les deux sens, comme un appel téléphonique). Il diffère du « semi-duplex », qui ressemble plus à l’expérience de talkie-walkie dans laquelle une seule personne peut parler à la fois.

Zhou a déclaré que la nouvelle mise à jour, que Microsoft appelle « full duplex voice sense », augmente également la capacité de XiaoIce à prédire ce que la personne avec laquelle elle échange va dire par la suite. Cela l’aide à prendre des décisions sur comment et quand répondre à quelqu’un qui discute avec elle, un ensemble de compétences qui est très naturel pour les humains, mais pas encore commun dans les chatbots.


Li Zhou, engineer lead de XiaoIce

« C’est l’art de la conversation que les gens utilisent dans leur vie quotidienne », a expliqué Zhou.

Cette mise à jour permet également de réduire le temps de latence non naturel qui peut parfois donner un caractère forcé aux interactions avec les chatbots.

« Cela accélère vraiment ses réponses pour qu’elles semblent beaucoup plus naturelles », a affirmé Ying Wang, un directeur de Microsoft qui supervise Zo.

En outre, la nouvelle technologie signifie que les utilisateurs n’ont pas besoin d’utiliser un « mot de réveil » – généralement, le nom du chatbot – chaque fois qu’ils répondent pendant les conversations.

Cette mise à jour vient également améliorer d’autres compétences développées par XiaoIce, comme la capacité de mettre en pause une chose qu’elle fait (vous raconter une histoire, par exemple) afin qu’elle puisse faire autre chose, comme allumer une lumière. Elle peut alors se rappeler de revenir à son histoire. À ce propos, Microsoft rappelle qu’il arrive que les humains changent de sujet dans une conversation pendant un moment, puis reviennent au sujet d’origine.

Rappelons que la semaine dernière Microsoft a annoncé une réorganisation structurelle autour du cloud et de l’intelligence artificielle dans une tentative de développer ses capacités dans ces domaines. Il ne sera donc probablement pas rare de voir ce genre d’initiative se multiplier.

Autres aticles de la rubrique

Vidéo du jour

Duel de la semaine

Newsletter

Je souhaite rester informé et recevoir toutes les informations sur TechDeGeek dans ma boite mail