L’annonce d’un présentateur de journal virtuel dont l’apparence a été calquée sur celle de l’animateur de télévision en chair et en os Zhang Zhao a défrayé les manchettes à l’échelle internationale. C’est à l’occasion de la 5e conférence mondiale de l’Internet organisée en Chine que le présentateur mû par l’intelligence artificielle (IA) a été dévoilé par l’agence de presse étatique chinoise Xinuha News. De quoi donner froid dans le dos à certains journalistes de télévision, puisque la diffusion d’une nouvelle télévisée par une IA démontre que l’homme pourrait être remplacé par une machine du jour au lendemain.
Ce sont les ingénieurs de Xinuha qui ont réussi à enregistrer l’apparence du présentateur humain Zhang Zhao et à lui faire prononcer les textes voulus. Depuis le 8 novembre 2018, le présentateur IA lit directement les textes qui sont rédigés par de tierces parties; vous pouvez le voir à l’œuvre sur les réseaux sociaux et le site Web de l’agence de presse.
Les dirigeants de Xinuha estiment que les présentateurs IA leur seront particulièrement utiles pour la diffusion de nouvelles de dernière heure. En dépit du fait que la voix un peu saccadée du présentateur manque de naturel pour le moment, le présentateur IA peut travailler sans relâche, ce qui est jugé avantageux par les propriétaires de l’agence de presse. En effet, les présentateurs virtuels n’ont pas besoin de pauses de travail, ne réclament pas de salaire et restent d’humeur égale.
Cette avancée technologique ne doit pas nous faire oublier que les chercheurs à la base de cette prouesse sont rattachés à l’Université Paul Allen de Washington et qu’ils ont créé dès 2017 des vidéos vraisemblables de Barack Obama en train de parler. Il ne s’agit pas de l’ex-président des États-Unis, bien entendu, mais tous ceux qui voient les vidéos sur YouTube n’y voient que du feu tant la vidéo est réaliste. Un réalisme plus poignant que le fait de visionner Zhang Zhao en mode IA !
Tandis que certains s’enthousiasment devant la performance du présentateur IA chinois, d’autres considèrent qu’il est difficile de le regarder pendant plus de deux minutes, car pour l’heure, sa voix monotone et ses expressions faciles parfois étranges ne sont pas captivantes.
D’autres prédisent que les fausses nouvelles deviendront encore plus efficaces, puisqu’il est possible de faire dire n’importe quelle parole à n’importe quelle personne avec des vidéos. Cela existait déjà en photojournalisme et dans le monde de la vidéo, mais c’était bien plus difficile à employer et à camoufler. Bienvenue dans le monde d’aujourd’hui où il ne faudra plus croire ce que l’on voit.