Réflexion sur les impacts culturels de l'intelligence artificielle

21 février 2023

Le cœur de métier d'Agaetis, c'est l'informatique avancée. Nous sommes donc volontiers plus prompts à nous précipiter sur les nouvelles technologies qu'à les dénigrer. Notre expertise nous apporte cependant le recul nécessaire pour modérer notre enthousiasme et les appréhender d'un œil critique, comme nous l'avons fait récemment avec un article sur l'éthique des données .

Nous vous proposons, par le présent article, d'aborder l'impact culturel de l'intelligence artificielle (IA), telle qu'elle est amenée à se démocratiser dans notre vie quotidienne. Précision importante : par « intelligence artificielle », nous entendons ici les techniques et méthodes de traitement avancé de l'information (IA « faible »), et non l'utilisation de systèmes dont le comportement ou l'organisation suggérerait une forme d'« intelligence » propre (IA « forte »).

Mais commençons par considérer brièvement, sans a priori, trois exemples de disciplines faisant appel à l'intelligence artificielle, que l’on en viendrait presque à qualifier de « triviaux » tant leur usage est devenu commun. Promis, nous reviendrons ensuite sur le sujet qui nous intéresse.

« Il ne lui manque que la parole »

Le traitement du langage et celui de la parole figurent parmi les champs de recherche les plus actifs de l'IA. Rien de surprenant, tant ces sujets sont intrinsèquement complexes et passionnants, et les enjeux (économiques, mais pas seulement) colossaux. Dans ces domaines, l'intelligence artificielle autorise d'ores et déjà des prouesses insensées.

Reconnaissance de la parole

Les travaux sur la reconnaissance automatique de la parole n’ont pas attendu l’IA : des ingénieurs des laboratoires Bell ont construit Audrey, un système permettant de distinguer et reconnaître les chiffres énoncés, dès… 1952 ! Dix ans plus tard naissait son successeur, Shoebox, le premier calculateur à reconnaissance vocale.

L'intégration du deep learning au processus a cependant permis d'atteindre des performances sans précédent, au point qu'en 2016 Microsoft a annoncé que leur système de reconnaissance vocale était objectivement plus fiable qu'un transcripteur de métier !

Shoebox , le premier calculateur à reconnaissance vocale, par IBM. (Image : archives IBM .)

Traduction automatique

Du côté du langage écrit , les capacités d'un traducteur automatique comme DeepL sont particulièrement « bluffantes ». Il reste évidemment possible de le mettre en défaut, notamment en lui soumettant des phrases polysémique (ambiguïté sémantique) ou des tournures grammaticales avancées, mais cet outil est aujourd'hui capable de reconnaître correctement des formulations alambiquées et d'identifier de nombreuses erreurs d'orthographe ou de grammaire — à tel point qu'une double traduction « français → anglais → français » de certains textes peut s'avérer mentalement apaisante pour le lecteur…

En tout état de cause, en termes de fidélité de traduction, DeepL est vraisemblablement déjà au niveau d'un locuteur de niveau avancé (B2) sur l'échelle du CECRL (le cadre européen de référence pour les langues ), au moins pour le français et l'anglais — soit bien meilleur que beaucoup de monde…

Hypertrucages

À notre connaissance, certaines des prouesses les plus impressionnantes de l'IA n’avaient même pas été envisagées par les écrivains de science-fiction les plus visionnaires. Ainsi, les « Deep Fakes  », ou « hypertrucages », n'ont pas fini de faire parler d'eux. Ces contenus multimédias générés ou modifiés par ordinateur permettent (entre autres) de faire dire n'importe quoi à n'importe qui, créant de fait une « vérité alternative », avec un potentiel de nuisance infini que nous n'aborderons pas ici.

Bien que ce ne soit pas l'application la plus médiatisée, il est possible grâce aux hypertrucages audio de faire de la synthèse vocale mimétique, c’est-à-dire de construire, à partir des caractéristiques de la voix d'une personne, un contenu vocal artificiel (discours, dialogue, cri, chant…) quasiment indiscernable de l’original.

Évidemment, les hypertrucages ne sont qu'un outil, et on pourra (probablement…) leur trouver des applications « positives » — nul doute qu’un vidéaste souhaitant multiplier son audience à l’international y trouvera son compte.

Et la culture, dans tout ça ?

Une application conjointe de ces trois exemples devrait sauter aux yeux. Car s'il est une invention qui figure, elle, sur le podium des inventions les plus communes des auteurs de science-fiction, c'est bien le traducteur instantané . Un rêve déjà devenu réalité, car de nombreux appareils autonomes et de nombreuses applications sur téléphone portable, à des degrés de sophistication divers, rendent déjà ce service, et ce n'est qu'une question de temps avant que ces dispositifs ne se démocratisent.

Qui ne rêve pas de disposer, à l’instar des habitants de l’univers du « Guide du routard galactique » imaginé par Douglas Adams, d’un traducteur instantané universel, tel que le Poisson de Babel, invisible une fois introduit dans l’oreille ? (Image : capture d’écran de la série télévisée éponyme, BBC.)

Et c'est là que l'on peut se poser la — ou plutôt les — question(s) de l'impact culturel des progrès de l'IA (nous n’aborderons pas la question politique d’un remplacement de professionnels humains par leur avatar automatisé et de son impact économique).

Car devant le pouvoir offert par cette assistance technologique conjurant la « malédiction de Babel », quelle place reste-t-il pour l'apprentissage (et donc l'étude) des langues ? Dans un environnement sans barrières linguistiques, comment convaincre écoliers et étudiants de l'intérêt du polyglottisme ? Doit-on craindre une diminution de l'attrait des langues ? Une raréfaction des professeurs de langue ?

Par ailleurs, l'apprentissage des langues est une gymnastique cérébrale généralement reconnue comme saine et protectrice. Doit-on craindre des effets délétères sur les cerveaux d’enfants déjà sur-sollicités par le monde numérique ? Ou une perte de variété linguistique, les IAs fonctionnant généralement par simplification plutôt que par extrapolation ? Auquel cas, quid de l'influence du langage sur la pensée ?

Est-ce réactionnaire que de s'en inquiéter (notez que c'est un ancien élève réfractaire aux cours de langues qui vous parle…) ? Au contraire, se poser un maximum de questions pour ensuite examiner rationnellement les plus pertinentes nous semble l’approche la plus saine.

Enfin, aussi évolués soient-ils, on l'a évoqué plus haut, les modèles de langage sont encore hermétiques à de nombreuses subtilités langagières, et il est probable qu'en vertu du principe de Pareto , la résolution de ces difficultés soit encore hors de portée — a fortiori lorsque l'on commence à prendre en considération les accents locaux, les fautes de grammaire et d'orthographe (de plus en plus fréquentes ?), le langage SMS (parfois « réflexe »…), les lapsus et autres inversions involontaires de sens, ou encore l’ironie… D’autant que les mots ne sont pas seuls porteurs de sens — que celui qui n’a jamais mal interprété jette à HAL 9000 le premier monolithe de Rosette… —, or les IA sont encore loin de maîtriser les intonations et le langage corporel !

L’interprétariat est une discipline souvent subtile et parfois lourde de conséquences. (Image : capture d’écran du film « Premier contact », de Denis Villeneuve.)

L'utilisation de ces systèmes dans le cadre de la diplomatie n'est pas non plus des plus rassurantes… Espérons que l'on puisse encore compter (pour combien de temps ?) sur la lucidité de leurs utilisateurs, qui demanderont vraisemblablement confirmation à un traducteur humain avant de déclarer une guerre sur un malentendu, mais qu'en sera-t-il lorsque, ce qui ne manquera pas d'arriver, des IA seront branchées en amont d'un dispositif complètement automatisé, tel que le sinistre « Systema Perimetr » russe¹ ?

Généralisation

Quel que soit l'angle d'approche, il semble indubitable que ce type d'application résulte en un appauvrissement culturel voire intellectuel global. Mais loin d'être restreints au domaine linguistique, les effets pervers d’utilisations a priori positives de l'IA concernent tous les domaines. Par ailleurs, l'IA n'est en réalité qu'un cas particulier d'une tendance à la simplification amorcée depuis l'industrialisation, et qui s'est accélérée avec l'avènement de l'informatique, avec la perte de nombreux savoir-faire. Seulement les possibilités promises par l'IA dans un avenir proche semblent sans commune mesure avec tout ce qui était envisageable jusqu'à présent².

Humains 3.0 pendant une panne de réseau et/ou d’électricité (allégorie). (Images : domaine public.)

Il serait sain qu'un comité d'éthique citoyen se mette en place pour étudier sereinement ces questions, sans a priori, et proposer le cas échéant des mesures non coercitives permettant de neutraliser les effets néfastes de ces avancées technologiques, afin qu'elles puissent être réellement considérées comme des progrès.

Il serait sain aussi que les chercheurs, ingénieurs et développeurs soient force de proposition.

Il serait sain, enfin et surtout, que chaque utilisateur prenne conscience des enjeux de son asservissement aux solutions technologiques de facilité, se pose la question du prix invisible ³ à payer pour son confort, et ne les considère plus comme des REMPLACEMENTS mais comme des ACCOMPAGNEMENTS, sans quoi il finira par s’y brûler les ailes… Mais l'on sort ici largement du seul cadre de l'IA.

Oh  ! Mais… nous n'avons même pas abordé ChatGPT ? Il faudra qu'on en parle.

¹ Mis en place pendant la guerre froide dans un objectif de « destruction mutuelle assurée » (en anglais « MAD », pour Mutual Assured Destruction ), le système « Périmètre » est un dispositif entièrement automatisé, et supposément toujours en activité, censé déclencher le lancement de missiles balistiques nucléaires intercontinentaux en représailles en cas d'attaque détectée des organes de commandement de l'armée russe… Voir la vidéo de vulgarisation du vidéaste Astronogeek sur le sujet.

² Pour se faire une idée de l’impact possible de l’accoutumance aux IAs faibles, on relira avec profit « Sept fois neuf » ( A Feeling of Power ), une courte nouvelle d’Isaac Asimov ( texte original en anglais , et version française — lecture de quelques minutes).

³ Auquel s’ajoutent évidemment le coût écologique et le coût social…

< Post plus ancien

Post plus récent >

Ressources Agaetis

ORY 4 : L’entrepôt d'Amazon le plus robotisé de France

par Florian Ruynat • 15 mai 2024

Introduction : Florian Ruynat, Architecte Cloud, a récemment réalisé une visite captivante de l'entrepôt ORY4, l'un des complexes les plus automatisés d'Amazon en France. Au cœur de cette installation logistique de 152 000 m², où 3 000 employés orchestrent l'approvisionnement et la préparation des commandes, la technologie de pointe est omniprésente. Cette visite a permis d'explorer les possibilités d'intégration de l'IT moderne dans les usines de quatrième génération via le cloud, avec une attention particulière portée à la gestion proactive des pannes, la surveillance des conditions opérationnelles comme la température, ainsi que la gestion des stocks.

Sora : Transformer les Textes en Scènes Vidéo Réalistes et Imaginatives

par David Walter • 16 février 2024

OpenAI, a récemment dévoilé SORA, un outil de génération de vidéo. SORA monte encore une marche, offrant des capacités de génération de vidéos réalistes. Cet article explore les caractéristiques clés de SORA, son impact potentiel sur diverses industries, les points de réflexions et l'impact pour l'avenir de la création de contenu. Qu'est-ce que SORA ? SORA est une interface avancée conçue par OpenAI qui permet de générer des séquences vidéo à partir de descriptions textuelles simples. Utilisant des techniques de pointe en matière d'intelligence artificielle et d'apprentissage profond, SORA est capable de comprendre des commandes complexes et de les traduire en contenus visuels impressionnants. Une qualité de génération inégalée La capacité de SORA à générer des vidéos époustouflantes souligne un tournant dans le domaine de la production vidéo, où la qualité et la créativité ne sont plus entravées par des contraintes techniques ou financières. Cette avancée s'inscrit dans un contexte plus large où l'IA transforme profondément les industries créatives, offrant des outils puissants pour la transcription, le doublage, la création d'avatars générés par IA, et même la suppression de fonds vidéo, rendant ces processus plus accessibles et flexibles. Des outils comme Descript et Adobe Premiere Pro intègrent des fonctionnalités AI pour améliorer le processus d'édition vidéo, depuis la rotation des yeux jusqu'à la génération de transcriptions et sous-titres. De même, la comparaison entre DALL-E 3 et Midjourney montre comment l'IA peut capturer des détails et des ambiances spécifiques dans les images, un principe également applicable à la vidéo. La révolution du streaming vidéo illustre comment l'adaptation numérique bouleverse les modèles économiques traditionnels, offrant une perspective sur la manière dont les technologies génératives pourraient remodeler le paysage médiatique. L'impact de ces technologies dépasse la simple création de contenu ; elles remodèlent également notre compréhension de la créativité et ouvrent de nouvelles voies pour l'expression artistique et la communication. Avec des outils comme SORA, la barrière entre l'idée et sa réalisation se réduit, permettant à un plus grand nombre de personnes de donner vie à leurs visions créatives sans les contraintes traditionnelles de la production vidéo. Cet élan vers une qualité de génération inégalée par l'IA soulève des questions importantes sur l'avenir du contenu créatif et la manière dont nous valorisons l'interaction entre l'humain et la technologie dans le processus créatif. Alors que nous explorons ces nouvelles frontières, il est crucial de rester attentifs aux implications éthiques et aux défis que ces technologies posent, tout en reconnaissant leur potentiel pour enrichir notre monde visuel et narratif.