Voici un guide pratique pour vous aider à repérer l'écriture de l'IA.

Voici un guide pratique pour vous aider à repérer l'écriture de l'IA.

Image source de la Fondation Wikimedia

Il est toujours un peu surprenant pour moi de savoir à quel point Wikipedia est devenue fiable, car j'ai passé toute mon enfance à être informé par les adultes de ne jamais lui faire confiance. Mais le site est devenu une archive indispensable et dynamique. Il est facile de rechercher, rigoureusement cité et plein de trous de lapin amusants pour se perdre. C'est une grande victoire pour tous ceux qui tiennent toujours une rancune contre leurs professeurs de collège.

Ce n'était pas inévitable, et beaucoup de travaux de personnes ont conduit à ce changement de réputation. « Nous savons que nous avons la responsabilité de bien faire les choses et surtout à cette époque quand il y a tellement de désinformation », a déclaré le co-fondateur de Wikipedia Jimmy Wales à la BBC en 2021, « les gens nous font confiance pour au moins essayer de bien faire les choses, et c'est plus que vous ne pouvez dire pour certains endroits. » (Et pour en savoir plus sur la fiabilité du site au fil des ans, Wikipedia vous a couvert, bien sûr.)

L'une des plus grandes menaces pour la convivialité et la fiabilité d'Internet en ce moment est l'IA. Les modèles de grands langues déchaînent un flot de pension qui menace de dégrader ou même de tuer Internet. Wikipedia se débat activement avec cette menace et a mis en place un guide sur les signes d'écriture de l'IA, un «catalogue de modèles très communs observés sur plusieurs milliers de cas de texte généré par l'IA, spécifique à Wikipedia.«Cela vaut le coup pour quiconque cherche à être plus sauvage de repérer l'écriture du robot.

Wikipedia trie les problèmes en un tas de grands seaux, invoquant tous de vrais exemples d'écriture d'IA découverte sur Wikipedia. «Langue et ton» comprend une mauvaise syntaxe et un langage auxquelles les tendances de l'IA; Le «style» comprend des listes AI comme des listes, des emojis et les tirets EM désormais tristement célèbres; Et «Communication destinée à l'utilisateur», comprend des choses qu'un éditeur paresseux pourrait laisser dans son texte IA collé, comme des invites ou des réponses sycophantiques joyeuses d'un LLM.

Ces sections ont des inférences intéressantes sur le fonctionnement de l'IA en fonction de son matériel de programmation et de formation. Par exemple, la positivité servile de bon nombre de ces modèles est basée sur sa tendance vers une moyenne. Les LLM «ponillent ainsi des faits spécifiques, inhabituels et nuancés (qui sont statistiquement rares) et les remplaceront par des descriptions plus génériques et positives (qui sont statistiquement communes», ce qui conduit à quelque chose qui ressemble à «crier plus fort et plus fort qu'un portrait montre une personne générique unique», tandis que le portrait lui-même est une photographie forte dans une fleurie, un croquis générique ».

Les sections finales, le «marquage» et les «citations» sont plus techniques et spécifiques à Wikipedia, traitant des erreurs de mise en forme et des indices backend qu'une IA a bricolouillé dans un article, ce qui ne fera probablement que du sens aux wikipediens dédiés.

Rien de tout cela n'est destiné à un guide de vente normatif pour Wikipedia. «Cette liste n'est pas une interdiction de certains mots, phrases ou ponctuation», écrivent-ils, mais c'est plutôt une façon de repérer «potentiel signes d'un problème, pas Le problème lui-même.  » Autrement dit, les hoquets de l'IA «peuvent indiquer des problèmes moins visibles extérieurs qui comportent des risques politiques beaucoup plus graves».

J'ai l'impression que Wikipedia n'est pas catégoriquement opposé aux LLM, mais qu'ils n'ont pas encore été convaincus que ces outils sont assez bons pour produire du texte à leurs normes. Et au-delà, c'est une menace pour leur fonction centrale. L'incapacité de l'IA à effectuer les tâches demandées par les utilisateurs trop crédules est une menace pour la fonctionnalité et la confiance des utilisateurs de Wikipedia, et qui pourrait passer inaperçue si les éditeurs ne soient pas prudents. Wikipedia ne veut pas non plus que les entreprises à but lucratif utilisent leur site comme sac de punch pour renforcer leurs produits. Un essai intéressant sur Wikipedia et LLMS, comprend la grande ligne que «Wikipedia n'est pas un terrain de test».

C'est dommage que Wikipedia puisse dépenser autant d'énergie pour le vandalisme génératif, mais je suis impressionné par leur sérieux engagement à maintenir une encyclopédie fiable qui peut être un service à n'importe qui – imaginez si d'autres sociétés technologiques voyaient leurs services sous le même jour?

Ces modèles continueront sans aucun doute à changer les façons dont ils lancent du texte, il n'y aura donc jamais une façon infaillible de dire à Cranker Sols de l'écriture humaine. Beaucoup d'entre nous, les écrivains de viande, aiment également utiliser des tirets EM.

Des articles comme celui-ci, ce catalogue AI, les racontent, seront des ressources utiles pour tous les surfers Web qui sont investis dans un Internet utilisable et fabriqué à la main. Des milliers de dollars sont versés pour aider à le camouflage de l'IA dans notre langue. Être un peu plus exigeant en tant que lecteurs pourrait aider à atténuer une partie de la mise en place de l'IA, et serait une bonne chose en général. S'il y a une chose sur laquelle j'ai toujours espéré sur une boîte à savon (c'est-à-dire, envoyer des SMS à mes amis sans cesse), c'est que nous avons tous besoin de bien meilleures compétences en maîtrise des médias.

Donnez un coup d'œil aux «signes de l'écriture de l'IA» et continuez à lire de manière critique!

Publications similaires