Les derniers créateurs de contenu IA peuvent-ils rivaliser avec les écrivains humains ?
Publié: 2022-06-21La création de contenu IA a fait d'énormes progrès ces dernières années. Les médias s'extasient sur le fait que les robots écrivent des fanfictions maintenant. Un ingénieur de Google a affirmé que le chatbot qu'il construisait était si bon qu'il pourrait être sensible. Avec toutes ces avancées, il peut sembler que l'IA moderne peut s'avérer égale à un écrivain humain.
La réalité est un peu plus compliquée. Derrière chaque écrit divertissant de l'IA, il y a des dizaines de brouillons absurdes qui n'ont pas été imprimés. Même l'IA la plus avancée a du mal à écrire plus d'une centaine de mots sur un même sujet. Le langage est un système incroyablement complexe qui a évolué sur des milliers d'années, il n'est donc pas vraiment facile à coder.
La création de contenu basée sur l'IA peut former des phrases, structurer des paragraphes et parfois raconter une histoire. Pourtant, les éléments humains essentiels de l'écriture - tels que l'humeur, l'intention et l'émotion - sont hors de portée des technologies les plus avancées.
Les programmes de création de contenu IA peuvent fournir un point de départ aux écrivains humains, mais ils sont encore loin de les remplacer. Étant donné à quel point le langage est fondamental pour l'expérience humaine, le remplacement des écrivains humains par l'IA n'est peut-être même pas possible.
Qu'est-ce que la création de contenu IA ?
Au niveau le plus élémentaire, la création de contenu IA consiste à programmer un ordinateur pour écrire un contenu similaire à ce qu'un humain écrirait. Cette technologie est basée sur des décennies de programmes de génération de langage naturel. Depuis presque aussi longtemps que les ordinateurs existent, les programmeurs du NLG essaient de leur apprendre à lire et à écrire.
Générer ou imiter ?
Une chose clé à comprendre à propos de la création de contenu IA est que l'IA ne crée pas de contenu elle-même - du moins, pas de la même manière qu'un écrivain humain le ferait. Il n'y a pas de code source pour la créativité. Au lieu de cela, l'IA tente de copier le contenu existant écrit par l'homme d'une manière qui peut tromper un lecteur en lui faisant croire qu'il est authentique.
Pour ce faire, l'IA analyse le choix des mots, la longueur des phrases et des milliers d'autres mesures à partir d'échantillons écrits par l'homme. Les programmeurs peuvent également fournir des règles et des modèles souhaités pour la sortie de l'IA. Par exemple, ils peuvent demander au programme de n'utiliser que les cent mots les plus courants en anglais pour faciliter la lecture.
L'IA analyse ensuite les échantillons écrits par l'homme, les croise avec ses règles programmées et compile tout ce qu'elle a appris dans sa meilleure approximation d'un article écrit par l'homme.
À quel point la création de contenu IA est-elle avancée aujourd'hui ?
Pendant des décennies, l'écriture générée par ordinateur n'a jamais pu passer pour quelque chose d'écrit par une personne réelle. Les premiers programmes NLG étaient limités par la mémoire et la puissance de traitement des ordinateurs de l'époque. Aujourd'hui, avec des ordinateurs beaucoup plus avancés et Internet, les programmes d'IA peuvent référencer des millions d'articles écrits par des humains pour aider à générer leur contenu.
Avec les progrès de la création de contenu basée sur l'IA, les programmeurs n'ont plus à saisir de règles de sortie. Au lieu de cela, l'IA peut référencer des articles écrits par des humains pour générer ses propres règles, apprenant efficacement à mieux imiter le langage par elle-même.
L'IA la plus avancée pour la création de contenu aujourd'hui s'appelle GPT-3. Il est basé sur une énorme base de données linguistique appelée OpenAI. Vous avez probablement vu le travail de GPT-3 faire le tour d'Internet. Il a tout généré, des faux scénarios de Harry Potter aux rubriques "Modern Love" pour le New York Times.
Quelles sont les limites du contenu créé par l'IA ?
GPT-3 est une technologie impressionnante, mais il y a encore des limites à la proximité avec laquelle un ordinateur peut imiter l'écriture humaine. Quelques problèmes majeurs affectent le contenu créé par l'IA à tous les niveaux.
La qualité est incohérente
Chaque élément de contenu créé par l'IA est une tentative d'imiter un humain, et toutes ces tentatives ne réussissent pas. Pour tout projet que vous donnez à une IA à écrire, il y aura plusieurs résultats inutilisables pour chaque brouillon passable.
L'expérience "Modern Love" du New York Times mentionnée précédemment est un excellent exemple de cette incohérence. Le Times a demandé au GPT-3 d'écrire des dizaines de courts articles de bien-être sur la façon dont un couple hypothétique aurait pu se rencontrer pour la première fois. Quelques-unes des histoires étaient décalées mais restaient dans le domaine du possible. De nombreuses autres colonnes n'ont manifestement pas été écrites par une personne réelle.
Une colonne contenait la phrase "Nous sommes allés dîner et boire et dîner et boire…" répétée en boucle pendant plus d'une centaine de mots. Pour rappel, il s'agit du programme de création de contenu IA le plus avancé au monde à l'heure actuelle. Soit GPT-3 entrait dans sa phase postmoderne, soit il y a encore place à l'amélioration sur le front de la cohérence.
L'IA ne peut écrire que de courtes pièces
La création de contenu basée sur l'IA est particulièrement utile pour les petits extraits de texte. Les colonnes du NYT écrites par GPT-3 ne comportaient que quelques centaines de mots, et la majorité n'avait aucun sens à la fin. Les fissures dans le contenu créé par l'IA commencent à apparaître au-delà d'une centaine de mots.