Un logiciel pourrait-il écrire des romans ?Olivier Las Vergnas,
|
Comme toutes les professions, l'édition est bouleversée par l’informatique, confrontée à son impact sur la fabrication technique des ouvrages et sur leur distribution. Et alors que les annonces de la généralisation du lecteur de poche de livres électroniques se multiplient, la toile Internet déborde de propositions d’hypermédias, et de jeux vidéo qui redessinent la frontière entre narration d’une intrigue et proposition d’un univers de gesticulation. Paradoxalement, la vieille question de littérature automatique semble progressivement oubliée sous cette déferlante de technologies ultra-mobiles aux milliards de couleurs. Serait-ce parce que la mode s’intéresse plus aux aspects cosmétiques des gadgets et des interfaces qu’au sens des histoires que l’on raconte ? Seuls quelques rares chercheurs veulent savoir si un logiciel pourrait écrire un roman classique, essayant de préciser où réside la différence la différence entre des assemblages combinatoire et la créativité humaine. L’idée d’un automate écrivain n’est pourtant pas récente : déjà Swift mettait en scène en 1726 un générateur de phrases, fait de cylindres et de dés. “Sur chaque face des dés étaient collés des papiers, et sur ces papiers on avait écrit tous les mots de la langue dans leurs différents modes, temps et déclinaisons, mais sans ordre. Le maître m’invita à regarder, parce qu’il allait mettre la machine en mouvement. À son commandement, les élèves prirent chacun une des manivelles de fer, au nombre de quarante, qui étaient fixées le long du métier, et, faisant tourner ces manivelles, ils firent changer totalement la disposition des mots. Le professeur commanda alors à trente-six de ses élèves de lire tout bas les lignes à mesure qu’elles paraissaient sur le métier, et quand il se trouvait trois ou quatre mots de suite qui pouvaient faire partie d’une phrase, il la dictait aux quatre autres jeunes gens qui servaient de secrétaires.” Ce dispositif préfigurait la combinatoire des « cadavres exquis » où chacun écrit à son tour en aveugle un mot d’une phrase ou des Exercices de style proposant quatre-vingt dix neuf versions de la même anecdote. Pour chercher l’illusion d’une imagination automatique dans la loi des grands nombres, pour développer ce type de littérature appelée « à contrainte » , Queneau et le mathématicien Le Lyonnais fondèrent en 1960 l’Ouvroir de Littérature Potentielle, l’OuLiPo . Il s’agissait « d’imaginer et d’expérimenter des contraintes littéraires nouvelles et d’étudier les œuvres passées à la lumière de ces nouveaux moyens ». Un intérêt semblable inspire la Bibliothèque de Babel fantasmée par Borgès pour accueillir tous les livres possibles de 410 pages ou le « miracle des singes dactylographes» inventée en 1913 par Borel pour estimer la probabilité d’un événement. Il propose l’expérience suivante : « Concevons que l’on ait dressé un million de singes à frapper au hasard sur les touches d’une machine à écrire et que sous la surveillance de contremaîtres illettrés, ces singes dactylographes travaillent avec ardeur dix heures par jour avec un million de machines à écrire de types variés. Les contremaîtres illettrés rassembleraient les feuilles noircies et les relieraient en volumes. . La machine de Swift permet de distinguer deux finalités aux littératures automatiques. D’un côté, les hypertextes proposent autant de versions que chaque lecteur souhaite . De l’autre, c’est un roman classique que l’on tente de produire. Le premier groupe a donné naissance à une communauté de passionnés de la fiction interactive et à de multiples œuvres hyper médiatiques caractérisées par “ une redéfinition de quelques-unes des notions qui semblaient orienter la littérarité. Au texte, jusque-là installé et immobilisé dans la matérialité du livre comme un produit figé, définitif, vérifiable, quasi sacralisé et intouchable, se substitue […] un ensemble de jeux dans lesquels le « lecteur » - comment l’appeler autrement ?- se trouve changé en joueur …” . Considérer émotions et tensions comme fondement de tout roman
A contrario, un roman classique impose un résultat immuable. Certes, pour y arriver un ordinateur peut générer des phrases aléatoires assemblées dans des paragraphes tirés au sort, eux-mêmes mis en brochette par une gigantesque loterie . Mais comment choisir parmi la multitude LE récit ? Il n’existe plus dans ce champ que quelques recherches universitaires , souvent liées à la théorie de la création littéraire . Ainsi, Rafael Perez y Perez , de l’université de Mexico, a développé le logiciel Mexica qui produit de courtes nouvelles mythologiques , représentées par un groupe d’émotions et de tensions entre personnages. Les actions modifient ces liens, créant des sentiments de trahison, d’amour, voire des paradoxes : une princesse est sauvée par un chevalier dont elle tombe amoureuse, mais elle devra le tuer et se suicider après avoir découvert qu’il faisait partie de la bande qui a assassiné son père. Fonctionnant comme tous ces logiciels sur un simple ordinateur portable de base , Mexica s’inscrit dans la filiation de Gester, Minstrel et Tale-Spin logiciels grâce auxquels les personnages d’un roman peuvent utiliser des algorithmes de résolution de problèmes inspirés de l’intelligence artificielle. Encadré : acheter un logiciel pour jouer à l’écrivainDes assistants écrivains sont aujourd’hui facilement disponibles dans le commerce, comme « Phraseo » , ou « J’écris un roman » , qui, à un traitement de texte, ajoutent divers des outils méthodologiques ou pédagogiques (aides contextuelles et fiches pour définir ses personnages et ses décors). Les romans personnalisables, comme la série “mon roman” , permettent quant à eux d’adapter une histoire déjà écrite : “Vous avez toujours eu envie d’écrire, mais vous ne trouvez ni le temps, ni le courage ? Devenez co-auteur du roman dont vous êtes le héros”. […]Pour écrire vos aventures, rien de plus simple : choisissez votre intrigue, vos personnages, leurs traits de caractères, le lieu, le style et de nombreux détails qui feront de ce livre le vôtre… et nous nous chargeons de la narration selon vos instructions. ” Avec un système informatique , le « co-auteur » agit sur des paramètres interchangeables comme les noms de personnages, des détails vestimentaires, de physionomie ou du décor. Mais, avec ces outils, l’ordinateur n’est pas mobilisé au service de la « générativité », c’est à dire de la capacité à produire de nouveaux récits, ni directement puisés dans un texte préexistant, ni rédigés par un humain. Passer du squelette aux paragraphesMais, un roman ne se limite pas à son intrigue et son écriture demande d’enchainer trois étapes : déterminer ce que l’on veut raconter, décider du scénario et enfin écrire le texte. Dans le cas du logiciel Romanesque , on part du principe qu’il s’agira d’une histoire de meurtres liés à des gares ; le logiciel part d’un synopsis standard : “un mobile pousse un coupable à commettre un crime dans une gare et le lecteur va chercher des indices qui permettront de le découvrir”. A partir d’un tel fil conducteur, comment peut-il procéder pour accomplir ces trois étapes ? Pour la première qui consiste à transformer ce squelette caricatural en une intrigue spécifique. Pour cela, l’humain utilisateur entre les paramètres de son projet éditorial à lui : mobile, coupable, indices. Il précise aussi le nombre de meurtres ainsi que les caractéristiques des personnages et le logiciel adapte le squelette en fonction. La deuxième étape est celle de la détermination détaillée de la narration et du découpage. Elle est liée au choix d’un type de récit : “je” raconte l’histoire ou au contraire le narrateur est omniscient, chronologique ou non. Une fois ces choix faits, le logiciel propose un découpage en scènes successives, précisant les personnages en jeu. Enfin, vient l’écriture du texte et la production de paragraphes composés de phrases. Scène par scène, la lecture devra permettre de se représenter l’action prévue, tout en suscitant curiosité, intérêt et émotions. Avec cet enchâssement d’échelle, un générateur de roman ressemble aux logiciels d’animation en 3D : ceux-ci fonctionnent aussi à de multiples niveaux, créant des formes squelettiques à base de vecteurs, les recouvrant de chairs, peaux et de textures et les mettant en mouvement sans oublier de les doter d’ombres. Générer des histoires en chassant les stéréotypesEn réalité, la principale difficulté est de ces automates d’arriver à surprendre. A contrario des romans à personnaliser, on attend d’eux qu’ils évitent le convenu : si le point de départ est stéréotypé, nous serons vite saturés d’histoires semblables. Pour y remédier il faudrait partir d’une arborescence de tous les types d’intrigues possibles, comme celle de l’OuLiPoPo , une branche spécialisée de l’Oulipo qui, sous l’impulsion de Le Lyonnais s’était fixée la mission « de recenser aussi exhaustivement que possible et de classer rationnellement les situations, les mécanismes et leurs combinaisons exploités par le roman policier d’énigme et plus largement toutes les situations et les mécanismes potentiels inutilisés, voire inutilisables » . Pour surprendre et être vraiment « génératif », Mexica fonctionne différemment, utilisant des méthodes heuristiques pour laisser se développer l’histoire, partant de quelques données sur les personnages . On va les soumettre à un problème, puis demander au logiciel d’examiner comment les faire agir au mieux . Ainsi, une princesse va être mise en danger par la chute d’un pont de liane. Parmi de multiples possibilités, le logiciel va lui faire obtenir de l’aide du chevalier Jaguar, car il a jugé cette solution comme le plus efficace pour la sauver. Ensuite, l’ordinateur interprètera (d’après une table de situations affectives) que ce genre d’entraide conduit à un sentiment de gratitude, qui peut se transformer en amour... et ainsi de suite jusqu’au dénouement. Une fois l’histoire formalisée, le logiciel évalue sa cohérence et son intérêt dramatique pour pouvoir le cas échéant l’améliorer. Une note est attribuée en fonction de l’intensité des sentiments évoqués (rencontrer le prince charmant, tuer son amant ou se suicider de désespoir) et de leurs bouleversements (découvrir tout à coup que le chevalier dont on est amoureux porte à la cuisse le tatouage caractéristique de ceux qui ont tué son père). S’entame alors une phase d’optimisation du récit conduite automatiquement par le logiciel, qui consiste à changer l’ordre des scènes, voire à en modifier certaines caractéristiques. Ici, la supériorité de l’ordinateur est indiscutable : il peut comparer autant de fois que nécessaire les variantes sans problème de lassitude, ce qui n’est en rien le cas de l’humain. Tous ceux qui se sont essayés à relire plusieurs fois un texte qu’ils viennent d’écrire savent combien il devient vite impossible de comparer les versions tant les effets de la lecture actuelle se mélangent aux souvenirs de la précédente. Faire ressentir et non expliquer ce que l’on devrait ressentirUne fois le scénario produit, reste à écrire le texte. Avant d’en arriver au niveau des mots et des phrases, on doit considérer la structure d’exposition de chaque scène, la façon de « planter le décor » et de faire entrer en action les personnages. Il faudra que l’ordinateur s’appuie sur des règles préalablement fournies. Il utilisera par exemple pour chaque début de chapitre un squelette comme « première phrase : précision de décor, - 2eme phrase : position du personnage : 3eme phrase : indication de son humeur - 4eme phrase : début d’une action … » et cela peut s’imaginer de manière fractale . Voilà qui nécessite de disposer d’un générateur sophistiqué de phrases, maîtrisant des règles syntaxiques complexes, mais aussi de dictionnaires sémantiques complets, thématisés pour pouvoir choisir des mots dans des registres compatibles, comme ceux utilisés par Balpe, chercheur français qui conçut dans les années 90 plusieurs générateurs de romans déjà jugés capables de produire des textes signifiants et émouvants. Comme pour un auteur humain, la difficulté réside dans la nécessité de faire ressentir et non d’expliquer, de suggérer et non de « tout dire ». Il s’agit de choisir ce que l’on va laisser deviner entre les lignes, en maitrisant ce que Gervais appelle le niveau « endo-narratif » : « Lire un récit est une activité double, elle demande au lecteur, d’une part, d’identifier les actions représentées et, d’autre part, de les intégrer à une narration. Or, l’endo-narratif, […] permet de rendre compte des processus d’identification des actions représentées, avant leur intégration à une narration ». Un champ de recherche passionnant, qui paradoxalement n’intéresse plus beaucoup aujourd’hui : d’une part les ex-spécialistes se préoccupent surtout de mélanges de textes, images et installations artistiques ; d’autre part, en raison du marché grandissant des systèmes communiquant en langage naturel, les technologies progressent à grande vitesse mais servent à créer des traducteurs automatiques ou des rédacteurs de dialogue pour des jeux vidéos… et nullement des romans ! Trouver de l’intérêt à la génération spontanéeDes logiciels du type de Romanesque sont donc sans doute plausibles à court terme . Mais dans quel but ? Aujourd’hui le problème de la littérature est plutôt la surproduction. Alors que faire d’un automate romancier ? A ce propos, Exemplaire de démonstration, un roman de Phillipe Vasset paru chez Pocket, est édifiant. Il met en scène le “ScriptGénérator” un outil qui recycle de la “littérature” comme n’importe quel autre bien industriel à partir de matières premières textuelles (histoires brutes, romans et scénarios achetés au poids). Et si l’on peut donc imaginer un automate « auteur », on ne peut pas imaginer un automate « éditeur » capable sans intervention humaine de porter un projet de conception et réalisation de roman . Même si de nouvelles formes de diffusion automatisées par des blogs par exemple, il faudra toujours un commanditaire, « un maître d’ouvrage » pour définir les principes du cahier des charges, évaluer la qualité, faire les choix et décider du projet éditorial. Voilà qui renvoie à la question clef : l’invention d’un logiciel écrivain n’aurait-elle pas comme seul effet que de modifier la répartition des taches éditeur/auteur ? Ainsi si dans quelques décennies, un logiciel permet à l’éditeur de se passer d’auteur, il l’obligera à assumer simultanément les deux responsabilités, en lui transférant celle des choix incombant d’ordinaire à l’auteur. Ainsi, au mieux, un automate générateur de roman supprimera pour cet éditeur/auteur des tâches fastidieuses comme celle de construire « machinalement » les détails des personnages ou des mises en abyme descriptives ; il le guidera dans sa narration en lui proposant des rebondissements adaptés ou des résolutions de problèmes audacieuses, en lui rappelant de ne pas oublier en route des personnages secondaires. Il pourra même comme Mexica lui permettre d’évaluer la solution narrative créant la meilleure intensité dramatique, les rythmes les plus accrocheurs. Il lui servira de « nègre » (de ghostwriter, écrivain fantôme, comme l’appellent les éditeurs anglo-saxons). Ces nouvelles relations auteur - lecteur ne seront que part d’une re-répartition des rôles entre éditeurs, diffuseurs et imprimeurs. Plus globalement, ce redécoupage entre concepteur-exécutant s’inscrira dans les transformations globales que l’informatique continuera de produire dans toutes les professions : dans l’édition, comme ailleurs elle conduira encore à de nouveau bouleversement de chaine. Identifier le gène de la créativitéReste encore à préciser où l’ordinateur pourrait puiser une capacité de création originale, apte à sortir des sentiers battus tout en restant porteuse de sens. La clef pourrait venir de trois capacités complémentaires des ordinateurs : celle de multiplier l’univers des possibles à l’infini, celle de d’objectiver des indicateurs d’amélioration de tel ou tel critère et celle de réaliser de multiples itérations sans lassitude. Les ordinateurs peuvent en effet à la fois : Reste à éviter de le contaminer avec toutes les inhibitions ou stéréotypes implicites à notre façon habituelle d’écrire. Il faut lui imposer suffisamment de règles d’assemblage des mots pour qu’il génère du sens, tout en le protégeant de toutes les habitudes inconscientes qui d’ordinaire interdisent d’accoler un adjectif sacrilège comme « exquis » au substantif « cadavre ». Une telle machine livrera parmi ses multiples combinatoires, certaines variantes qui transcenderont nos limites et nous paraîtront d’audacieuses créations. L’ordinateur pourrait ainsi innover parce qu’il bouleverse doublement le rapport à la mémoire. D’une part, il possède toutes les mémoires du monde et peut y stocker toutes les grammaires, tous les lexiques, peut les mélanger dans de multiples combinatoires explorant ainsi des univers des possibles quasi infinis. D’autre part, il peut tout oublier, être libéré des implicites et exonéré de toute lassitude et de la mémoire instantané des lectures précédentes, et, cent fois sur le métier, remettre son ouvrage. Ce n’est d’ailleurs pas si nouveau : communiquer avec autrui impose l’usage de codes et lexiques, semblables pour tous, servant de porteuse à de subtiles variations superficielles que l’on appelle le message. Si nous arrivons à programmer nos ordinateurs à tout retenir des codes et lexiques et à tout oublier des stéréotypes et du déjà-vu, ils devraient pouvoir en retour nous proposer une écriture créative. Écrire consiste donc à doser réminiscence et émancipation, c'est-à-dire encodage et transgression. Voir par exemple le site de la revue « Formules » consacrée à ce type de littérature http://formules.net ; [tous les liens cités dans ce texte ou ces notes ont été consultés en ligne le 1er mars 2009]. Voir en particulier http://oulipo.net , le site actuel de l’OuLiPo. L’Alamo (Atelier de Littérature Assisté par la Mathématique et les Ordinateurs) fondé par Braffort et Roubaud en a prolongé les travaux. Ce néologisme a été inventé par Ted Nelson en 1965 dans son ouvrage « Dream Machines » pour désigner un réseau de documents informatisés liés entre eux. Ils ne sont pas conçus pour une lecture linéaire. Comme les “livres dont vous êtes le héros” dont l’ordre de narration, voire l’issue, est déterminé par les choix du lecteur à la fin de chaque bloc de texte (Gallimard Jeunesse a ainsi publié une collection de près de 200 hyper-romans qui se joue avec des dés et qui porte ce titre générique). Voir en particulier sur internet le portail http://ifiction.free.fr , le « carrefour français de la fiction interactive », entièrement consacré à ce genre. -c'est-à-dire ne se limitant pas à de la « matière textuelle » pour reprendre l’expression d’Alexendra Saemmer, auteure de l’ouvrage de synthèse « matières textuelles sur support numérique »], Presses universitaires de Saint-Etienne, 2007, qui propose un très intéressant tour d’horizon des hypertextes et hypermédias existants et de leurs caractéristiques. Jean-Pierre Balpe, in « Ecriture sans manuscrit, brouillon absent », avril 2002, disponible à http://hypermedia.univ-paris8.fr/Jean-Pierre/articles/manuscrit.pdf (p 7) ou à http://transitoireobs.free.fr/to/article.php3?id_article=40 De fait on trouve sur l’Internet de séduisants outils qui s’inspire de près ou de loin d’une telle méthode pour caricaturer l’actualité en fabriquant de fausses dépêches (http://www.karabine.fr ). Voir le logiciel TextArc à http://www.textarc.org/ avec en particulier les travaux sur le texte d’Alice in Wonderland de Lewis Caroll ; voir aussi le logiciel « semato de l’UQUAM à http://semato.uqam.ca/guidexpert-ato/gea.asp Voir par exemple les travaux de Thomas Beauvisage sur les analyses du roman policier à http://www.revue-texto.net/Inedits/Beauvisage/index.html (publié dans la revue T.A.L. n°43, 2001). Voir Rafael Perez y Perez, Employing emotions to drive plot generation in a computer-based storyteller paru dans Cognitive systems research (2007). Voir un autre article de R. Perez y Perez avec M. Sharples de l’Univ. de Birmingham : MEXICA: a computer model of a cognitive account of creative writing. publié par Journal of Experimental and Theoretical Artificial Intelligence (2001) et disponible en ligne à : http://www.eee.bham.ac.uk/sharplem/Papers/mexica_jetai.pdf Nul besoin, ni pour ce type de calcul, ni pour contenir les bases de données de machines surpuissantes. Ces logiciels sont moins gourmands en ressources informatiques d’un classique lecteur de vidéo du commerce. Voir sur ce sujet, des mêmes auteurs:« Three Computer-Based Models of Storytelling : BRUTUS, MINSTREL and MEXICA » disponible à :http://www.nottingham.ac.uk/lsri/msh/Papers/MEXICA%20KBS.pdf A signaler aussi la page consacrée aux générateurs par le Liquid Narrative Group : http://liquidnarrative.csc.ncsu.edu/ . Sur tous ces sujets, voir aussi http://www.dm.ucf.edu/~rmcdaniel/files/dissertation.pdf. qui prétend regrouper tous les outils utiles à un projet d’écriture : « Notez des idées, écrivez la biographie de vos personnages, la bible d’une série, un synopsis ou une phrase clef ». Diffusé par http://www.vidatech.fr . A découvrir à http://www.monroman.com Le site de monroman.com précise que « votre roman est traité par notre logiciel qui permet d’automatiser une grande partie du travail. Aussi performant soit-il, il n’est toutefois pas en mesure de traiter l’intégralité des tâches nécessaires à l’écriture de votre roman. S’il est rapide et fiable, il manque cependant de “sensibilité”, de chaleur humaine ! C’est alors qu’interviennent nos rédacteurs et rédactrices, qui sont spécialement formés pour faire passer dans le texte de votre roman la couleur spécifique, l’ambiance qui ressort de votre apport, et donner la teinte unique que vous avez choisi pour votre livre. ». Il s’agit du logiciel générateur de fictions policières, héros du Roman éponyme d’Olivier Las Vergnas (op. cit.) Pour incarner ces personnages et mémoriser leurs comportements, Mexica a été alimenté d’abord par une toute première série d’histoires modèles introduites par ses programmeurs. Voir le n° 8 paru en 1966 de la revue « Communications » sur la combinatoire des intrigues, avec notamment un texte de Barthes sur « l’analyse structurale des récits et un article d’Umberto Eco sur la combinatoire narrative dans les aventures de James Bond [rééditée au Points Seuil en 1981]; Voir aussi le n°17 de la revue Loxias « littérature à stéréotypes », Odile Gannier [dir.] texte intégral en ligne à http://revel.unice.fr/loxias/sommaire.html?id=1357 La même règle peut être utilisée pour écrire des phrases qui détaillent de plus en plus les précédentes, ce qui permet un luxe de détail avec une économie de programmation informatique. (ou de nombreux romans générés, selon la façon dont on considère la question) comme “Le masque“, “Paysage sans ombre” et surtout “Trajectoires“, “Romans” ou plus récemment « Fictions ». Voir Hans-Georg Gadamer et ses écrits sur l’herméneutique : le lecteur lance des projets d’établissement du sens au fur et à mesure de sa lecture. Voir particulièrement “Vérité et Méthode” Paris, Le Seuil, 1996. Bertrand Gervais in « Lecture de récits et compréhension de l’action », Montréal, revue Vox poetica, 2005.; A lire en ligne à http://www.vox-poetica.org/t/pas/bgervais.html. La maison d’édition russe Astrel SPb prétend que l’auteur de leur roman « Amour véritable » paru en janvier 2008 est un logiciel: voir http://autokteb.org/2007/12/09/decouvrez-pc-writer-2008-un-generateur-russe-de-romans/ |