Ce site est une archive — il n’est plus mis à jour.
Accueil

La nouvelle édition scientifique à l'ère des GAFAM

Conférence de Marcello Vitali-Rosati , « Pour une approche philosophico-pratique de l’édition savante à l’ère de Google »

Réflexions préliminaires

Les outils ne sont pas neutres mais ils ne sont pas pour autant porteurs de valeurs, notamment d’émancipation par exemple. Ils ne sont pas bons ou mauvais en soi. Exemple : l’assertion « internet est méchant car il est contrôlé par cinq entreprises capitalistes ». En réalité, les outils déterminent ce que nous considérons comme « bon » ou « mauvais ».

L’édition “GAFAM” : 99% de la production des contenus

Le fonctionnement de l ’édition savante. On produit des contenus (écrits, utilisation d’outils, mises en forme ou en page, choix de format) qui circulent (accessibilité, communautés de réception) légitimement (ces contenus sont considérés comme fiables, avec ou sans instance de validation, quelle est le fonctionnement de ces dernières). Depuis le XIXe siècle on avait connu toujours le même circuit d’édition : un auteur écrit grâce à un outil (stylo ou machine à écrire) qui est donné à un éditeur qui révise le manuscrit et le fait valider par un comité de rédaction puis c’est envoyé au distributeur et à l’imprimeur etc. et la réputation de la maison d’édition joue beaucoup sur la réception première du livre (tant en matière de public que de qualité du contenu).

Les données remplacent les documents. Aujourd’hui le modèle des GAFAM conserve certains aspects de l’ancien modèle de l’édition, par exemple quand on recherche une note sur un restaurant sur le site TripAdvisor on cherche une validation par une certaine communauté. Ce qu’on recherche plus fondamentalement c’est des données ; un segment d’information (exemple : la date de naissance de Henry David Thoreau).

Tout est récupérable. Pourquoi le document est passé au second plan ? Car la méthode de récupération est fondée sur l’idée qu’on récupère tout ce qu’on peut récupérer : “ whatever works ” et la structuration est secondaire.

Simple (friendly). Il faut que les choses soient simples. Si on doit remplir quinze champs pour trouver une note sur TripAdvisor on ne va pas le faire.

L ’opacité. Le fonctionnement de tous ces services est complètement opaque pour les utilisateurs pour une raison très simple : le plus c’est opaque, le moins l’utilisateur se pose de question. Si ça n’était pas opaque, ça ne serait plus simple/friendly.

Efficacité du service. N’importe qui peut l’utiliser, y compris de manière abondante, et c’est possible précisément parce que c’est simple et donc opaque.

Le service est pensé à partir des pratiques des usagers. Si les usagers se moquent complètement du nom de l’auteur d’un article, il est supprimé ou rendu presque invisible.

L’édition savante

L ’édition savante veut des documents. L’édition savante désire des données structurées. Il importe peu que quelqu’un quelque part ait donné la date de mort de Napoléon, l’édition savante préfère avoir le contexte (qui l’a dit, en s’appuyant sur quels éléments).

Riche et complexe. L’édition savante est donc par là même complexe et de ce fait elle est aussi riche.

Auto-consciente. Dans le même ordre d’idée elle est autoconsciente, notamment dans ses enjeux politiques et économiques.

Le service n ’est pas fondée sur les pratiques alors même que le contexte de la circulation numérique est le flux et la révision des pratiques. Exemple : Marcello fait un voyage aux USA et se demande pourquoi les frontières sont géométriques ; sa femme cherche sur internet et tombe sur un article destiné à dix personnes dans une revue savante très spécialisée. La circulation numérique fait advenir à un public non-savant ou non-public des articles auparavant inaccessibles ou très difficilement.

L ’édition savante n’est pas efficace ni ne répond toujours à des pratiques d’utilisation. Revues.org propose des requêtes xml pour trouver des résultats - fonctionnalité que personne n’utilise. Certes ces habitudes sont

Les objectifs de la nouvelle édition savante sont par conséquent :

Une nouvelle idée d’écriture

Si dans le modèle papier, on devient un auteur lorsqu’on a publié un livre (je suis un auteur car j’ai publié un livre), qu’en est-il dans le numérique ? Dans le modèle numérique, on devient un auteur lorsqu’on publie des documents structurés validés par un modèle (exemple : écrire un article de blog est différent de publier un article sur les frontières des USA validé par ).

Trois projets sont en cours :

  1. Anthologie palatine
  2. Stylo
  3. Lightium

Anthologie palatine

L’anthologie palatine est un manuscrit recueillant des épigrammes grecques du VI a.C jusqu’au X p.C ; ça contient la quasi-totalité de la poésie grecque que nous connaissons. L’anthologie naît au IIIe-IVe siècle à Alexandrie est une structure intéressante car elle est fragmentaire mais se veut exhaustif. C’est une structure qu’on peut rapprocher de celle du numérique. Car en plus de ça l’anthologie permet différentes versions et états du texte à l’inverse du modèle philologique allemand du XIXe avec la distinction original-copies. L’anthologie a également de nombreuses scholies qui peuvent être rapprochés des hyperliens car ils sont des commentaires rajoutés à côté du texte.

Le fait de faire du manuscrit une version numérique permettrait de faire des liens entre les différents textes plus facilement. C’était aussi l’occasion de mettre en valeur un manuscrit peu connu, exclusivement de culture savante, et qui pourtant a travaillé l’imaginaire collectif jusqu’à nous (carpe diem, la rhétorique reprise par Ronsard puis Brassens, etc.). Ainsi la version numérique peut permettre de faire une version savante (avec le détail des scholies, les références culturels, etc.) et de faire une version plus grand public (simplement la traduction en français simple et élégant des épigrammes) voire très grand public (une application qui envoie une fois par jour une épigramme d’amour). Les objectifs étaient la transcription des scholies, l’alignement des traductions, la visualisation des liens (pour les savants et intéressés) et rendre compte de l’imaginaire anthologique. Comment faire ça ? Une base de données ouvertes via une api afin que n’importe qui puisse rajouter, le poète traducteur un peu fou tout comme un groupe d’étudiants de grec ancien (# : on peut identifier des groupes, par exemple si une classe de grec ancien traduit dans le cadre d’un partenariat avec le projet). L’idée c’est pas de faire valider scientifiquement ce que le poète un peu fou a fait, c’est d’avoir différents contenus puisqu’on veut à la fin permettre différents affichages disponibles (grand public en italien et en français ou savante avec que les traductions scientifiquement validées).

L’éditeur de texte stylo

Stylo essaye de repenser l’éditeur de texte pour les revues savantes puis, avec optimisme, pour la rédaction des mémoires et thèses.

Si dans le modèle imprimé, l’auteur et l’éditeur ont les capcaités de transformer les marques sémantiques en marques graphiques de manière relativement fidèle (italique pour un mot en langue étrangère, liste bibliographique, etc.), il n’en va pas de même dans le modèle numérique. En effet, on demande à des acteurs des compétences qu’ils n’ont pas, en l’occurrence à des diffuseurs numériques (Microsoft, ADobe) dont les buts et les moyens sont largement différents de ceux de l’édition scientifique.

Concrètement cet état de fait se traduit par différents problèmes :

  1. On utilise des logiciels qui nous font perdre des informations sémantiques (Word)
  2. Les styles sous word (comité éditorial) temps perdu
  3. Mise en page InDesign temps et informations perdus
  4. Doc (ou docx) vers xml qui fait perdre du temps et informations perdus (raison pour laquelle on n’a pas de mots-clefs pertinents dans Erudit.org)

OpenEdition de Revues.org tente de penser la transition entre le modèle imprimé et numérique en demandant de placer le word de l’auteur dans le CMS maison qui a un plugin qui récupère mieux le balisage. Mais en réalité c’est au niveau de l’auteur qu’il faudrait agir mais on ne peut pas leur demander de taper en xml ou en LaTeX. C’est la raison pour laquelle il faut inventer un éditeur de texte qui soit plus simple que Word, WYSIWYM (What You See Is What You Mean –> vous ne voyez pas la mise en forme finale mais vous voyez que vous avez voulu faire de telle phrase un titre de niveau 1). Il faut également que Stylo permette plusieurs systèmes de balisage (via la souris, des raccourcis, markdown) pour pouvoir facilement utiliser les notices d’autorité. De plus il faut que Stylo permette plusieurs outputs (eruditSchema xml, TEI, html, tex, pdf, etc.) et, dans le même ordre d’idée, permettre plusieurs publications sans perte d’information (CMS, Erudit, InDesign).

Lightium

C’est un CMS léger, simple, modulable et connecté (récupère les informations structurées).

Questions du public

Il y a quand même des rapports de valeurs sinon d ’habitudes liés à des problématiques économiques ou politiques, notamment lorsque des gens qui ont fait leur thèse sur papier donnaient leur copie papier à la secrétaire pour qu’elle la mette sous forme numérique.

—> C’est qu’à l’époque, il y avait une stabilité de ces outils qui donnaient l’impression que les outils étaient de peu d’importance.

Que doit repenser la maison d ’édition académique ?

—> Les rapports entre papier (qui porte le discours linéaire de l’auteur) et numérique (lectures non-linéaire car apposition de critiques) et donc vendre le support papier (et pas le contenu), la chaîne d’édition qui est boiteuse (les contenus sont vérifiés 400 fois de trop). Il y a des directeurs de maison d’édition qui sont complètement inconscients et qui impriment 400 exemplaires alors qu’ils en vendent 3 et qu’ils pourraient utiliser la POD - donc perte d’argent. Mais pourquoi font-ils ça ? Parce qu’il y a une perte symbolique si on en imprime que trois. Dans l’édition savante, le papier est un luxe mais qui ne doit pas être payé par l’Etat ; seul le contenu peut l’être (l’auteur, pas l’impression). Il suffit que le contenu soit disponible en numérique et en accès libre.

Que répondre à l ’argument « la POD tue les libraires » ?

—> Ça n’est pas notre job de défendre les libraires, c’est à eux d’être assez intelligents pour repenser leur modèle. En plus, de manière pragmatique, les libraires en question ils vendent presque rien des livres imprimés en POD ?