Archives pour la catégorie édition électronique

Au Hackathon des éditeurs du Grand Est

 

IMG_6478

Samedi 21 avril, 14h. Strasbourg est brûlante. Le taxi hésite entre les bâtiments  qui s’élèvent le long de la presqu’ile André Malraux. Lorsque j’entre au Shadok,  tout à la fois fablab, café restaurant, espace de coworking,  Michel Ravey, co-responsable de l’atelier numérique à la HEAR, la Haute Ecole des Arts du Rhin,   achève son intervention, dont les 45 mn de retard du TGV m’auront privée. Les équipes,  qui participent  au 1er Hackathon des Éditeurs du Grand Est, accompagnées par des étudiants de la HEAR, se remettent au travail. L’événement est organisé par la Médiathèque André Malraux  avec le soutien de la CIL, de Numered Conseil et la participation des étudiants de la HEAR.

C’est avec grand plaisir que j’ai accepté l’invitation de Frank Queyraud, en charge de la Médiation Numérique à la Médiathèque située juste à côté, à participer au jury. J’ai développé avec  Franck ce lien inédit, que le web a inventé, de familiarité électronique  : chacun a parfois été lire le blog de l’autre, nous nous suivons depuis bien longtemps sur Instagram, partageant des instants prélevés au gré de nos déplacements quotidiens. Les quelques fois où j’ai rencontré Franck IRL, c’est à l’occasion de réunions rassemblant l’ensemble des parties prenantes du projet PNB  (Prêt Numérique en Bibliothèque) au Ministère de la Culture.

Six équipes travaillent chacune sur leur projet :

– Les Éditions du Long Bec
La Nuée Bleue
Le Cosmographe Editions
2024
Le Centre de Créations pour l’Enfance
Père Fouettard

hack-grand-est

Pour quelques uns, c’est un premier contact avec les problématiques liées à l’édition numérique. D’autres sont plus familiers avec ces questions. La diversité des projets et les directions prises reflètent bien les interrogations, maintes fois discutées dans les colonnes de ce blog, sur «  ce que le numérique fait aux livres.  »

Il y a dix ans, le terme «  multimédia  », qui avait représenté la quintessence de la modernité dans les années 90,  avait pris un sérieux coup de vieux et cédé le pas à une rivalité confuse entre les adjectifs «  numérique  » et «  digital  ». Ce terme de multimédia devrait probablement trouver une seconde jeunesse. Il désigne en effet très convenablement des objets hybrides, intégrant texte, image fixe ou animée, éléments audio, interactivité. Etonnamment, ce ne sont ni l’image animée ni l’interactivité qui sonnent le signal de ce retour probable de l’usage du terme multimédia, mais plutôt l’audio et notamment la voix.

Dans ce hackathon, l’audio – musique, voix, bruits – a une forte présence dans la plupart des projets. Au terme de la délibération qui suit la présentation de ceux-ci par chacune des équipes, notre jury finit , après bien des discussions,  par récompenser celui des Éditions du Long Bec, un projet de BD sonore enrichie.

Une étudiante de la HEAR, Eric Catarina (fondateur des éditions du Long Bec), Roger Seiter (scénariste BD),  Thomas Pineau (Audio Picture)

Une étudiante de la HEAR, Eric Catarina (fondateur des éditions du Long Bec), Roger Seiter (scénariste BD), Thomas Pineau (Audio Picture)

Une BD sonore enrichie ? L’équipe s’explique :

«  L’idée de départ est posée, mais un long travail de réflexion et de recherche commence. (…)

« Comment adapter une BD, écrite pour un support papier, vers un format numérique ? »
Nous avons pris le parti de l’audio, avec des comédiens pour jouer les personnages et une mise en scène sonore. L’interaction avec l’auditeur/utilisateur se fait grâce à un système de notifications lors de l’écoute. Lorsque l’histoire comporte une scène en parallèle de la scène écoutée, l’appareil vibre et l’histoire continue quand l’auditeur/utilisateur déverrouille la notification pour regarder la scène annexe. Le challenge sera de ne pas perturber l’écoute avec le visuel.
Cette BD sonore enrichie sera une adaptation de la bande dessinée l’Or de Morrison. Un western dans l’ouest américain.

Capture d’écran 2018-04-23 à 22.57.49

Je me souviens avoir souvent joué, dans des débats au sujet des livres numériques, le rôle de  «  l’empêcheuse de rêver en rond  », rappelant qu’en ce qui concerne le fait «  d’augmenter les livres  », rien n’était plus puissant que notre imagination, et que c’est justement là que réside la magie des livres, dans le fait que des caractères disposés sur une page ou affichés sur un écran ont la capacité de nous transporter aussi efficacement dans l’univers de tel auteur ou dans la pensée de tel autre. Mes expériences dans le «  multimédia  » des années 90 m’avaient convaincue que les livres interactifs, augmentés  sont bien plus amusants pour ceux qui les fabriquent  (oui, on s’est drôlement bien amusés à l’époque…), que pour ceux qui les utilisent… En dehors de quelques projets ludo-éducatifs, l’usage de ces objets multimédia ne s’est jamais réellement imposé.

Mais de même qu’il a fallu sortir, en ce qui concerne la réflexion sur la lecture numérique, du «  ceci va remplacer cela  », et développer une appréhension plus fine, plus nuancée, plurielle, ouverte de la manière dont allaient évoluer les pratiques de lecture  à «  l’ère du numérique  »,  de même il est peu pertinent de figer la réflexion sur les destins numériques des livres de toutes sortes.

Donner à lire des versions numériques des livres, en proposant une expérience de lecture de bonne qualité quel que soit le terminal choisi par l’utilisateur, est l’une des étapes que doit finir de franchir le monde de l’édition. Mais cela ne doit pas nous empêcher de savoir accueillir de nouvelles propositions narratives, de proposer des expériences inédites, d’explorer les technologies, d’expérimenter de nouvelles formes : comment ouvrir la voie de l’innovation si l’on commence par en figer toute possibilité en décrétant la supériorité éternelle du texte sur tous les autres moyens d’expression ?

Rita-mupijunior2.indd

La visite guidée de la médiathèque voisine que nous a  proposé Franck renforce ce propos. Si Ruedi Baur a rendu le texte omniprésent sur les façades du bâtiment, on découvre vite au fil de la visite que celui-ci abrite toutes sortes d’images comme les illustrations présentées dans la très belle exposition Les Maîtres de l’imaginaire , ainsi que des expériences interactives et des expérimentations comme celles présentées dans  le cabinet de curiosités numériques où le projet DataPrint de livres algorithmiques imprimés de l’atelier de Communication graphique de la HEAR me séduit tout particulièrement.

En définitive, ce sont les utilisateurs qui décident. Ce sont eux qui adoptent ou rejettent, s’agrégeant parfois en tribus pour créer des niches et permettre à des propositions d’exister à bas bruit, tandis que d’autres sont massivement plébiscitées. Ce sont eux, les utilisateurs, (vous, moi…)  qui font le dernier tri entre les idées une fois réalisées, alors que c’est sur des idées que l’on doit se décider à développer un projet, à un stade où il est difficile de les évaluer.

L’idée dont chacun rêve, celle qui positionne celui qui la développe dans le calme d’un «  océan bleu  », ressemble souvent, dit-on, à une mauvaise idée. C’est une très bonne idée qui à l’air d’une très mauvaise idée, d’une idée sans intérêt. C’est pour cela que très peu de monde s’y intéresse, que quasiment personne ne souhaite la développer. Mais c’est une bonne idée, et qui sait voir la bonne idée là où tout le monde hausse les épaules, va pouvoir la développer sans être dérangé.

Les idées dont il faut se garder, ce sont les fausses bonnes idées : les mauvaises idées déguisées en bonnes idées. Elles se soldent immanquablement par un échec, à la mesure de l’enthousiasme  déraisonnable qu’elles ont suscité, échec dont il faut tâcher de prendre conscience le plus tôt possible.

Certaines  bonnes idées la jouent à la régulière, ces bonnes idées ont l’air de ce qu’elles sont : de bonnes idées. Celles-là sont dans l’air, chacun peut vouloir s’en saisir. Librement partagées, la réussite de ceux qui décident de les développer réside dans la qualité de leur exécution.

Et il existe aussi, bien heureusement, quantité d’autres sortes d’idées, ni bonnes ni mauvaises, des idées inclassables, dérangeantes, floues, lumineuses ou obscures, des idées qui fusent ou qui fuient, des idées fragiles toujours au bord de l’évanouissement, des idées arrêtées ou des idées en l’air.

Dans un hackathon, on tend à valoriser le protoypage, le fait de tester une idée (plutôt que de chercher à l’évaluer à l’infini… ) en en réalisant une partie, même sommairement, même avec les moyens du bord. C’est ce qu’a réussi à faire l’équipe des Editions du Long Bec, bien accompagnée par Thomas Pineau, le fondateur d’Audio Picture,  proposant durant leur représentation une simulation à base d’extraits sonores enregistrés l’après-midi même, mixant leurs propres voix et des bruitages trouvés en ligne. L’effet de suggestion et d’immersion, même dans ces conditions de test, était palpable durant leur présentation. Et cela me renforce dans ce constat : on est vraiment en train de redécouvrir la puissance de l’audio.   Oui, le multimédia semble bien être de retour, tirée par l’audio. On va enfin pouvoir recommencer à s’amuser !

Il semble cependant que ce grand doute vis à vis des promesses technologiques autour du livre affecte plus particulièrement les éditeurs traditionnels, échaudés par des expérimentations passionnantes mais qui peinent à trouver leur public.  Cela  ne semble en rien freiner l’imagination créative de quelqu’un comme l’auteur et producteur Etienne Jaxel-Truer, très présent toute la journée auprès des équipes et l’une des belles rencontres de ce samedi. Etienne mène en parallèle des activités qui vont du transmedia au cinéma d’animation, tout en proposant une résidence d’écriture. Toute la question est peut-être là : des produits multimédias ambitieux basculent rapidement vers une économie qui se rapproche de celle de l’audio-visuel. Et chercher à maintenir de tels projets dans celle, infiniment plus modeste en ce qui concerne les coûts de production à l’unité, de l’édition, n’est sans doute pas une bonne idée, si l’on n’invente pas des modèles adaptés.

Un grand merci pour terminer ce billet  à Franck Queyraud et à Cécile Palusinski pour leur accueil et leur gentillesse, et…  j’attends déjà le Hackathon n°2 des éditeurs du Grand Est.

Identification de contenu sur la Content Blockchain. Le code ISCC (International Standard Content Code)

J’ai entrepris de traduire deux articles écrits et publiés le 13 avril dernier par Sebastian Posth, à propos du projet The Content Blockchain Project . Un grand merci à Sebastian pour m’avoir autorisée à publier ces traductions, et merci aussi pour sa relecture fort utile. 

Identification de contenu sur la Content Blockchain. Le code ISCC (International Standard Content Code)


–> Si vous avez déjà lu l’article sur les Smart Licenses, passez l’introduction, qui est commune aux deux articles.

Le Content Blockchain Project construit les outils de base qui vont permettre aux journalistes, éditeurs et aux start-ups du secteur des médias de créer des produits, des services et des modèles d’affaires innovants dans l’économie ouverte de la blockchain.

L’idée fondamentale derrière le Content Blockchain Project a été de créer les fondations techniques d’un environnement d’échange pour des contenus médias numériques qui faciliterait de nouvelles manières de proposer et d’acheter du contenu sur un réseau décentralisé de la blockchain.

Son but est de simplifier le processus complexe de management des licences et de distribution des contenus numériques en offrant un registre de droits et de licences sous la forme d’un «  grand registre ouvert et transparent » géré par la blockchain.

Pour les ayants droit et pour les intermédiaires il devrait être facile et peu coûteux de publier les termes des licences d’utilisation de leurs contenus.

Pour les utilisateurs, qu’il s’agisse d’entreprises ou de particuliers, il devrait être simple et peu coûteux d’avoir accès aux termes de ces licences et d’acheter les contenus sous licence selon les termes proposés.

Cela s’applique à toute application ou à tout service dont l’objectif est d’offrir et de licencier du contenu numérique  via la blockchain de manière semi-automatisée  : identification de contenu et gestion des licences sont les prérequis indispensables.

Les principaux défis pour le Content Blockchain Project ont été  :

  1. de trouver le moyen d’identifier sans ambiguïté des contenus numériques

  2. d’offrir une solution intelligente pour le management des droits et l’information sur les licences, en rendant les termes licences lisibles par des machines et en permettant l’attribution automatique de licences.

J’aimerais, dans ce premier article (deux sont prévus), décrire l’approche concernant l’identification des contenus que le Content Blockchain Project a privilégiée ces derniers mois.

Il présente aux parties prenantes de l’industrie une introduction, qui évite le jargon technique ou juridique, à deux éléments que nous avons développés dans le projet :  l’identifiant de contenu ISCC et les Smart Licenses pour les médias numériques.

Merci de considérer cette approche comme un proposition. Nous apprécierons beaucoup vos retours et réactions.

The Content Blockchain

Après avoir soigneusement évalué différentes approches business des protocoles blockchain, le Content Blockchain Project a décidé de choisir la technologie Multichain pour construire une blockchain dédiée aux contenus numériques.

Multichain offre une technologie qui autorise les organisations à construire et déployer des blockchains et des applications construites au dessus de leurs propres chaînes. Cela autorise une gouvernance sous forme de consortium, et une approche décentralisée pour gérer la chaîne granulaire des droits et des autorisations pour ceux qui voudraient participer à la maintenance ou à l’utilisation de la blockchain ou au développement d’applications.

Multichain autorise aussi la création de flux qui peuvent stocker de petites quantités de données sur la blockchain native et octroyer des autorisations en écriture de données sur ces flux.

Sur l’implémentation test de la Content Blockchain, deux principaux flux vont être établis, l’un pour l’enregistrement d’identifiants ISCC, l’autre pour l’enregistrement des smart licences correspondantes, dont le concept va être décrit ci-dessous.

Ressources :
Evaluation technique de Multichain :
https://content-blockchain.org/research/multichain/
site web de Multichain :
https://www.multichain.com/

Le portefeuille Coblo

Le  Content Blockchain Project a développé un portefeuille logiciel qui permet aux utilisateurs de traiter en totalité un nœud Blockchain Content sur un ordinateur (PC ou Mac) et de participer au test de la plateforme. Il permet également  :

  • La création d’un compte sur la blockchain
  • Le fait de tester le vote expérimental par consensus
  • L’envoi et la réception de monnaie native de la blockchain.
  • L’horodatage du contenu sur la blockchain
  • La création d’identifiants de contenu ISCC et leur enregistrement sur la Content Blockchain.

Ressources :
Télécharger le portefeuille Coblo (pour Pc et Mac)
https://github.com/coblo/gui-demo

Je vais maintenant décrire les principes basiques de création et d’enregistrement d’un ISCC.

Gardez bien à l’esprit le fait que l’implémentation courante de la Content Blockchain est seulement un réseau-test en vue de tester la chaîne, ses réglages et ses permissions ainsi que sa gouvernance et les applications qui ont été construites pour la Content Blockchain.

Identification de contenu

Créer un ISCC à partir d’un contenu

Dans l’optique de comprendre les différentes opportunités en terme de modèles d’affaires qui émergent de l’environnement Content Blockchain, il est essentiel d’appréhender correctement la nature et le concept d’ISCC, ou International Standard Content Code.

L’ISCC n’est pas simplement un identifiant supplémentaire, assigné de manière aléatoire à un contenu. En tant qu’identifiant générique, l’ISCC est dérivé du contenu lui-même.

L’ISCC est défini comme un identifiant ouvert et décentralisé pour du contenu numérique. C’est un identifiant unique, structuré de manière hiérarchique, qui est généré de manière algorithmique et de manière décentralisée. Il est construit à partir d’un mélange générique et équilibré entre des éléments dérivés du contenu, sensible à la localisation, et préserve des similarités présentes dans les métadonnées et le contenu. Cela lie de manière inséparable tout contenu spécifique à un identifiant ISCC spécifique.

 

http://iscc.codes/

Ressources :
La spécification du standard ISCC est disponible ici  :
http://iscc.codes/
https://github.com/coblo/iscc-specs
https://coblo.github.io/cips/cip-0003-iscc/
Application portefeuille pour Mac & Windows
https://github.com/coblo/gui-demo
Une implémentation de référence que les développeurs peuvent utiliser pour générer des ISCCs (bibliothèque logicielle en Python) est disponible ici  :
https://pypi.python.org/pypi/iscc
Librairie Coblo MCRPC
https://pypi.python.org/pypi/mcrpc

L’ISCC peut-être créé à partir d’un contenu numérique et de ses métadonnées basiques par quiconque suit les procédures des spécifications ISCC ou utilise un logiciel open source qui supporte ISCC selon la spécification ISCC.Cela signifie qu’en utilisant n’importe quelle application disponible, n’importe qui sera en mesure de générer un ISCC à partir du contenu lui-même, qu’il s’agisse du détenteur des droits sur ce contenu, d’un intermédiaire, d’un revendeur ou de l’utilisateur de ce contenu. Quiconque accède à ce contenu va générer le même ISCC sur chaque machine individuelle, de manière décentralisée et en dehors de la chaine.

Une manière possible de générer un ISCC est d’utiliser l’appli portefeuille Coblo. L’appli est disponible en téléchargement pour Windows (et bientôt pourt Mac) ) :
https://github.com/coblo/gui-demo.

Dans sa dernière livraison, l’appli portefeuille Coblo va générer des ISCC pour des textes et des images numériques. La génération d’ISCC pour des contenus audio et vidéo seront disponibles dans les prochaines versions du logiciel.

Enregistrer un ISCC dans un «  flux ISCC  ».

L’appli portefeuille Coblo va générer un ISCC. Il est possible de l’enregistrer dans le «  flux ISCC  » d’un Contenu Blockchain. L’enregistrement d’un ISCC est lui-même une transaction sur la Content Blockchain.

La Content Blockchain, basée sur la technologie Multichain, autorise la création de flux séparés, qui peuvent stocker des clés et les données correspondantes sur la chaîne – exactement comme l’ISCC – et rendent possible l’octroi de permissions en écriture sur ces clés et sur ces données.

Selon la spécification actuelle, n’importe qui peut écrire sur le flux ISCC de la Content blockchain. Comme la Content Blockchain est considéré comme une Blockchain publique, n’importe qui peut lire l’information écrite dans le flux ISCC.

Il est important de noter que le fichier du contenu lui-même ne sera pas (ni jamais) chargé et stocké dans la Content Blockchain. Le contenu ne quittera pas le disque dur local lorsque son ISCC sera enregistré sur la Blockchain. C’est uniquement l’ISCC, en tant que référence à ce contenu qui sera stocké sur la blockchain, et non le contenu lui-même. Comme pour toute Blockchain, l’espace de stockage est limité. Cela s’applique également au grand registre distribué de la Content Blockchain. Et donc le flux ISCC stockera uniquement l’information spécifique et un nombre limité de données à l’occasion de l’enregistrement d’un ISCC  :

  • L’identifiant ISCC (Keys  »)
  • Les métadonnées du contenu digital («  Data  »)
  • L’horodatage de la transaction d’enregistrement de l’ISCC («  Time  »)
  • D’autres détails de la transaction qui a généré l’item de flux («  Transaction  »)
  • L’identifiant public du portefeuille de celui qui enregistre («  Publishers  »)

Les entrées concernant l’enregistrement ISCC sur le «  flux ISCC  » de l’implémentation sur le réseau-test peuvent être trouvées via Coblo explorer et ressemblent à ceci  :

 

https://cdn-images-1.medium.com/max/800/1*f1ZGfh9ojzoZvoJMbkU1xQ.png

 

Quelques remarques pour souligner l’option d’entrée des métadonnées pour un ISCC saisi  : le «  titre  » du contenu concerné est la valeur minimum d’enregistrement requise pour l’entrée d’une donnée. Mais le flux offre une manière flexible et extensible de fournir des métadonnées de titre additionnelles, spécifiques à l’industrie au sujet du contenu identifié (tel que Dublin Core, IPTC, ID3v2, ONIX).

Cela signifie que les enregistreurs peuvent soit écrire des métadonnées directement dans la blockchain en ajoutant des ligne de métadonnées personnalisées (données JSON) ou lier à des entrepôts de données stockés en dehors de la chaîne qui hébergent les métadonnées du contenu enregistré. Vous trouverez des détails supplémentaires sur le flux ISCC et ses métadonnées das la spécification  :  : http://iscc.codes/specification/

Notez bien que l’enregistreur d’un ISCC ne doit pas être confondu avec le propriétaire des droits du contenu enregistré. Le «  publisher  », dans un flux, réfère simplement à l’institution ou à la personne qui a enregistré l’ISCC via une transaction. Le publisher est uniquement identifié par son ID de portefeuille.

L’enregistrement d’une entrée dans la Blockchain signifie littéralement  » Il existe un contenu avec cet identifiant ISCC spécifique, et un enregistreur avec tel ID de portefeuille spécifique l’a enregistré et fournit quelques métadonnées pour cet ISCC spécifique. Comme l’enregistrement de l’ISCC et de métadonnées n’implique aucune revendication de propriété sur le contenu, il ne sert pas, aujourd’hui, à identifier personnellement ni à vérifier l’identité de l’enregistreur. Dans cette optique, le flux ISCC de la Content Blockchain est simplement un grand registre public qui n’affirme pas que les métadonnées sont pertinentes, et n’est rien d’autre que la preuve de l’existence d’un contenu avec un ISCC spécifique.

Dans un flux public de la Content Blockchain il peut bien sûr exister plusieurs entrées pour un ISCC. Pour décider qu’une entrée est digne de confiance, on peut se baser sur la pertinence des métadonnées ou sur le fait que l’ID –portefeuille est considéré comme «  de confiance  » ou vérifié, ou auto-authentifié, ou bien connecté publiquement à une institution reconnue.

En outre, il est possible pour les ayants droit d’ouvrir des flux fermés sur la Content Blockchain. Dans des flux fermés, il pourrait être requis que chaque enregistreur d’un flux soit identifié personnellement et son identité vérifiée pour être autorisé à disposer des droits en écriture pour ce flux ou pour que ses transactions soient valides. Ces règles et ces permissions vont devenir un point crucial et partie intégrante de la gouvernance de la Blockchain.

Dans le prochain article  ; «  Qu’est-ce qu’une Smart License ?  » j’aimerais décrire l’approche en matière de gestion de licences que le Content Blockchain Project a poursuivie ces derniers mois.

Une question  ? Une réaction  ? Merci de contacter :  https://content-blockchain.org/contact/ ou Sebastian Posth ou via Telegram.

 

On ne se refait pas.

w3c
Un groupe de travail sur l’annotation vient d’être créé au sein du W3C. Pour une introduction à quelques uns des problèmes posés par l’annotation des textes électroniques, je renvoie à ce billet de Marc Jahjah, qui date (déjà !) de 2011 (et fait, à la fin, allusion au défunt et magnifique site Small Demons…). Bon, si vous n’êtes pas complètement épuisé après la lecture du billet de Marc… je reprends.

Le but de ce groupe de travail est (je traduis),

… de fournir une approche ouverte pour l’annotation, la rendant possible dans les navigateurs et les systèmes de lecture, les librairies JavaScript et d’autres outils, de développer un écosystème d’annotation permettant aux utilisateurs d’avoir accès à leurs annotations depuis des environnement variés, d’être en mesure de les partager, de les archiver, et de les utiliser comme ils l’entendent.

Concrètement, cela signifie que le groupe de travail se donne pour objectif la fourniture d’ici  juillet 2016 des éléments suivants (je traduis encore)   :

1- Un modèle de données abstrait
2- Un vocabulaire : un vocabulaire précis décrivant/définissant le modèle de données
3- Des sérialisations : un ou deux formats de sérialisation du modèle de données abstrait, tels que JSON/JSON/-LD ou HTML
4- Une API HTML : Une spécification API pour  créer, éditer, accéder, rechercher, gérer et par ailleurs de manipuler les annotations via HTTP.
5 – Une API côté client : une interface de scripts et des événements pour faciliter la création de systèmes d’annotations dans un navigateur, un système de lecture, un plugin Javascript.
6 – Un système d’ancrage pour les liens : un ou plusieurs mécanismes pour déterminer une série d’éléments de texte ou d’extraits d’autres média, qui pourront servir de cible pour une annotation, d’une manière prédictible et interopérable, avec une persistance lorsque le document subit certains changements ; ces mécanismes doivent fonctionner en HTML5 et doivent pouvoir s’étendre à des types de média et des formats additionnels.

Sans surprise, on trouve parmi les fondateurs de ce groupe de travail Ivan Hermann, du W3C, qui anime déjà, avec Liza Daily ( Safari Books Online ) et Markus Gylling (IDPF et consortium Daisy) le Digital Publishing Interest Group , un groupe qui n’a pas vocation à publier des recommandations, mais à s’assurer que les exigences liées à l’édition électronique soient prises en compte, lorsque cela est pertinent, par les recommandations publiées par le W3C. Le Digital Publishing Interest Group a déjà un projet qui cherche des manières d’adapter le draft du Groupe Open Annotation pour un usage en EPUB3. Ce travail, indique le communiqué,

   » pourrait mettre en évidence des besoins nouveaux en ce qui concerne la conception techniques des annotations que le Web Annotation Working Group  pourrait prendre en compte. De même, les résultats produits par le Web Annotation Working Group (par exemple concernant l’API côté client) pourraient être pris en compte dans l’évolution future de l’EPUB, et pourrait conduire à des exigences supplémentaires.  »

 En attendant de suivre en vidéo (prévoir du café à cause du décalage horaire car elle a lieu à San Francisco) la cinquième édition de la conférence Books in Browsers

Moi, j’aime bien quand l’IDPF discute avec le W3C. Et j’aime bien quand on parle à la fois de «  Books  » et de «  Browsers  ». On ne se refait pas.

 

Hackathon à la Bibliothèque Publique de New-York

hackathon NYPLIls sont silencieux. Majorité de garçons, et heureusement quelques filles aussi. Beaucoup ont des autocollants au dos de leur écran. Les échanges se font à voix basse. Le temps file, il est bientôt 16h, (c’est à dire minuit pour moi qui suis encore calée à l’heure française) et il va falloir être en mesure de montrer quelque chose qui tourne, car c’est là le principe d’un hackathon. Coder vite, coder à plusieurs, parfois devoir se résoudre à du «  quick and dirty  » pour terminer à temps. Sur une grande table au fond, les restes d’un buffet, boites en carton, bouteilles d’eau. Tiens, voici Eric Hellman, justement celui dont j’ai commenté la prose dans mon précédent billet. Il fait partie d’une équipe qui travaille sur un projet de club de livre en ligne, avec des fonctionnalités de création de groupes, et de partage d’annotations entre membres du groupe. Les équipes, une dizaine, sont au travail depuis samedi matin.

J’aperçois Ric Wright, l’homme qui coordonne à distance les développements qui s’effectuent actuellement au sein de la Fondation Readium, co-organisatrice de ce hackathon avec la New York Public Library. Ric m’indique que les participants sont pour la plupart soit des étudiants, soit des gens qui travaillent dans le monde des bibliothèques. Camille Pène, du Labo de l’Edition, est là aussi. J’espère bien que c’est pour nous mitonner un événement du même genre bientôt à Paris, et pourquoi pas avec la Fondation Readium à nouveau ? Hadrien Gardeur est en grande conversation avec Jake Hartnell. Je livetwitte mais avec deux mauvais hashtags, et sans le bon ( #openbook2014 ), c’est malin.

Soudain le temps est écoulé. Certaines équipes ont besoin de quelques minutes supplémentaires et continuent à travailler pendant que les autres présentent leur projet. Bob Stein, venu assister aux présentations, écoute très attentivement parler des jeunes gens dont certains n’étaient pas nés qu’il travaillait déjà sur les questions qui les occupent aujourd’hui, la grande classe. Voici les projets présentés (traduction de la présentation faite sur Github) : 

 

 

    • Liens profonds dans  ( PressBooks ) … Construire des livres avec des métadonnées riches. Le balisage nous permet de construire de nouvelles sortes de fonctionnalités : génération automatique d’index, navigation non linéaire, ressources supplémentaires internes ou externes ajourées au texte, APIs et plus. Cette démo ajoute du markup sémantique pour ajouter une couche de navigation contextuelle à un texte. C’est un point de départ pour réfléchir a) à des moyens user-friendly  d’ajouter ce balisage, b) les choses utiles que nous pouvons faire avec ce balisage. Nous commençons avec un livre-web, mais pensons que nous pourrons étendre ces fonctionnalités à l’EPUB3.(Jean Kaplansky Max Fenton, Tendi M, and Hugh McGuire)

 

    • PDF (ou PDF + XML) vers du EPUB recomposable (Dave Mayo @ Harvard, Noreen @ IA Institute, Julia Pollacks @ Bronx Community College, Jeremy Baron)

 

    • Club du Livre en ligne, l’utilisateur peut créer un club, rejoindre un club existant, les membres accèdent en ligne au livre choisi par le club, peuvent surligner des passages et discuter des citations ou des passages, utliliser des fonctionnalités sociales etc.  (Edina Vath) https://github.com/EdinaVath/openbook2014-club/

 

 

    • Travail avec DPLA StackLife (https://stacklife-dpla.law.harvard.edu/#) pour offrir à l’utilisateur d’un catalogue de bibliothèque en ligne une expérience similaire à celle qu’il trouve en bibliothèque. (Cori Allen, Emma Spencer, Elizabeth, Zach Cobel, Shawn Farrell and Amy Wolfe) Breadcrumbs & Beanstalks

 

 

  • plugin d’annotation  

Et si un tel événement se déroulait en France bientôt, qui serait partant ?

Est-ce que quelque chose a changé ?

fourmis-rougesPour commencer l’année, un billet dont le titre est emprunté à une chanson de Michel Jonasz dont le refrain dit :  «  Est-ce que quelque-chose à changé / Couchons-nous sur les fourmis rouges / Pour voir si l’amour est resté/ Pour voir si l’un de nous deux bouge…  »

Dans le vaste mouvement des choses qui changent, auxquelles faut-il prêter une attention particulière ? La Grande Conversion Numérique des livres tarde à se produire en France et semble déjà s’essouffler aux États-Unis. Eric Hellman a écrit à ce sujet un billet qui connaît un joli buzz, intitulé «  In 2013, eBook Sales Collapsed… in My Household.  »   ? Cherchant une explication au net ralentissement observé en 2013 dans la progression des ventes de livres numériques aux USA, et aux commandes de livres numériques en chute libre dans son foyer, il écarte un certain nombre d’hypothèses pour conclure, se basant sur l’évolution des usages de ses proches : les responsables, ce sont les sites de fanfiction…  (Le Kindle familial en panne a été remplacé par un iPad, les limitations imposées par Apple à l’in-app purchase rendent difficile l’achat d’ebooks sur Amazon, l’iBook store n’a pas séduit son panel (sa famille), et donc, les voilà qui passent maintenant leur temps de lecture à lire des fanfictions…) Par un tour de passe passe qui met dans le même sac    »tech-startups, tech-monsters, et tech-non profit  », il annonce une année 2014 qui devrait donner toute satisfaction à celui qui a écrit les lignes suivantes : «  Nous aimons investir dans des technologies et des modèles d’affaires qui sont en mesure de rétrécir les marchés existants. Si votre entreprise peut prendre 5 $ de revenus à un concurrent pour chaque dollar qu’elle gagne, alors parlons !  ». Une année qui verrait le marché du livre numérique s’effondrer sous les attaques des  » tech-quelque chose  » citées plus haut. Cinq dollars perdus pour les éditeurs traditionnels pour chaque dollar gagné par Wattpad, Manybooks, Readmills, Leanpub, Smashword ou même Unglue.it ?

AInsi, aux USA, de jeunes sociétés innovantes s’en prennent, nous dit Eric Hellmann, aux éditeurs et voudraient les faire vaciller, tout comme AirBnB inquiète l’hôtellerie, tout comme Uber concurrence les taxis et Netflix les chaînes de télé.  Wattpad et Smashwords sont des plateformes d’auto-édition, le Projet Gutenberg est le plus ancien projet de numérisation de livres, Manybooks diffuse des livres gratuits, principalement du domaine public, Leanpub est un outil de publication, et Unglue.it un site de crowd-funding dédié à la réédition numérique. Aucune parmi ces structures ne fait le lent et patient métier de l’éditeur, ce travail de défrichage à la recherche d’un prochain texte, d’un nouvel auteur, ce travail sur le texte une fois trouvé, et autour du livre publié. Aucun ne s’attache à construire, au fil des années, des collections qui sont pour certains auteurs des maisons communes, et pour leurs lecteurs des repères indispensables. Préférer la vitesse, expérimenter de nouvelles manières de faire surgir le talent, inaugurer des outils de publication, c’est très bien, et les maisons d’édition ont tout intérêt à suivre de très près l’activité de ces start-ups, et les plus avisées travaillent déjà avec elles. Mais pourquoi se réjouir à l’idée que tout ceci pourrait se substituer à ce qui existe déjà ? Pourquoi m’inviter à m’en réjouir, si au final, mon choix de lecteur s’en trouve amoindri ? S’il devient plus difficile de trouver de bons textes ? Pour qu’il y ait des fanfictions, ne faut il pas qu’il y ait des fans, des fans d’un auteur, et cet auteur-là, qui prendra le risque de le publier ?

Est-il devenu utopique, en 2014, de ne pas vouloir renoncer au meilleur de ce que nous proposent les deux mondes que nous aimons : celui des livres, et celui du web, et de continuer d’essayer de contribuer à les faire cohabiter, se compléter, se sublimer l’un l’autre  ?

 

 

EPUB : commenter la leçon

Capture d’écran 2013-12-03 à 19.51.22Nicolas Morin, dans un billet sur IDBOOX, oppose curieusement le format EPUB aux apps et au web, raillant (gentiment) les éditeurs qui fétichiseraient l’EPUB, et leur faisant (un peu) la leçon. Alors je monte au tableau, voilà, et je commente…

Si nombre d’éditeurs défendent aussi ardemment le format EPUB, ce n’est pourtant pas en l’opposant aux apps ou au web, c’est vis à vis de formats proches de l’EPUB, mais propriétaires, notamment le format .mobi, lisible sur les terminaux ou via les applications de lecture d’un seul revendeur.

Les éditeurs ne se contentent pas de défendre le format EPUB, beaucoup contribuent activement  à le développer, à travers l’IDPF et à en fortifier l’environnement de lecture, via la fondation Readium. Cet engagement se traduit par des actions concrètes, en vue d’inventer et d’améliorer sans cesse un écosystème du livre numérique ouvert, interopérable, et accessible.

La tenue prochaine à New-York d’un hackathon co-organisé par la New-York Public Library et la fondation Readium témoigne de cette vitalité et de cette ouverture.

Dans ce format EPUB sont aujourd’hui proposés des centaines de milliers de titres, autrefois disponibles uniquement au format imprimé, aux lecteurs qui, de plus en plus nombreux, souhaitent lire en numérique. La question n’est pas tant de «  répliquer la chaîne du livre  » que de mettre à disposition des lecteurs, en version numérique, les livres. Qu’attend un lecteur qui s’est équipé d’une liseuse ou d’une tablette ? Ou celui qui aime lire sur son smartphone ?  Dans la plupart des cas il compte fermement sur la disponibilité en version numérique des livres qui paraissent également en version imprimée, ou sont déjà parus, le mois dernier, l’an dernier ou il y a dix, quinze ou cent cinquante ans, il s’attend à pouvoir choisir dans un catalogue numérique qui ne doit rien avoir à envier au catalogue de livres imprimés.

Même si de nouvelles expériences de lecture sont bien évidemment possibles, même si des catalogues 100% numériques se créent progressivement, qu’il s’agisse d’œuvres nativement numériques, ou du passage en numérique de textes qui revisitent cette expérience, le défi initial pour les éditeurs traditionnels en ce qui concerne les livres numériques est donc plutôt modeste : il s’agit de faire exister les livres sur le web, et que ceux-ci demeurent des livres, avec bien sûr un écart vis à vis de la version imprimée qui provient de ce passage au numérique. Ce passage n’est pas indifférent, il n’est pas neutre, il n’est pas sans incidence. Mais la construction d’un espace des livres spécifique sur le web passe par le fait de veiller plutôt à la proximité avec les livres imprimés qu’à l’écart avec ceux-ci. Ce n’est pas «  anti-innovation  », c’est simplement la volonté de faire exister aussi en numérique ce que les lecteurs aiment des livres. Cela implique d’ailleurs beaucoup d’innovation, et ne convoque pas nécessairement le skeuomorphisme.  Nul ne peut prédire à coup sûr la solidité ni la durée de cet espace spécifique des livres numériques en construction, mais pourquoi reprocher aux éditeurs de s’être concentrés en premier lieu sur ce défi ?

Que n’a-t-on entendu à propos des majors de la musique qui ont tant tardé à numériser leurs catalogues !  Et maintenant, on va reprocher aux éditeurs de numériser les leurs ? Une double injonction, en forme de double contrainte : «  Numérise, éditeur, mais surtout, ne numérise pas !  ». Numériser, quel manque d’inspiration, c’est faire juste un simple et bête livre numérique qui ressemble au livre papier qu’on lit du début jusqu’à la fin avec même pas de vidéo et d’animations et de sons et d’interactivité dedans, trop bêtes ces éditeurs, ils ne voient pas, alors que les jeunes (les digitalnativzz) le voient,  que les bibliothécaires, les enseignants, les touristes, les pompistes, les dentistes le voient (même ma maman le voit), qu’avec le numérique on peut faire tellement tellement plus de choses oh là là…

Il n’y a pas lieu de s’étonner que le format EPUB, et la référence au livre imprimé, ne soulèvent généralement que peu d’enthousiasme chez un éditeur pure-player. Il n’a pas de fonds à numériser, il n’est pas tenu de publier (ni de promouvoir) simultanément deux versions de toutes ses nouveautés, l’une imprimée, l’autre numérique. Que lui importe (sur le plan économique) que les ventes de livres numériques se concentrent in fine chez deux ou trois acteurs mondiaux, et que les libraires en viennent à fermer les uns après les autres ? Cela préoccupe énormément les éditeurs traditionnels qui, eux,  publient dans les deux formats, imprimé et numérique, travaillent et veulent continuer de travailler avec un grand nombre de libraires de toutes sortes et de toutes tailles, pour leurs livres imprimés comme pour leurs versions numériques.

Tous les livres n’ont pas le même destin numérique, et le format EPUB sert convenablement la plus grande partie des objets éditoriaux que les lecteurs numériques achètent aujourd’hui. EPUB3 permet déjà, et permettra bientôt sur un plus grand nombre de terminaux, d’ajouter des types de livres à la mise en page plus complexe, avec éventuellement des éléments multimédia ou de l’interactivité,  et d’améliorer l’accessibilité.  Partout dans le monde se développe la lecture de livres numériques, à des rythmes variables selon les contextes locaux.  Ce développement ne se construit pas principalement pour le moment autour des livres-applications, ni autour des livres-sur-le-web. Il se construit autour d’artefacts du livre imprimé. Ce n’est ni bien, ni mal. C’est ainsi.

En tant que pure-player, vous pouvez choisir très librement la proximité avec le modèle du livre imprimé que vous souhaitez donner aux objets que vous allez publier. Vous pouvez l’oublier. Vous pouvez aussi devenir des experts de l’EPUB, et choisir de proposer aussi vos livres numériques en impression à la demande, (et dans ce cas le libraire deviendra votre ami…) ou bien explorer des territoires différents, à la frontière avec le jeu vidéo, l’art numérique ou l’audio-visuel. Vous pouvez pousser le web dans ses retranchements, subvertir les réseaux sociaux, détecter des  auteurs-codeurs,  pratiquer le crowd-funding, et même essayer de livrer vos exemplaires en POD par drone. Vous pouvez innover, foncer, hacker, inventer. Vous avez de meilleures idées que les éditeurs ? Bravo.  Réalisez-les. Ne demandez pas la permission. Si une forme réellement nouvelle et pertinente apparaît, si un meilleur dispositif surgit, ils finiront par l’emporter.

Mais pourquoi vous étonner que des maisons d’édition qui ont publié déjà des centaines, des milliers et parfois plusieurs dizaines de milliers de livres, et vont continuer d’en publier encore longtemps sous forme imprimée, agissent différemment, connaissent d’autres contraintes, suivent une autre logique que la vôtre Faire la leçon aux éditeurs dits traditionnels lorsque l’on est un pure-player, c’est de bonne guerre :  à la fois payant – on a droit à  un billet sur teXtes, ce qui devient rarissime :) –  et sans grand danger : on ne risque guère de rencontrer une vive opposition, de voir se lever des foules criant «  Comment pouvez-vous dire une chose pareille ?  ». Cela fait partie du jeu. Cela fait partie aussi du jeu de ne pas toujours laisser la leçon sans réponse.

 

 

 

Books in Browsers – pendant la pause

Capture d’écran 2013-10-24 à 23.04.51Pendant la pause déjeuner de la conférence Books in Browsers, qui se tient comme chaque année depuis maintenant 3 ans à San Francisco, et que je suis, comme chaque année depuis mon canapé à Paris, j’ai envie de publier ici la traduction du résumé de l’intervention de Justo Hidalgo,(24 symbols), qui est le prochain intervenant de la conférence. En développant l’architecture technique nécessaire à l’activité de sa société, Justo s’aperçoit progressivement que ses outils, tous dans le cloud, pourraient servir à d’autres qu’à lui. Ce court texte est une définition simplifiée de ce que peut être une approche de type «  plateforme  », très bien décrite dans le fameux billet de Steve Yegge, un ancien d’Amazon passé chez Google – le lien pointe vers la traduction du billet en français par Nicolas Colin.

Voici comment Justo annonce son intervention :

«  L’idée de construire une plateforme permettant à différents acteurs de produire des services et des applications liés au livre de manière plus rapide et plus efficace n’est pas nouvelle, dans le monde académique et parmi d’autres experts du numérique s’est développée toute une réflexion à ce sujet.

Mais, selon un chemin auquel on ne s’attendait pas au démarrage de notre projet 24 symbols, nous pourrions bien être plus près de cette vision que ce que nous pensions, en construisant une machine du type “Book as a Service”.

Pour développer notre société en offrant des livres numériques en abonnement, accessibles notamment aux possesseurs de terminaux mobiles,  nous avons dû faire évoluer notre architecture technique de manière que les nouvelles applications de lecture et les nouveaux services puissent se construire rapidement.

Bien qu’à court terme ce jeu de fonctionnalités n’ait été destiné qu’à nos propres besoins et requêtes, il apparaît de plus en plus clairement que cette couche pourrait potentiellement être utilisée par d’autres développeurs, éditeurs, associations d’éditeurs, chercheurs et même auteurs.

La vision et la promesse seront expliquées durant mon intervention, et les principales questions juridiques, techniques, politiques liées au projet seront posées à l’audience afin de comprendre pleinement les implications, le potentiel et les défis d’une plateforme Book as a Service totalement accessible.  »

Dès qu’il sera disponible, je posterai ici le lien vers l’enregistrement vidéo de l’intervention de Justo Hidalgo.

De la poussière sur les livres numériques

livres_poussiere
C’était pénible, aussi. Votre attachement, votre addiction à ces objets lourds qui prenaient la poussière, s’entassaient sur des étagères, petits ou grands, épais ou minces, blancs ou jaunis, colorés parfois, et le plus souvent décolorés.

C’était terrible, votre folie d’aimer savoir qui avait écrit quoi, cette manie de chercher sur la couverture le nom de l’auteur. Le pire, c’est que certains auteurs indiquaient également le nom d’autres auteurs dans les pages intérieures, vous conduisant à des découvertes, vous enfonçant toujours plus dans la dépendance, tissant des liens entre la couverture jaune et la verte, le gros livre penché et le petit à peine visible.

C’était affreux, d’être obligé en regardant les objets posés sur les étagères, de se souvenir des gens qui vous les avaient offerts, de votre plaisir lorsque vous les aviez achetés, des heures passées sous le tilleul à plat ventre sur une couverture, la première fois que vous aviez lu celui-là, et dans ce train qui n’en finissait plus d’arriver, la fois où vous aviez relu cet autre. Oui, vraiment horrible. Il allait bien falloir un jour se débarrasser de tout ça. Il faudrait bien un jour inventer autre chose.

Vous aviez bien essayé ces succédanés, ces objets qui portaient un absurde nom féminin, et qui commençaient à se répandre doucement, très doucement chez nous, plus vite ailleurs, ces petites machines qui, une fois apprivoisées, vous procuraient, disiez-vous, une expérience de lecture somme toute assez proche de celle des objets posés sur vos étagères. Peut-être étiez-vous assez nombreux à être, au final, plutôt indifférents à la matérialité de ces choses. Elle était là, simplement, cette matérialité, papier, colle, encre, pour permettre ce moment magique, disiez-vous, ce coup de talon sur le sol qui vous permettait l’envol. Les pages se tournaient, remontant le ressort qui bientôt vous enverrait très loin. D’autres attachaient bien plus d’importance aux objets, à leur forme, à leur aspect. Parlaient même parfois de la délicieuse odeur-de-l’encre-et-du-papier. Pas vous. Seul importait le texte, s’y engouffrer, à en oublier de respirer et bouger, à attraper des fourmis dans les jambes, des torticolis, pour être resté si longtemps suspendu aux pages. Parfois, donc, vous lisiez aussi à l’aide d’un objet électronique, à l’écran mat ou brillant. Souvent, c’était parce que vous voyagiez, et que vous ne souhaitiez pas porter de trop lourds bagages. Ou bien, vous tombiez – horreur – en panne de lecture à des kilomètres d’un lieu habité, et il vous suffisait de trouver un peu de réseau pour vous approvisionner, sans devoir attendre la prochaine virée en ville. C’est dire l’état d’intoxication où vous vous trouviez. Vous développiez ce faisant de nouvelles et détestables habitudes. Celle de quitter l’enclos du fichier pour vérifier en ligne l’origine ou le sens d’un mot, situer une ville sur une carte, et même poster une citation sur Twitter, avant de reprendre votre lecture.

Mais ce n’était pas la solution. Demeurait cette sale manie d’en revenir, toujours, à des objets horriblement figés. Cette obsession de vous enfermer dans ces espaces clos. Ce plaisir malsain de savoir que d’autres avant vous avaient lu ce texte, celui-là exactement, et que, peut-être, d’autres le liraient après. Cette erreur que vous aviez faite en entrant dans cette confrérie des lecteurs, mais vous étiez petit encore, à l’âge de vos premiers Club des Cinq, et personne ne vous avait mis en garde. Les liens que vous continuiez de tisser entre vos lectures, et, horreur, avec d’autres lecteurs. La confiance que vous faisiez, pauvre innocent, naïf lecteur, au bout de quelques titres, à cet éditeur – un éditeur ! – qui vous avait, disiez-vous, pour votre grand plaisir, emmené vers une contrée littéraire jusqu’alors inconnue de vous.

Non, il faudrait quelque chose de vraiment différent. Oui. Mettre un terme à tout cela. Ce repli sur soi. Ce temps passé, immobile, coupé des autres. Cette fréquentation de complets inconnus. Dont certains étaient morts, cela me fait peine de l’écrire. Il faudrait passer à tout autre chose. Quelque chose d’ouvert. Quelque chose qui permette la circulation, la rencontre, et l’oubli. Quelque chose d’anonyme. Quelque chose de mélangé à d’autres choses. Quelque chose de plus intelligent. Quelque chose qui vous connaisse. Quelque chose qui vous devine, qui vienne à votre rencontre. Qui ne se contente pas de singer les choses poussiéreuses posées absurdement sur l’étagère entre deux autres choses. Qui ne soit pas bêtement homothétique, stupidement apparenté au vieux monde en perte de vitesse. Quelque chose avec des algorithmes. Avec de l’intelligence, oui, mais de préférence artificielle. Il faudrait ouvrir ces trucs et gratter l’encre jusqu’à faire des trous dans les pages, il faudrait creuser dans les pages pour trouver le sens, mouliner les débris des pages dans de grandes machines à indexer, fabriquer des bases de données, il faudrait tout de même penser à fabriquer, bon sang, un jour, des bases de données.

Vous lisiez bien d’autres choses, aussi. Vous naviguiez des heures, lisant-écrivant sur le web inépuisable, rebondissant d’un site à l’autre, du français à l’anglais, absorbé parfois longuement. Lire longtemps sur l’écran ne vous dérangeait pas. Vous aimiez la rumeur du web, ses mélanges, ses territoires balisés et inconnus, les tressautements de l’hypertexte, les carambolages qu’il permettait, ses îles, ilôts, archipels, ses atolls et ses icebergs. Et vous aimiez que parmi ces ilôts, auprès des merveilles et des surprises du web, il soit possible d’identifier, de loin, des zones particulières, reconnaissables entre mille.

Vous aimiez vous dire que les livres s’étaient fait une place sur le web. Et que, numériques ou numérisés, bon nombre d’entre eux pouvaient demeurer des livres.

On allait bientôt s’occuper de vous.

 

 

 

 

 

 

 

Le travail d’un éditeur, selon Hugh McGuire

Hugh vient de me donner son accord, et je l’en remercie,  pour que je publie la traduction que j’ai faite de son article, «  A Publisher’s Job Is to Provide a Good API for Books  » paru hier sur le blog «  transforming publishing  ».

Le travail d’un éditeur, c’est de fournir de bonnes APIs pour ses livres.

par Hugh McGuire Voici une affirmation radicale : Le travail d’un éditeur, c’est de fournir de bonne APIs pour ses livres. Maintenant que presque tous les livres existent en version numérique, les bons éditeurs du futur sont ceux qui fourniront de bonnes APIs. Dans cet article, je vais explorer - pourquoi je considère que les éditeurs doivent fournir de bonnes APIs - pourquoi c’est vraiment plus simple et moins effrayant que ce que vous pourriez penser. - pourquoi le bon vieil index pourrait être le point de départ des APIs de livres.

Qu’est-ce qu’une API ?

Une API c’est un ensemble d’outils/protocoles qui permettent à différents éléments logiciels de communiquer les uns avec les autres, sous certaines conditions. Comme l’indique Terry Jones : “Tout comme une interface utilisateur donne à des humains accès à l’information, une API donne accès à cette information aux logiciels.” Voici quelques exemples d’APIs avec lesquelles vous êtes déjà probablement entrés en interaction : -  Si un jour vous avez  indiqué avoir aimé un site dans Facebook, vous avez utilisé une API -  Si vous utilisez une application mobile ou un logiciel dédié pour lire et poster sur Twitter, vous utilisez l’API de Twitter -  Si vous avez déjà payé quelque chose avec Paypal,vous avez utilisé une API -  Si vous avez utilisé une application vous montrant une carte, vous avez utilisé une API. Il existe une autre manière de se représenter une API : une API permet à un service d’utiliser les données d’un autre service, selon des modalités bien définies.

Quel rapport avec les livres ?

Quel rapport avec les livres ? Les livres évoquent des émotions, inspirent des réflexions, contiennent et véhiculent des idées. Mais ils contiennent aussi de l’information (“data”). Ils sont, si vous préférez, faits de données. Une photo numérique, un film que vous regardez en streaming, un mp3 que vous écoutez sur votre iPod : ce sont des objets numériques faits de 0 et de 1, ils sont représentés comme des données. Nous y accédons grâce à la technologie. Les livres, et spécialement les livres numériques, sont également faits de données. De 0 et de 1, mais aussi, en fait, de HTML. Si nous commençons à réfléchir aux livres en tant que données, alors le rôle traditionnel de l’éditeur commence à ressembler au rôle d’un fournisseur d’API : le rôle d’un éditeur est de gérer la manière et les circonstances selon lesquelles les gens (lecteurs) et certains services ( librairies, bibliothèques, autres ?) accèdent aux livres (données). Nous savons à quoi ressemble ce job dans le vieux monde du papier et des magasins en dur, et nous sommes presque sûrs de bien le comprendre également dans le monde de l’EPUB et du Kindle. Mais, alors que nous entrons dans un monde où le numérique va être prééminent, les éditeurs pourraient, et bientôt devront, commencer à réfléchir à leurs APIs- d’une manière qui va bien au delà du simple “envoyons nos livres aux libraires”. (Rassurez-vous,  je vais vous indiquer plus loin pourquoi cela ne sera pas trop inquiétant.)

Que fait un éditeur ?

Voici une définition historique d’un éditeur : Éditeur (n.m.) milieu du 15è s., “quelqu’un qui fait une annonce publique, nom de celui qui publie, (v.), La définition suivante :  “celui dont le travail consiste à mettre en vente des livres, des périodiques, des gravures etc.” date, elle, de 1740. (Source : the Online Etymology Dictionary). Le travail d’un éditeur, c’est de rendre publique l’œuvre créée par les auteurs, et, couramment, mais pas toujours, de monétiser ce travail. Ce n’est pas un secret : le numérique change l’environnement dans lequel les éditeurs exercent leur travail. Les librairies physiques sont en voie de disparition, les ventes en ligne augmentent, et les barrières à la publication, spécialement en ce qui concerne les livres numériques, ont déjà disparu. Dans ce monde où l’offre de livres explose, et où l’espace de vente physique des livres diminue, le travail qui consiste à “rendre public” commence à ressembler à quelque chose de vraiment différent. Quelques un des mécanismes selon lesquels les éditeurs atteignent leur but de “rendre public” des livres aux lecteurs et de les monétiser (à savoir : la production, la distribution et la vente) sont aujourd’hui accessibles aux auteurs eux-mêmes. Si les auteurs auto-édités peuvent faire de nombreuses choses que les éditeurs ont l’habitude de faire, alors trouver de nouvelles et de meilleures façons de “rendre public” les textes est ce qui va séparer les bons éditeurs des mauvais à l’avenir. Les meilleurs seront ceux avec qui les auteurs auront envie de travailler.Et un avantage que les éditeurs possèdent, et personne d’autre (même pas Amazon), c’est une connaissance précise du contexte et du contenu de leurs livres. Les éditeurs ont choisi leurs livres, les ont édités, corrigés, leur ont donné forme… Ils connaissent leurs livres de fond en comble. Cette connaissance devrait permettre aux éditeurs de mieux agréger l’intérêt porté à leurs livres. Le problème avec ceci, alors même que les éditeurs possèdent toute cette connaissance au sujet de leurs livres, est qu’ils ne savent pas vraiment comment partager cette connaissance, comment l’utiliser comme un moyen effectif de porter leurs livres à la connaissance d’un large public. Mais ce serait très facile pour les éditeurs de devenir meilleurs à cet exercice.

De quoi les éditeurs ont-ils une connaissance précise, exactement ?

Les livres peuvent être décrits de différentes manières : par leur couverture, leur nom d’auteur, leur titre, la liste de leurs chapitres, une description du livre. C’est ce que vous pourriez appeler les “métadonnées” ou bien “les informations que l’on communique aux libraires”. AAA l’intérieur du livre nous avons des mots et des phrases, peut-être quelques images. Et si vous regardez attentivement ces mots et ces phrases, vous pouvez définir un certain nombre de choses que vous trouvez dans ces phrases, telles que :
- des gens (véritables, ou personnages de fiction)
- des lieux (véritables ou de fiction)
- des époques, des dates.
Et il y a certaines autres choses que vous pourriez extraire :
– des concepts
- la référence à d’autres textes
- des citations de gens, de livres, d’articles, de films ou de chansons
- des exemples
Cette liste peut se prolonger encore et encore, et bien sûr dépend du genre de livre que vous produisez.

Et si je vous demandais de construire un index plutôt qu’une API ?

Si vous regardez la liste qui précède, particulièrement si vous produisez non pas de la fiction mais des livres scolaires ou des documents, vous êtes en train de hocher la tête et de dire : «  … oui, c’est bien le genre de choses que nous mettons dans un index.  »Et vous avez raison : un index est une sorte de “carte de ce qui se trouve à l’intérieur de votre livre, et de comment le trouver”. Un index, dans un livre papier traditionnel, est un outil fantastique pour savoir quel genre de choses se trouve dans un livre. Cela ne demande pas un gros effort de transformer un index lisible par un être humain en un index lisible par un ordinateur, ce qui en fait, plus ou moins, une API. (C’est ainsi que fonctionnent les moteurs de recherche : ils “indexent” chaque mot d’une page HTML, et chaque page d’un site, et ils fournissent une API qui permet aux gens et aux programmes de trouver des choses.)

Dans le cas des livres imprimés, la manière habituelle d’indexer un livre est de dresser la liste de ce qui vous semble important (les gens, les lieux, les dates, les références, les concepts etc.) et d’indiquer au lecteur à quelle page il pourra retrouver ces éléments. Vous imprimez cette liste et les références de pages et vous l’ajoutez à la fin de votre livre. Dans le cas des livres numériques, un (bon) index fera quelque chose de tout à fait différent : il listera les gens, les places, les concepts etc… et il les fera pointer directement vers l’endroit où ces items apparaissent dans le texte, via un lien, car les numéros de page n’ont pas beaucoup de sens pour les livres numériques. Donc, dans un livre numérique, qui, après tout n’est rien d’autre qu’une série de fichiers HTML avec quelques petits trucs en plus, une entrée d’index est associée à une ancre située à l’intérieur du fichier HTML, là où l’entrée apparait.   Ainsi, vous avez un texte qui dit  :

 

et le balisage HTML de la page, qui vous permet de lier votre fichier d’index est :

 

À la fin de votre livre numérique, qui possède une liste correspondante d’items reliés à votre ancre dans le corps du texte qui ressemble à ça :
Le fichier HTML/page sera une liste de liens qui pointent vers l’intérieur de votre livre là où apparaissent les entrée de votre index. Ajoutez un peu de données sémantiques, remuez, et vous vous êtes dotés d’une API – ou du moins une carte à partir de laquelle bâtir votre API. Si au lieu de simplement faire un lien vers une ancre au niveau de votre index, vous passez un peu de temps supplémentaire pour ajouter quelques données, vous pourriez faire quelque chose comme ceci, qui spécifie qu’à cet endroit précis du texte, vous avez défini une personne nommée John Smith
et vous pourrez également mentionner le fait qu’un élément du texte est un lieu de la manière suivante :
Et plus loin, vous pourrez tagger des concepts comme ceci :

 

Si vous voulez être encore plus sympa, vous pourriez réaliser ce balisage sémantique en vous basant sur des schémas comme schema.org ou bien microformats. Cela vous permettrait, à vous et à d’autres éditeurs, de standardiser la manière dont vous parlez des “choses qui figurent dans les livres.” Maintenant, si vous faites ça avec votre livre complet, ou bien si vous le faites faire par quelqu’un d’autre, vous pourrez ensuite : a) générer un index (que vous auriez fait de toute manière) mais, et c’est bien plus intéressant, vous pourriez b) générer un index intelligent qui sait non seulement où apparaissent toutes les instances du terme “John Smith” mais : – où apparaissent tous les gens – où sont toutes les instances de gens nommés John – où apparaissent toutes les instances des gens nommés Smith – que “ma chère Granny Smith” est une personne et que “ma délicieuse Granny Smith” est une pomme Et maintenant, en lieu et place d’un simple index, vous avez une carte sémantique complète de votre livre, une carte qui a été juste un petit peu plus difficile à produire qu’un index standard que vous auriez réalisé de toute manière. Et alors ? Avec une telle carte sémantique vous avez l’amorce d’une API incroyablement puissante. Si en plus d’avoir une carte sémantique… vous avez également votre livre disponibles en ligne (derrière un accès payant ou non) cela signifie que vous pouvez rendre cette API/carte sémantique  accessible au monde enter, (gratuitement, ou bien à certaines conditions commerciales) et dire : je vous en prie, trouvez de merveilleuses idées pour utiliser le contenu de mon merveilleux livre !

Qu’est-ce que le monde va bien pouvoir faire avec votre API ?

Voici quelques unes des choses que vous aimeriez peut-être que les autres (ou bien vous mêmes) réalisent avec votre API : – extraire une liste des personnages dans le livre, et donner à chacun d’entre eux une petite biographie. Rassembler ces biographies dans un “guide biographique”. – Extraire une liste de localisations dans le livre et les placer sur une carte – Extraire les 500 mots autour de chaque apparition du concept “existentialisme” … parmi tous les livres édités par des éditeurs qui ont rendu disponibles leur carte sémantique, et trier par décennie, influence, ou nationalité de l’auteur – Construire une frise chronologique indiquant où se trouvent les différents personnages à différentes périodes du récit. – Faire pointer cette frise chronologique vers une carte – Construire un outil de navigation permettant aux utilisateurs d’explorer un livre par ses personnages, ses lieux, ses dates, ses concepts. Vous pourrez également vouloir publier cette carte sémantique sur le web, ainsi Google et d’autres moteurs de recherche auront une compréhension détaillée de ce qu’il y a dans votre livre, et ainsi lorsque des gens rechercheront un type précis d’information qui apparaît à la page 119 de votre livre, le moteur sera capable de pointer vers chez vous. Il y a tant d’ «  et cetera” ici, et nous venons à peine de commencer.  Nous pouvons déjà trouver quelques petits reflets de tout cela : – Small Demons extrait des gens/lieux/choses via une API, il demande aux éditeurs leurs fichiers EPUB afin de pouvoir parcourir les fichiers, et ensuite afficher les produits, les autres livres, les films et les musiques trouvés à l’intérieur des livres. - Dracula Dissected s’appuie sur le texte de Bram Soker, et permet d’y accéder par personnages, dates, lieux et vous pouvez ainsi explorer le livre de différentes manières. - Pearson’s FT Press API vous permet d’extraire de l’information de certains EPUBS et de faire diverses choses avec. - Wordnik.com extrait des phrases de définition de livres publiés par Simon and Schuster et les utilise comme phrases exemples pour les entrées d’un dictionnaire. Nous n’en sommes qu’aux balbutiements, aux premiers exemples. Nous n’avons encore rien vu. Nous allons en voir beaucoup plus parce que le travail d’un éditeur est de “rendre public” et qu’une API est précisément faite pour mettre les données en capacité d’être rendues publiques. C’est exactement ce à quoi elles servent. Nous allons en voir plus parce qu’il apparaît que faire des APIs pour les livres est quelque chose de facile.

Et ça va arriver comment ?

Des outils comme PressBooks, qui est un outil de production de livres nativement web, rend très simple l’ajout d’une indexation sémantique, ou bien vous laisse le faire à la main ; où, plus efficacement, vous permet de combiner les deux. Sélectionner le texte que vous souhaitez ajouter à votre fichier d’index, ajoutez les métadonnées qui vont bien (est-ce une personne, un concept ?) et appuyez sur “go”. Le défi, c’est de faire un bon  fichier d’index, bien sûr, avec de bonnes métadonnées et selon un bon schéma. Nous savons bien maintenant faire des livres numériques. Voyons maintenant comment traiter la manière dont on peut relier les livres entre eux via des APIs. Y arriver n’est pas si difficile : la clé pour pour réaliser ces fameuses APIs , c’est ce bon vieil index. (Merci à Brian O’LearyLaura DawsonTerry JonesErin McKean, et Dac Chartrand, qui m’ont aidé à améliorer la première version de cet article.)

et les pages tomberont comme de la cendre

these pages fall like ash’, c’est le titre de l’un des  projets annoncés aujourd’hui par l’organisme anglais REACT (Research and Entreprises in Art and Creative Technologies), qui rassemble des chercheurs universitaires, des entreprises et des artistes. Au sein de leur programme «  Books & Print Sandbox  », ils annoncent le financement de huit expérimentations, qui ne sont pas considérées comme des entités séparées, mais forment une communauté de projet, et explorent le futur du livre et de la manière dont nous lisons, apprenons et publions.

«  Comme toujours, Sandbox va apporter son support à ce groupe en tant que communauté, et cela inclut le partage, la porosité, et la contribution à la formation des idées les uns des autres. Il s’agit d’un laboratoire structuré pour l’innovation, qui comprend des blogs de recherche, des présentations, des événements «  feedback  »,  et un soutien technique. Un groupe de conseillers issus du monde de l’industrie apportera aussi son soutien dans le développement des idées et l’exploration des voies potentielles pour accompagner celles-ci  jusqu’à la mise en marché avec le soutien d’un consultant en développement d’affaires.  »

Le site présente ainsi le projet These pages fall like ash :

«  Le collectif d’artistes Circumstance et Tom Abba de l’Université du West England vont travailler avec les auteurs Nick Harkaway et Neil Gaiman pour explorer ce que le livre, l’éditeur et l’auteur peuvent devenir dans un projet orienté plateforme numérique. Ils vont proposer au public de participer à une expérience narrative, en accédant, modifiant et écrivant une histoire localisée qui explorera les possibilités de cette forme et subvertira les normes de l’édition traditionnelle.  »

Le rapprochement entre auteurs / artistes / universitaires /entreprises me semble particulièrement intéressant, ainsi que cette vision d’une multiplicité de projets qui ne sont pas concurrents les uns avec les autres mais se développent conjointement dans l’échange.

à suivre… (on peut s’inscrire pour se faire à leur newsletter.)