Archives pour la catégorie epub

On ne se refait pas.

w3c
Un groupe de travail sur l’annotation vient d’être créé au sein du W3C. Pour une introduction à quelques uns des problèmes posés par l’annotation des textes électroniques, je renvoie à ce billet de Marc Jahjah, qui date (déjà !) de 2011 (et fait, à la fin, allusion au défunt et magnifique site Small Demons…). Bon, si vous n’êtes pas complètement épuisé après la lecture du billet de Marc… je reprends.

Le but de ce groupe de travail est (je traduis),

… de fournir une approche ouverte pour l’annotation, la rendant possible dans les navigateurs et les systèmes de lecture, les librairies JavaScript et d’autres outils, de développer un écosystème d’annotation permettant aux utilisateurs d’avoir accès à leurs annotations depuis des environnement variés, d’être en mesure de les partager, de les archiver, et de les utiliser comme ils l’entendent.

Concrètement, cela signifie que le groupe de travail se donne pour objectif la fourniture d’ici  juillet 2016 des éléments suivants (je traduis encore)   :

1- Un modèle de données abstrait
2- Un vocabulaire : un vocabulaire précis décrivant/définissant le modèle de données
3- Des sérialisations : un ou deux formats de sérialisation du modèle de données abstrait, tels que JSON/JSON/-LD ou HTML
4- Une API HTML : Une spécification API pour  créer, éditer, accéder, rechercher, gérer et par ailleurs de manipuler les annotations via HTTP.
5 – Une API côté client : une interface de scripts et des événements pour faciliter la création de systèmes d’annotations dans un navigateur, un système de lecture, un plugin Javascript.
6 – Un système d’ancrage pour les liens : un ou plusieurs mécanismes pour déterminer une série d’éléments de texte ou d’extraits d’autres média, qui pourront servir de cible pour une annotation, d’une manière prédictible et interopérable, avec une persistance lorsque le document subit certains changements ; ces mécanismes doivent fonctionner en HTML5 et doivent pouvoir s’étendre à des types de média et des formats additionnels.

Sans surprise, on trouve parmi les fondateurs de ce groupe de travail Ivan Hermann, du W3C, qui anime déjà, avec Liza Daily ( Safari Books Online ) et Markus Gylling (IDPF et consortium Daisy) le Digital Publishing Interest Group , un groupe qui n’a pas vocation à publier des recommandations, mais à s’assurer que les exigences liées à l’édition électronique soient prises en compte, lorsque cela est pertinent, par les recommandations publiées par le W3C. Le Digital Publishing Interest Group a déjà un projet qui cherche des manières d’adapter le draft du Groupe Open Annotation pour un usage en EPUB3. Ce travail, indique le communiqué,

   » pourrait mettre en évidence des besoins nouveaux en ce qui concerne la conception techniques des annotations que le Web Annotation Working Group  pourrait prendre en compte. De même, les résultats produits par le Web Annotation Working Group (par exemple concernant l’API côté client) pourraient être pris en compte dans l’évolution future de l’EPUB, et pourrait conduire à des exigences supplémentaires.  »

 En attendant de suivre en vidéo (prévoir du café à cause du décalage horaire car elle a lieu à San Francisco) la cinquième édition de la conférence Books in Browsers

Moi, j’aime bien quand l’IDPF discute avec le W3C. Et j’aime bien quand on parle à la fois de «  Books  » et de «  Browsers  ». On ne se refait pas.

 

Hackathon à la Bibliothèque Publique de New-York

hackathon NYPLIls sont silencieux. Majorité de garçons, et heureusement quelques filles aussi. Beaucoup ont des autocollants au dos de leur écran. Les échanges se font à voix basse. Le temps file, il est bientôt 16h, (c’est à dire minuit pour moi qui suis encore calée à l’heure française) et il va falloir être en mesure de montrer quelque chose qui tourne, car c’est là le principe d’un hackathon. Coder vite, coder à plusieurs, parfois devoir se résoudre à du «  quick and dirty  » pour terminer à temps. Sur une grande table au fond, les restes d’un buffet, boites en carton, bouteilles d’eau. Tiens, voici Eric Hellman, justement celui dont j’ai commenté la prose dans mon précédent billet. Il fait partie d’une équipe qui travaille sur un projet de club de livre en ligne, avec des fonctionnalités de création de groupes, et de partage d’annotations entre membres du groupe. Les équipes, une dizaine, sont au travail depuis samedi matin.

J’aperçois Ric Wright, l’homme qui coordonne à distance les développements qui s’effectuent actuellement au sein de la Fondation Readium, co-organisatrice de ce hackathon avec la New York Public Library. Ric m’indique que les participants sont pour la plupart soit des étudiants, soit des gens qui travaillent dans le monde des bibliothèques. Camille Pène, du Labo de l’Edition, est là aussi. J’espère bien que c’est pour nous mitonner un événement du même genre bientôt à Paris, et pourquoi pas avec la Fondation Readium à nouveau ? Hadrien Gardeur est en grande conversation avec Jake Hartnell. Je livetwitte mais avec deux mauvais hashtags, et sans le bon ( #openbook2014 ), c’est malin.

Soudain le temps est écoulé. Certaines équipes ont besoin de quelques minutes supplémentaires et continuent à travailler pendant que les autres présentent leur projet. Bob Stein, venu assister aux présentations, écoute très attentivement parler des jeunes gens dont certains n’étaient pas nés qu’il travaillait déjà sur les questions qui les occupent aujourd’hui, la grande classe. Voici les projets présentés (traduction de la présentation faite sur Github) : 

 

 

    • Liens profonds dans  ( PressBooks ) … Construire des livres avec des métadonnées riches. Le balisage nous permet de construire de nouvelles sortes de fonctionnalités : génération automatique d’index, navigation non linéaire, ressources supplémentaires internes ou externes ajourées au texte, APIs et plus. Cette démo ajoute du markup sémantique pour ajouter une couche de navigation contextuelle à un texte. C’est un point de départ pour réfléchir a) à des moyens user-friendly  d’ajouter ce balisage, b) les choses utiles que nous pouvons faire avec ce balisage. Nous commençons avec un livre-web, mais pensons que nous pourrons étendre ces fonctionnalités à l’EPUB3.(Jean Kaplansky Max Fenton, Tendi M, and Hugh McGuire)

 

    • PDF (ou PDF + XML) vers du EPUB recomposable (Dave Mayo @ Harvard, Noreen @ IA Institute, Julia Pollacks @ Bronx Community College, Jeremy Baron)

 

    • Club du Livre en ligne, l’utilisateur peut créer un club, rejoindre un club existant, les membres accèdent en ligne au livre choisi par le club, peuvent surligner des passages et discuter des citations ou des passages, utliliser des fonctionnalités sociales etc.  (Edina Vath) https://github.com/EdinaVath/openbook2014-club/

 

 

    • Travail avec DPLA StackLife (https://stacklife-dpla.law.harvard.edu/#) pour offrir à l’utilisateur d’un catalogue de bibliothèque en ligne une expérience similaire à celle qu’il trouve en bibliothèque. (Cori Allen, Emma Spencer, Elizabeth, Zach Cobel, Shawn Farrell and Amy Wolfe) Breadcrumbs & Beanstalks

 

 

  • plugin d’annotation  

Et si un tel événement se déroulait en France bientôt, qui serait partant ?

De la poussière sur les livres numériques

livres_poussiere
C’était pénible, aussi. Votre attachement, votre addiction à ces objets lourds qui prenaient la poussière, s’entassaient sur des étagères, petits ou grands, épais ou minces, blancs ou jaunis, colorés parfois, et le plus souvent décolorés.

C’était terrible, votre folie d’aimer savoir qui avait écrit quoi, cette manie de chercher sur la couverture le nom de l’auteur. Le pire, c’est que certains auteurs indiquaient également le nom d’autres auteurs dans les pages intérieures, vous conduisant à des découvertes, vous enfonçant toujours plus dans la dépendance, tissant des liens entre la couverture jaune et la verte, le gros livre penché et le petit à peine visible.

C’était affreux, d’être obligé en regardant les objets posés sur les étagères, de se souvenir des gens qui vous les avaient offerts, de votre plaisir lorsque vous les aviez achetés, des heures passées sous le tilleul à plat ventre sur une couverture, la première fois que vous aviez lu celui-là, et dans ce train qui n’en finissait plus d’arriver, la fois où vous aviez relu cet autre. Oui, vraiment horrible. Il allait bien falloir un jour se débarrasser de tout ça. Il faudrait bien un jour inventer autre chose.

Vous aviez bien essayé ces succédanés, ces objets qui portaient un absurde nom féminin, et qui commençaient à se répandre doucement, très doucement chez nous, plus vite ailleurs, ces petites machines qui, une fois apprivoisées, vous procuraient, disiez-vous, une expérience de lecture somme toute assez proche de celle des objets posés sur vos étagères. Peut-être étiez-vous assez nombreux à être, au final, plutôt indifférents à la matérialité de ces choses. Elle était là, simplement, cette matérialité, papier, colle, encre, pour permettre ce moment magique, disiez-vous, ce coup de talon sur le sol qui vous permettait l’envol. Les pages se tournaient, remontant le ressort qui bientôt vous enverrait très loin. D’autres attachaient bien plus d’importance aux objets, à leur forme, à leur aspect. Parlaient même parfois de la délicieuse odeur-de-l’encre-et-du-papier. Pas vous. Seul importait le texte, s’y engouffrer, à en oublier de respirer et bouger, à attraper des fourmis dans les jambes, des torticolis, pour être resté si longtemps suspendu aux pages. Parfois, donc, vous lisiez aussi à l’aide d’un objet électronique, à l’écran mat ou brillant. Souvent, c’était parce que vous voyagiez, et que vous ne souhaitiez pas porter de trop lourds bagages. Ou bien, vous tombiez – horreur – en panne de lecture à des kilomètres d’un lieu habité, et il vous suffisait de trouver un peu de réseau pour vous approvisionner, sans devoir attendre la prochaine virée en ville. C’est dire l’état d’intoxication où vous vous trouviez. Vous développiez ce faisant de nouvelles et détestables habitudes. Celle de quitter l’enclos du fichier pour vérifier en ligne l’origine ou le sens d’un mot, situer une ville sur une carte, et même poster une citation sur Twitter, avant de reprendre votre lecture.

Mais ce n’était pas la solution. Demeurait cette sale manie d’en revenir, toujours, à des objets horriblement figés. Cette obsession de vous enfermer dans ces espaces clos. Ce plaisir malsain de savoir que d’autres avant vous avaient lu ce texte, celui-là exactement, et que, peut-être, d’autres le liraient après. Cette erreur que vous aviez faite en entrant dans cette confrérie des lecteurs, mais vous étiez petit encore, à l’âge de vos premiers Club des Cinq, et personne ne vous avait mis en garde. Les liens que vous continuiez de tisser entre vos lectures, et, horreur, avec d’autres lecteurs. La confiance que vous faisiez, pauvre innocent, naïf lecteur, au bout de quelques titres, à cet éditeur – un éditeur ! – qui vous avait, disiez-vous, pour votre grand plaisir, emmené vers une contrée littéraire jusqu’alors inconnue de vous.

Non, il faudrait quelque chose de vraiment différent. Oui. Mettre un terme à tout cela. Ce repli sur soi. Ce temps passé, immobile, coupé des autres. Cette fréquentation de complets inconnus. Dont certains étaient morts, cela me fait peine de l’écrire. Il faudrait passer à tout autre chose. Quelque chose d’ouvert. Quelque chose qui permette la circulation, la rencontre, et l’oubli. Quelque chose d’anonyme. Quelque chose de mélangé à d’autres choses. Quelque chose de plus intelligent. Quelque chose qui vous connaisse. Quelque chose qui vous devine, qui vienne à votre rencontre. Qui ne se contente pas de singer les choses poussiéreuses posées absurdement sur l’étagère entre deux autres choses. Qui ne soit pas bêtement homothétique, stupidement apparenté au vieux monde en perte de vitesse. Quelque chose avec des algorithmes. Avec de l’intelligence, oui, mais de préférence artificielle. Il faudrait ouvrir ces trucs et gratter l’encre jusqu’à faire des trous dans les pages, il faudrait creuser dans les pages pour trouver le sens, mouliner les débris des pages dans de grandes machines à indexer, fabriquer des bases de données, il faudrait tout de même penser à fabriquer, bon sang, un jour, des bases de données.

Vous lisiez bien d’autres choses, aussi. Vous naviguiez des heures, lisant-écrivant sur le web inépuisable, rebondissant d’un site à l’autre, du français à l’anglais, absorbé parfois longuement. Lire longtemps sur l’écran ne vous dérangeait pas. Vous aimiez la rumeur du web, ses mélanges, ses territoires balisés et inconnus, les tressautements de l’hypertexte, les carambolages qu’il permettait, ses îles, ilôts, archipels, ses atolls et ses icebergs. Et vous aimiez que parmi ces ilôts, auprès des merveilles et des surprises du web, il soit possible d’identifier, de loin, des zones particulières, reconnaissables entre mille.

Vous aimiez vous dire que les livres s’étaient fait une place sur le web. Et que, numériques ou numérisés, bon nombre d’entre eux pouvaient demeurer des livres.

On allait bientôt s’occuper de vous.

 

 

 

 

 

 

 

Le travail d’un éditeur, selon Hugh McGuire

Hugh vient de me donner son accord, et je l’en remercie,  pour que je publie la traduction que j’ai faite de son article, «  A Publisher’s Job Is to Provide a Good API for Books  » paru hier sur le blog «  transforming publishing  ».

Le travail d’un éditeur, c’est de fournir de bonnes APIs pour ses livres.

par Hugh McGuire Voici une affirmation radicale : Le travail d’un éditeur, c’est de fournir de bonne APIs pour ses livres. Maintenant que presque tous les livres existent en version numérique, les bons éditeurs du futur sont ceux qui fourniront de bonnes APIs. Dans cet article, je vais explorer - pourquoi je considère que les éditeurs doivent fournir de bonnes APIs - pourquoi c’est vraiment plus simple et moins effrayant que ce que vous pourriez penser. - pourquoi le bon vieil index pourrait être le point de départ des APIs de livres.

Qu’est-ce qu’une API ?

Une API c’est un ensemble d’outils/protocoles qui permettent à différents éléments logiciels de communiquer les uns avec les autres, sous certaines conditions. Comme l’indique Terry Jones : “Tout comme une interface utilisateur donne à des humains accès à l’information, une API donne accès à cette information aux logiciels.” Voici quelques exemples d’APIs avec lesquelles vous êtes déjà probablement entrés en interaction : -  Si un jour vous avez  indiqué avoir aimé un site dans Facebook, vous avez utilisé une API -  Si vous utilisez une application mobile ou un logiciel dédié pour lire et poster sur Twitter, vous utilisez l’API de Twitter -  Si vous avez déjà payé quelque chose avec Paypal,vous avez utilisé une API -  Si vous avez utilisé une application vous montrant une carte, vous avez utilisé une API. Il existe une autre manière de se représenter une API : une API permet à un service d’utiliser les données d’un autre service, selon des modalités bien définies.

Quel rapport avec les livres ?

Quel rapport avec les livres ? Les livres évoquent des émotions, inspirent des réflexions, contiennent et véhiculent des idées. Mais ils contiennent aussi de l’information (“data”). Ils sont, si vous préférez, faits de données. Une photo numérique, un film que vous regardez en streaming, un mp3 que vous écoutez sur votre iPod : ce sont des objets numériques faits de 0 et de 1, ils sont représentés comme des données. Nous y accédons grâce à la technologie. Les livres, et spécialement les livres numériques, sont également faits de données. De 0 et de 1, mais aussi, en fait, de HTML. Si nous commençons à réfléchir aux livres en tant que données, alors le rôle traditionnel de l’éditeur commence à ressembler au rôle d’un fournisseur d’API : le rôle d’un éditeur est de gérer la manière et les circonstances selon lesquelles les gens (lecteurs) et certains services ( librairies, bibliothèques, autres ?) accèdent aux livres (données). Nous savons à quoi ressemble ce job dans le vieux monde du papier et des magasins en dur, et nous sommes presque sûrs de bien le comprendre également dans le monde de l’EPUB et du Kindle. Mais, alors que nous entrons dans un monde où le numérique va être prééminent, les éditeurs pourraient, et bientôt devront, commencer à réfléchir à leurs APIs- d’une manière qui va bien au delà du simple “envoyons nos livres aux libraires”. (Rassurez-vous,  je vais vous indiquer plus loin pourquoi cela ne sera pas trop inquiétant.)

Que fait un éditeur ?

Voici une définition historique d’un éditeur : Éditeur (n.m.) milieu du 15è s., “quelqu’un qui fait une annonce publique, nom de celui qui publie, (v.), La définition suivante :  “celui dont le travail consiste à mettre en vente des livres, des périodiques, des gravures etc.” date, elle, de 1740. (Source : the Online Etymology Dictionary). Le travail d’un éditeur, c’est de rendre publique l’œuvre créée par les auteurs, et, couramment, mais pas toujours, de monétiser ce travail. Ce n’est pas un secret : le numérique change l’environnement dans lequel les éditeurs exercent leur travail. Les librairies physiques sont en voie de disparition, les ventes en ligne augmentent, et les barrières à la publication, spécialement en ce qui concerne les livres numériques, ont déjà disparu. Dans ce monde où l’offre de livres explose, et où l’espace de vente physique des livres diminue, le travail qui consiste à “rendre public” commence à ressembler à quelque chose de vraiment différent. Quelques un des mécanismes selon lesquels les éditeurs atteignent leur but de “rendre public” des livres aux lecteurs et de les monétiser (à savoir : la production, la distribution et la vente) sont aujourd’hui accessibles aux auteurs eux-mêmes. Si les auteurs auto-édités peuvent faire de nombreuses choses que les éditeurs ont l’habitude de faire, alors trouver de nouvelles et de meilleures façons de “rendre public” les textes est ce qui va séparer les bons éditeurs des mauvais à l’avenir. Les meilleurs seront ceux avec qui les auteurs auront envie de travailler.Et un avantage que les éditeurs possèdent, et personne d’autre (même pas Amazon), c’est une connaissance précise du contexte et du contenu de leurs livres. Les éditeurs ont choisi leurs livres, les ont édités, corrigés, leur ont donné forme… Ils connaissent leurs livres de fond en comble. Cette connaissance devrait permettre aux éditeurs de mieux agréger l’intérêt porté à leurs livres. Le problème avec ceci, alors même que les éditeurs possèdent toute cette connaissance au sujet de leurs livres, est qu’ils ne savent pas vraiment comment partager cette connaissance, comment l’utiliser comme un moyen effectif de porter leurs livres à la connaissance d’un large public. Mais ce serait très facile pour les éditeurs de devenir meilleurs à cet exercice.

De quoi les éditeurs ont-ils une connaissance précise, exactement ?

Les livres peuvent être décrits de différentes manières : par leur couverture, leur nom d’auteur, leur titre, la liste de leurs chapitres, une description du livre. C’est ce que vous pourriez appeler les “métadonnées” ou bien “les informations que l’on communique aux libraires”. AAA l’intérieur du livre nous avons des mots et des phrases, peut-être quelques images. Et si vous regardez attentivement ces mots et ces phrases, vous pouvez définir un certain nombre de choses que vous trouvez dans ces phrases, telles que :
- des gens (véritables, ou personnages de fiction)
- des lieux (véritables ou de fiction)
- des époques, des dates.
Et il y a certaines autres choses que vous pourriez extraire :
– des concepts
- la référence à d’autres textes
- des citations de gens, de livres, d’articles, de films ou de chansons
- des exemples
Cette liste peut se prolonger encore et encore, et bien sûr dépend du genre de livre que vous produisez.

Et si je vous demandais de construire un index plutôt qu’une API ?

Si vous regardez la liste qui précède, particulièrement si vous produisez non pas de la fiction mais des livres scolaires ou des documents, vous êtes en train de hocher la tête et de dire : «  … oui, c’est bien le genre de choses que nous mettons dans un index.  »Et vous avez raison : un index est une sorte de “carte de ce qui se trouve à l’intérieur de votre livre, et de comment le trouver”. Un index, dans un livre papier traditionnel, est un outil fantastique pour savoir quel genre de choses se trouve dans un livre. Cela ne demande pas un gros effort de transformer un index lisible par un être humain en un index lisible par un ordinateur, ce qui en fait, plus ou moins, une API. (C’est ainsi que fonctionnent les moteurs de recherche : ils “indexent” chaque mot d’une page HTML, et chaque page d’un site, et ils fournissent une API qui permet aux gens et aux programmes de trouver des choses.)

Dans le cas des livres imprimés, la manière habituelle d’indexer un livre est de dresser la liste de ce qui vous semble important (les gens, les lieux, les dates, les références, les concepts etc.) et d’indiquer au lecteur à quelle page il pourra retrouver ces éléments. Vous imprimez cette liste et les références de pages et vous l’ajoutez à la fin de votre livre. Dans le cas des livres numériques, un (bon) index fera quelque chose de tout à fait différent : il listera les gens, les places, les concepts etc… et il les fera pointer directement vers l’endroit où ces items apparaissent dans le texte, via un lien, car les numéros de page n’ont pas beaucoup de sens pour les livres numériques. Donc, dans un livre numérique, qui, après tout n’est rien d’autre qu’une série de fichiers HTML avec quelques petits trucs en plus, une entrée d’index est associée à une ancre située à l’intérieur du fichier HTML, là où l’entrée apparait.   Ainsi, vous avez un texte qui dit  :

 

et le balisage HTML de la page, qui vous permet de lier votre fichier d’index est :

 

À la fin de votre livre numérique, qui possède une liste correspondante d’items reliés à votre ancre dans le corps du texte qui ressemble à ça :
Le fichier HTML/page sera une liste de liens qui pointent vers l’intérieur de votre livre là où apparaissent les entrée de votre index. Ajoutez un peu de données sémantiques, remuez, et vous vous êtes dotés d’une API – ou du moins une carte à partir de laquelle bâtir votre API. Si au lieu de simplement faire un lien vers une ancre au niveau de votre index, vous passez un peu de temps supplémentaire pour ajouter quelques données, vous pourriez faire quelque chose comme ceci, qui spécifie qu’à cet endroit précis du texte, vous avez défini une personne nommée John Smith
et vous pourrez également mentionner le fait qu’un élément du texte est un lieu de la manière suivante :
Et plus loin, vous pourrez tagger des concepts comme ceci :

 

Si vous voulez être encore plus sympa, vous pourriez réaliser ce balisage sémantique en vous basant sur des schémas comme schema.org ou bien microformats. Cela vous permettrait, à vous et à d’autres éditeurs, de standardiser la manière dont vous parlez des “choses qui figurent dans les livres.” Maintenant, si vous faites ça avec votre livre complet, ou bien si vous le faites faire par quelqu’un d’autre, vous pourrez ensuite : a) générer un index (que vous auriez fait de toute manière) mais, et c’est bien plus intéressant, vous pourriez b) générer un index intelligent qui sait non seulement où apparaissent toutes les instances du terme “John Smith” mais : – où apparaissent tous les gens – où sont toutes les instances de gens nommés John – où apparaissent toutes les instances des gens nommés Smith – que “ma chère Granny Smith” est une personne et que “ma délicieuse Granny Smith” est une pomme Et maintenant, en lieu et place d’un simple index, vous avez une carte sémantique complète de votre livre, une carte qui a été juste un petit peu plus difficile à produire qu’un index standard que vous auriez réalisé de toute manière. Et alors ? Avec une telle carte sémantique vous avez l’amorce d’une API incroyablement puissante. Si en plus d’avoir une carte sémantique… vous avez également votre livre disponibles en ligne (derrière un accès payant ou non) cela signifie que vous pouvez rendre cette API/carte sémantique  accessible au monde enter, (gratuitement, ou bien à certaines conditions commerciales) et dire : je vous en prie, trouvez de merveilleuses idées pour utiliser le contenu de mon merveilleux livre !

Qu’est-ce que le monde va bien pouvoir faire avec votre API ?

Voici quelques unes des choses que vous aimeriez peut-être que les autres (ou bien vous mêmes) réalisent avec votre API : – extraire une liste des personnages dans le livre, et donner à chacun d’entre eux une petite biographie. Rassembler ces biographies dans un “guide biographique”. – Extraire une liste de localisations dans le livre et les placer sur une carte – Extraire les 500 mots autour de chaque apparition du concept “existentialisme” … parmi tous les livres édités par des éditeurs qui ont rendu disponibles leur carte sémantique, et trier par décennie, influence, ou nationalité de l’auteur – Construire une frise chronologique indiquant où se trouvent les différents personnages à différentes périodes du récit. – Faire pointer cette frise chronologique vers une carte – Construire un outil de navigation permettant aux utilisateurs d’explorer un livre par ses personnages, ses lieux, ses dates, ses concepts. Vous pourrez également vouloir publier cette carte sémantique sur le web, ainsi Google et d’autres moteurs de recherche auront une compréhension détaillée de ce qu’il y a dans votre livre, et ainsi lorsque des gens rechercheront un type précis d’information qui apparaît à la page 119 de votre livre, le moteur sera capable de pointer vers chez vous. Il y a tant d’ «  et cetera” ici, et nous venons à peine de commencer.  Nous pouvons déjà trouver quelques petits reflets de tout cela : – Small Demons extrait des gens/lieux/choses via une API, il demande aux éditeurs leurs fichiers EPUB afin de pouvoir parcourir les fichiers, et ensuite afficher les produits, les autres livres, les films et les musiques trouvés à l’intérieur des livres. - Dracula Dissected s’appuie sur le texte de Bram Soker, et permet d’y accéder par personnages, dates, lieux et vous pouvez ainsi explorer le livre de différentes manières. - Pearson’s FT Press API vous permet d’extraire de l’information de certains EPUBS et de faire diverses choses avec. - Wordnik.com extrait des phrases de définition de livres publiés par Simon and Schuster et les utilise comme phrases exemples pour les entrées d’un dictionnaire. Nous n’en sommes qu’aux balbutiements, aux premiers exemples. Nous n’avons encore rien vu. Nous allons en voir beaucoup plus parce que le travail d’un éditeur est de “rendre public” et qu’une API est précisément faite pour mettre les données en capacité d’être rendues publiques. C’est exactement ce à quoi elles servent. Nous allons en voir plus parce qu’il apparaît que faire des APIs pour les livres est quelque chose de facile.

Et ça va arriver comment ?

Des outils comme PressBooks, qui est un outil de production de livres nativement web, rend très simple l’ajout d’une indexation sémantique, ou bien vous laisse le faire à la main ; où, plus efficacement, vous permet de combiner les deux. Sélectionner le texte que vous souhaitez ajouter à votre fichier d’index, ajoutez les métadonnées qui vont bien (est-ce une personne, un concept ?) et appuyez sur “go”. Le défi, c’est de faire un bon  fichier d’index, bien sûr, avec de bonnes métadonnées et selon un bon schéma. Nous savons bien maintenant faire des livres numériques. Voyons maintenant comment traiter la manière dont on peut relier les livres entre eux via des APIs. Y arriver n’est pas si difficile : la clé pour pour réaliser ces fameuses APIs , c’est ce bon vieil index. (Merci à Brian O’LearyLaura DawsonTerry JonesErin McKean, et Dac Chartrand, qui m’ont aidé à améliorer la première version de cet article.)

Que pouvons-nous apprendre des webdesigners ?

Le livre numérique, c’est «  juste  » un fichier…

À la jonction entre les deux significations du terme “livre” (livre en tant qu’œuvre de l’esprit ou livre en tant qu’objet matériel), se situent des opérations de mise en forme qui sont transformées radicalement dès lors qu’il s’agit de produire un livre numérique : ces opérations à la fois intellectuelles et artistiques qui participent au sens et au propos du livre conditionnent également sa matérialité, son aspect. Contrairement à ce que certains imaginent, la fabrication d’un livre numérique est tout sauf triviale. Comment ça ? L’édition ne s’est elle pas déjà informatisée depuis de longues années ? N’est-ce pas déjà un fichier informatique qui est aujourd’hui adressé à l’imprimeur ? Qu’il n’y aurait plus qu’à mettre à disposition des e-libraires ?  En réalité,  le fichier destiné à l’imprimeur n’est en aucun cas utilisable tel quel pour la lecture numérique. Il a été mis en forme en vue d’une impression, et non d’un affichage sur des terminaux de différentes tailles, disposant de différents moteurs de lecture, supportant différents formats. La production de fichiers numériques susceptibles d’offrir  une expérience de lecture numérique satisfaisante nécessite le recours à des savoir-faire particuliers ainsi que la mise en place d’un process de production itératif (produire, tester sur différents terminaux, corriger, tester etc.) jusqu’à obtention d’un fichier, en réalité de plusieurs fichiers,  de la qualité requise. Que certaines de ces opérations soient ou non sous-traitées à des sociétés extérieures ne change rien à l’affaire : c’est l’éditeur qui est responsable, en particulier devant l’auteur, de la qualité du fichier qui va être mis en circulation. C’est lui qui signe le “bon à publier”.

Ça ressemble au web…

La réalisation d’un livre numérique n’est-elle pas, de ce fait, plus proche dans les compétences qu’elle requiert, de l’activité d’un webdesigner que de celles des maquettistes et des compositeurs du monde de l’imprimé ? Le webdesign est né dans dans un milieu technique très contraint : faible bande passante, performances médiocres et disparité dans l’interprétation des standards des navigateurs, outils frustes, écrans faiblement définis, affichages lents, nombre de polices de caractères limité. Même si les performances des écrans et de la bande passante ont évolué, le talent du webdesigner réside encore aujourd’hui dans sa capacité à intégrer des contraintes qui demeurent fortes pour créer des sites beaux et agréables à consulter, d’une navigation aisée, mais également  faciles à mettre à jour et à faire évoluer. Une séparation radicale a aussi eu lieu en ce qui concerne le webdesign : on a rapidement cessé de mélanger dans un même fichier la description et l’expression du contenu des instructions concernant sa mise en forme. Ce qui permet, en modifiant un fichier, de modifier l’aspect de tout un site web. Ce qui offre aussi la possibilité de faire circuler les éléments de contenu et de les afficher dans des environnements graphiques très différents les uns des autres.

À celui qui réalise des livres numériques, le webdesigner pourra enseigner une certaine humilité  :  ni l’un ni l’autre n’ont sur le résultat final de leur travail le même contrôle absolu que celui dont dispose le maquettiste dans le monde de l’imprimé. Cette philosophie du webdesigner, qui, ayant accepté une certaine perte de contrôle, met tout son talent à proposer cependant la meilleure expérience de lecture et de navigation possible, est très utile au e-book designer. Et les deux métiers ont ceci de commun que pour les pratiquer avec succès, il faut marier une grande sensibilité visuelle avec un intérêt pour la dimension “computationnelle”, le goût de l’image et celui du code.

…mais ce n’est pas le web.

Le webdesign ignore cependant presque tout de ce qu’est un livre, et apporte rarement des solutions satisfaisantes aux problèmes spécifiques posés au ebook designer. Comment  permettre le confort d’une lecture immersive ?  Cela passe par la réponse à une infinité de questions du type : “Comment gérer les notes en bas de pages ?” “ Comment obtenir un affichage convenable des lettrines ?”  “Quel repère dans l’avancement d’un texte si le numéro de page n’est plus attaché, selon la taille de l’écran utilisé pour le lire, à la même portion de texte ?”… Les réponses à ces questions ne sont pas toutes du ressort de celui qui travaille à produire le fichier numérique : certaines sont apportées au niveau du logiciel de lecture, d’autres au niveau du format de fichier. La personne en charge de la production du fichier  doit cependant être consciente de la latitude dont elle dispose, afin de l’exploiter au maximum. Les subtiles différences entre les plateformes de vente de livres numériques dans la manière d’accommoder les formats débouchent sur des différences dans l’affichage d’un même livre selon qu’il est acquis sur une ou l’autre plateforme, consulté sur l’un ou l’autre terminal. Le travail de préparation des fichiers ressemble fort aux tests que les développeurs web doivent accomplir sur les différents navigateurs (internet explorer, safari, firefox etc.) dont la plupart ne respectent qu’imparfaitement les spécifications publiées par le w3c. L’utilisation d’un unique fichier, qui procurerait une expérience de lecture parfaitement satisfaisante sur l’ensemble des plateformes et la totalité des dispositifs de lecture est aujourd’hui illusoire, ou bien oblige à s’aligner sur le moteur de lecture le moins performant. Pour qui reste attaché à la qualité, pour qui ne s’en remet pas au hasard pour décider de la forme d’un texte, plusieurs variantes numériques d’un même titre doivent être produites, chacune prenant en compte les spécificités de chaque plateforme.

Je suis loin d’avoir fait le tour de la question, et les modes d’organisation diffèrent grandement selon la taille des maisons d’édition, le nombre et le type de livres produits. Certains secteurs d’édition (guides de voyage par exemple) se prêtent plus que d’autres à la mise en place de process de production quasi automatisés, la structuration des textes se faisant dès l’amont (XML first), les auteurs appelés à  travailler directement sur des outils effectuant cette structuration de manière transparente.

J’aurai plaisir à lire vos réactions et témoignages sur ces questions dans les commentaires…

Bookcamp à New Work City

Non, il n’y a pas de faute de frappe dans mon titre, c’est bien New Work City avec un W et pas un Y que j’ai voulu écrire, NewWork City c’est le nom du lieu où se déroulait le Bookcamp où je me suis rendue aujourd’hui. Ce lieu ressemble à La Cantine, qui a abrité plusieurs Bookcamps à Paris, un lieu de coworking, qui offre espaces de réunion, postes de travail et connections aux startup. J’ai découvert assez tard l’existence de ce Bookcamp, et même si ça pourrait faire assez chic d’essayer de vous faire croire que j’ai fait le déplacement tout exprès depuis Paris, je sais bien que ce serait difficile de vous convaincre. Non, j’y suis allée parce qu’il se trouve que j’étais déjà à New York en prévision de la conférence Tools of Change qui commence demain. Me voici donc embarquée dans une «  non conférence«  en prélude à la «  conférence  ».

Première observation, le principe de la non conférence est ici mieux respecté que nous ne le faisons lors de nos Bookcamps parisiens : il n’y a vraiment pas de programme préparé. Une personne anime le Bookcamp (ce que fait Hubert Guillaud lors des bookcamps parisiens) : elle rappelle les principes, invite les participants à réfléchir aux sujets qu’ils aimeraient voir aborder et à les noter sur un papier. Puis chacun de ceux qui ont noté quelque chose lit son papier à voix haute, des regroupements peuvent s’effectuer si des thèmes sont très proches, et le planning de l’après-midi se remplit ainsi très vite : 4 lieux, 4 sessions, cela fait 16 sujets…

La première session à laquelle je me joins est consacrée à la «  lecture sociale  » et animée par Iris Blasi. Elle utilise pour lancer la discussion les distinctions proposées par Bob Stein pour distinguer les différents types de sociabilité liées à la lecture :

Catégorie 1 – Discuter d’un livre en personne avec des amis ou des connaissances
(hors ligne, informel, synchrone, éphémère)

Catégorie 2 – Discuter d’un livre en ligne
(en ligne, informel, synchrone ou asynchrone, éphémère)

Catégorie 3 – Discuter d’un livre en classe ou dans un club de lecture
(hors ligne, formel, synchrone ou asynchrone, éphémère)

Catégorie 4 – S’engager dans une discussion DANS les marges d’un livre
(en ligne, formel, synchrone ou asynchrone, persistent)

Lors de la discussion qui suit cette taxinomie est rapidement perdue de vue, et les arguments s’échangent sur un mode un peu «  pour ou contre  » sans que soit toujours bien précisé de quoi on est en train de parler exactement. Mais cela n’enlève pas tout intérêt à l’échange, qui fait émerger des questions pertinentes, la plus importante à mes yeux étant probablement   » avec qui souhaite-t-on partager ses lectures au sens de la catégorie 4 de Bob Stein ?  » . C’est une question qui renvoie à l’usage des réseaux sociaux, à cette notion d’ami-qui-n’en-est-pas-un introduite par Facebook, à cette sociabilité élargie à des inconnus que permet le web, inconnus qui ne restent pas vraiment des inconnus même si on ne les rencontre pas, parce que les échanges créent un lien et chacun montre de soi quelque chose dans ces échanges. On entend les arguments des sceptiques de la lecture sociale, ceux qui s’écrient «  ah non, moi, quand je lis, c’est justement pour vous oublier, tous tant que vous êtes !  », ceux des obsédés de la vente (ben ça nous intéresse pas ce que les gens font une fois qu’ils ont acheté un livre, nous, ce qui nous intéresse c’est le prochain livre qu’ils achèteront), ceux qui rappellent que ce qui marche dans les réseaux sociaux c’est la simplicité (on peut partager quantité de choses en ligne sans rien avoir à rédiger du tout, avec des outils comme Foursquare ou Pinterest). La difficulté de citer et de partager les livres protégés par des DRM est également mentionnée, ainsi que la disparité des systèmes de partage d’annotation, eux aussi dépendants des plateformes de lecture. La dichotomie «  parler d’un livre / se parler depuis l’intérieur d’un livre  » est bien soulignée.

L’atelier suivant se veut une réflexion sur les caractéristiques respectives du livre numérique et du livre imprimé. Nick Ruffilo qui l’anime est venu avec un Scrabble, et pendant que la discussion se poursuit, la moitié des participants joue contre l’autre moitié, plusieurs personnes représentant les équipes se succédant pour chercher et placer des mots. Je n’ai pas très bien saisi le pourquoi de cette mise en scène, je l’avoue, une analogie demeurée indéchiffrée, mais c’était assez plaisant… Sur les pratiques de lecture, rien de très nouveau pour qui, comme toi, lecteur bien-aimé, s’intéresse de près à ces questions. Différents sondages auprès des participants (qui lit comment ?), qui montraient une fois encore que personne n’abandonne complètement un type de lecture pour un autre, que certaines qualités du livre imprimé demeurent inégalées (en particulier sa manière d’être un objet que l’on peut reconnaître à sa forme, sa taille, sa couleur, alors que tous les livres numériques prennent la forme du terminal que l’on utilise pour les lire, demeurant hors de portée de la curiosité d’autrui.)

Une chose me frappe qui rend très différent ce bookcamp des expériences françaises, c’est  la manière d’échanger des Américains. On sent qu’ici l’expression orale est enseignée à l’école. Les élèves, les étudiants, sont encouragés à prendre la parole et à s’exprimer, et cela se sent. En conséquence, les personnes qui ne possèdent pas naturellement une aisance à parler en public sont capables cependant de prendre la parole. Chez les personnes au tempérament le plus introverti, on peut discerner un côté «  j’ai appris à m’exprimer  », avec une gestuelle et une diction  dont on voit bien qu’elles sont le fruit d’un entrainement. Les autres semblent parfaitement à l’aise.  Mais le résultat, ce sont des débats où la parole circule très librement, où l’écoute de l’autre est la règle, et où beaucoup de gens différents prennent la parole.

Chez nous, la timidité est plus forte, ainsi qu’une sorte de «  révérence  » pour les personnes auxquelles on prête une autorité, et qu’on va difficilement contredire ou questionner. Autre chose :  la peur de passer pour un idiot est très forte, on préfère ne rien dire que de risquer de dire une chose incongrue. Le résultat c’est que les ateliers de nos Bookcamps  ressemblent parfois plus à des mini conférences, et que ceux qui y prennent la parole sont le plus souvent ceux qui sont habitués à le faire en public.

Parmi les participants au troisième atelier, Joshua Tallent, de chez Ebooks Architects , un expert en formatage de livres numériques, conseille à l’assistance de participer au wiki eprdcton.org, et de suivre sur twitter le hashtag #eprdctn.

L’une des questions débattues ici est très familière à tes oreilles, cher lecteur : est-il possible de produire un fichier  EPUB «  single source  », qui servira de base à toutes les conversions vers les formats propriétaires ou vers les EPUB-qui-ne-sont-plus-tout-à-fait-des-EPUB ? Pour Joshua la réponse est non, car ce format unique, qui fait tant rêver les éditeurs, obligerait à des compromis sacrifiant trop la qualité, en usant du plus petit dénominateur commun. Mieux vaut accepter de produire plusieurs formats qui divergent, chacun tirant au mieux parti de la manière dont sont développés les moteurs de lecture. Ce n’est pas l’avis de plusieurs éditeurs présents qui considèrent que lorsque les titres à publier se comptent en milliers, il n’est pas possible de faire ce patient travail artisanal sur chacun des titres, et qu’il faut trouver des solutions duplicables favorisant le maximum d’automatisation. Tout le monde s’accorde à dire qu’il ne faut pas s’attendre à plus de stabilité, mais que l’adaptation à de perpétuels changements dans le domaine du formatage est désormais la règle.

Le dernier débat auquel j’assiste a pour thème «  crowdsourcing the perfect business model  » et,  je vous le dis tout de suite, la «  foule  » n’a pas réussi malgré ses efforts à trouver ce business model idéal. L’équation est un peu compliquée, mais tous s’accordent à dire que l’on est encore loin d’avoir tout inventé. Une personne de chez Harlequin indique que des modèles basés sur l’accès, qui permettent aux lecteurs de charger 6 livres de leur choix chaque mois choisis parmi un catalogue thématique, commencent à sérieusement concurrencer les modèles de vente à l’unité. La conversation tourbillonne, il est question du nombre de titres produits par les éditeurs, quelqu’un évoque le problème des retours, certains disent qu’il ne faut pas produire plus de livres qu’on ne peut en soutenir activement d’un point de vue marketing.

Après les ateliers, ce qui va se passer ressemble énormément à ce qui clôt habituellement nos Bookcamps parisiens : on entend le bruit des bouchons qui sautent, le pas des bookcampeurs qui se rapprochent des bouteilles et des verres. Un petit détail aussi, pratique et simple à mettre en œuvre : sur la table, à l’entrée, un tas de feutres de toutes les couleurs et des paquets d’étiquettes auto-collantes. La plupart des gens y ont inscrit en arrivant leur  leur nom et leur pseudo twitter, certains ajoutent le nom de leur société. C’est pratique, plus simple que les trucs en plastiques avec épingles à nourrice qui piquent, et ça simplifie bien les échanges. Cela me permet de mettre des visages sur de très nombreux habitants de ma timeline : les participants sont nombreux, et bon nombre d’entre eux viennent de grands groupes d’édition (Random House, Macmillan, Penguin…). Je n’ai pas besoin de regarder son étiquette pour reconnaitre Cristina Mussinelli, une consultante qui travaille pour  l’AIE (l’équivalent du SNE en Italie), et qui siège aussi à l’IDPF. Elle et moi sommes ici les deux seules européennes. Mais, dans mon souvenir, il n’y avait, me semble-t-il,  pas un seul Américain cet automne au Bookcamp Paris…   (Bon, il n’y avait pas non plus de TOC juste après, c’est vrai.)

Books in Browsers : next gen publishing

Slide Brian 0'Leary - Books In Browsers 2011

Pas question, à peine revenue de mon intermède Polynésien et de trois jours à Francfort, de repartir presque aussitôt à San Francisco pour assister à la conférence Books In Browsers, qui se tenait les 27 et 28 octobre au siège d’Internet Archive, sous la houlette de Peter Brantley, avec la complicité de Kat Meyer, de chez O’Reilly. Mais, grâce à une diffusion vidéo de très bonne qualité, j’ai pu assister à la plupart des interventions, confortablement installée dans mon canapé.

L’écran de mon ordinateur était divisé en trois zones, l’une affichait la retransmission vidéo, une autre le fil Twitter avec le tag #bib11  – aujourd’hui, quelqu’un a posté l’ensemble des tweets sur Scribe – , et une troisième un traitement de texte, pour la prise de notes.

Le nom de cette conférence, «  Books In Browsers  » est un avertissement : ici, on aime les livres et on aime le web, et nul ne se sent obligé d’enterrer les uns pour célébrer l’autre, ou de sacraliser les premiers en méprisant le second. L’assistance (pas de Français, hélas, à part Hadrien Gardeur venu présenter la nouvelle version d’OPDS, mais des Espagnols, des Anglais, des Italiens, des Japonais, des Finlandais…) est composée d’éditeurs, de développeurs, de designers, de bibliothécaires, d’agents, d’auteurs, d’universitaires. L’ensemble est plutôt plus techno que dans les autres conférences, ainsi, lorsque Blaine Cook, un développeur venu présenter Newspaper Club demande à son auditoire combien d’entre ses membres savent ce qu’est Git, une forêt de mains se lèvent.

Je vous invite à consulter les présentations des différents intervenants, qui vont s’ajouter progressivement  ici, et à regarder de temps en temps l’une des vidéos : elles s’ajoutent actuellement sur la chaîne YouTube d’O-Reilly. Et je ne vais pas me lancer dans une recension de l’ensemble des interventions, il y a là un matériau pour une bonne cinquantaine de billets… Quelques impressions, comme souvent sur ce blog impressionniste…

Richard Nash a proposé un bilan de son projet Cursor, et du site pilote Red Lemonade. Avec une transparence impressionnante, il a analysé publiquement l’échec de Cursor. Je n’ai pas su, a-t-il expliqué, trouver la «  bonne histoire  » à raconter aux investisseurs (Venture Capitalists). Les VCs veulent une bonne histoire, ils veulent aussi une histoire qu’ils reconnaissent, qui les rassure. Autant un projet bien peu pertinent comme celui de BookTracks, qui consiste à ajouter des bandes son sur des livres, a pu les convaincre, sur la base du «  cela n’a jamais été fait  » (comme si tout ce qui n’avait jamais été fait, il fallait absolument le faire…), autant le fantasme si répandu de la désintermédiation rendait le projet Cursor incompréhensible pour les investisseurs. Belle démonstration, ce témoignage de Richard, d’une qualité qui nous manque cruellement en France : celle qui permet de ne pas considérer un échec comme un désastre honteux, mais comme la preuve  d’une capacité à innover, à sortir des sentiers battus et à prendre des risques.

Richard a décidé de continuer Red Lemonade sur une base bénévole, et, après avoir rencontré Valla Vakili, le fondateur de Small Demons, a été séduit par ce projet qui veut «  rapprocher les livres, sources les plus riches et les plus denses de la culture, des autres objets culturels  ». Le voici donc «  VP of Content and Community  » chez Small Demons, comme il l’explique ici.

La présentation de Small Demons par Valla Vakili m’a plutôt impressionnée. À première vue on se dit : «  encore un Libraryting like, un site communautaire de partage de bibliothèques  ». Il s’agit en réalité de tout autre chose, d’une plateforme qui extrait du web, se basant sur l’indexation du contenu des livres, des objets culturels en relation avec ces contenus. Ce n’est plus simplement l’algorithme d’Amazon qui dit : «  vous avez aimé tel livre, ceux qui l’ont acheté ont aussi acheté celui-là, pourquoi pas vous ?  ». C’est l’idée qu’un livre, y compris un roman,  est bourré de références à d’autres objets culturels, qu’il s’agisse de morceaux de musique, de films ou de séries, de plats, d’objets, de lieux, et de proposer des liens, pour chaque livre, vers tous ces objets, et de se servir de ces liens pour proposer des découvertes. Il semble que l’ajout de liens entre livres et objets soit à la fois algorithmique et le fait des internautes.  La démonstration donne réellement envie d’aller se perdre dans ce petit paradis de sérendipité que semble être Small Demons, pour l’instant en beta sur invitation. La vidéo de présentation est à voir.

photographie de Brian O'LearyJ’avais un peu de mal à garder les yeux ouverts au moment où Brian O’Leary, (Magellan Media) a pris la parole car, avec le décalage horaire, il était plus de deux heures du matin samedi. Mais l’adresse de Brian était si ambitieuse, et entre si fortement en résonance avec ce que nous pouvons observer ici en ce moment, que je me suis vite réveillée. Eric Hellman, le fondateur de Gluejar, qui a lui aussi présenté son activité lors de la conférence, résume le propos dans son blog ce matin.

Eric cite Brian O’Leary : «  Bien que les modèles économiques aient changé, les éditeurs et leurs intermédiaires continuent d’essayer de faire évoluer leur rôle sur le marché d’une manière qui suit typiquement la règle des négociations «  deux parties – un résultat  ».   » Il dit ensuite :

O’Leary a évoqué les changements qui sont en train d’intervenir dans l’écosystème de ce que l’on a appelé «  le monde du livre   » : auteurs, agents, éditeurs, distributeurs, libraires, bibliothèques, et bien sûr lecteurs. Il a fait remarquer que les relations à l’intérieur de cet écosystème étaient aujourd’hui renégociées entre les acteurs sans prise en compte des changements à l’œuvre dans le reste de l’écoystème.

«  En conséquence, les structures, les dispositions, les processus qui pourraient être bénéfiques pour l’ensemble de l’écosystème n’obtiennent pas toute la considération qu’ils méritent.

O’Leary a cité l’exemple de la Convention des Nations Unies sur le droit de la mer comme un modèle possible d’inspiration pour la redéfinition d’un écosystème de la lecture. La percée dans ces discussions a été permise par l’introduction de modèles tirés de la théorie des jeux qui ont aidé les parties à apercevoir  les effets des accords et des dispositions relatives à tous les intervenants dans le droit de la mer.  »

En effet, on trouve une note concernant la théorie des jeux dans ce rapport de la FAO, se rapportant à un chapitre où est évoquée cette Convention :

«  Si le même genre de modèle pouvait être développé pour les activités entourant l’édition, il pourrait être possible de faire beaucoup plus que «  sauver l’édition  ». Une application intelligente et  collaborative des technologies numériques devraient être en mesure d’accroître l’efficacité d’une industrie dont le but est de promouvoir la lecture, l’éducation, la culture et la connaissance.

Selon O’Leary, nous devons trouver des façons de financer le genre de recherche qui pourraient être la base de la modélisation de l’écosystème de lecture. Une possibilité serait de créer une organisation interprofessionnelle pour ce faire.  »

Et Richard Nash de twitter aussitôt malicieusement :

Il y a encore beaucoup à dire à propos de Books In Browsers 2011, et j’aurais aimé notamment revenir sur les interventions de Bill McCoy concernant EPUB3, d’Hadrien sur OPDS, de Mary Lou Jepsen (Pixel Qi) sur les écrans et l’accessibilité, de Bob Stein sur les lectures connectées, de Craig Mod, James Bridle, Joseph Pearson, Javier Celaya et quelques autres.

Les livres sont aujourd’hui, de plus en plus, traversés par le web, percutés par le web, générés par le web, diffusés sur et par le web, réinventés sur le web. Les projets présentés à Books In Browsers par plusieurs start-ups (liste ici ) explorent différentes dimension de cette réinvention, start-ups qui ont aussi profité de cette conférence pour tisser des liens les unes avec les autres, construisant, notait Peter Brantley sur Twitter ce matin, l’écosystème d’une édition nouvelle génération (next gen publishing).

sur  sur les écrans et l’accessibilitésur  sur les écrans et l’accessibilité

Que se passe-t-il quand…

Que se passe-t-il lorsque (environ) 10% des livres vendus sont des livres numériques ? C’est la question que je me posais en arrivant à la conférence Digital Book World en début de semaine dernière. Car c’est bien ce qui se passe aujourd’hui aux USA, où les ventes d’ebooks ont connu une croissance très rapide depuis deux ans.

La première chose à laquelle pensent les professionnels du livre, avec la perspective d’un prochain décollage du marché du livre numérique, c’est à la possibilité d’une mise en difficulté des librairies. Celles-ci n’ont pas attendu le livre numérique aux USA, l’arrivée des chaînes de librairie puis celle d’Amazon avaient déjà fait chuter dramatiquement  leur nombre. Le basculement d’un nombre de plus en plus important de lecteurs vers la lecture numérique va-t-il venir à bout de celles qui ont survécu ? C’est l’avis de Mike Shatzkin, qui annonce une réduction de 90% des rayonnages en librairie dans les dix prochaines années. Jane Friedman, ex CEO d’Harper Collins et fondatrice d’Open Road Media n’est pas d’accord : il y a, dit-elle, un avenir pour les libraires : au contact direct des lecteurs, ils ont l’opportunité de jouer un rôle de médiation au niveau local, et alors qu’il est sans arrêt question d’écouter ses clients, d’animer des communautés, de se rapprocher des lecteurs, ils sont très bien placés pour ce faire, en sachant prolonger en ligne l’activité de leur magasin. L’enquête Verso révèle par ailleurs que «  80.7% des participants ont déclaré qu’ils préfèreraient acheter des livres numériques en ligne chez leur libraire local indépendant si les livres y étaient vendus à un prix compétitif.  »

Quid des bibliothèques ? Le président de Macmillan s’est fait interpeller, dès le débat d’ouverture de la conférence, par la blogueuse Sarah Wendell (du blog dédié au roman sentimental Smart Bitches ), qui lui a demandé pourquoi, alors qu’il semblait si désireux d’atteindre tous les lecteurs, ses livres numériques n’étaient pas disponibles en bibliothèque. La réponse de Brian Napack (avant de mettre en circulation des versions numériques de nos livres en bibliothèques, nous recherchons le business model  qui conviendra ) n’a pas satisfait  Jane Friedman, qui considère qu’il est temps de prendre au sérieux le public des bibliothèques, et que celui qui emprunte un livre numérique est tout près de l’acte d’achat. Pas de business model ? Steve Potash, le CEO d’OverDrive, n’est pas d’accord : plus de 13000 clients, bibliothèques, collèges, universités utilisent ses services pour le prêt de livres numériques, selon un modèle qui, dit-il, a fait ses preuves.  A la bibliothèque publique de New York, un bouton «  acheter  » est présent depuis quelques semaines dans l’application, mais il est encore trop tôt pour savoir dans quelles proportions ce bouton est utilisé. La simple présence des livres numériques dans les catalogues des bibliothèques leur donne de la visibilité, ce dont les livres ont le plus grand besoin. Ruth Liebmann, directrice du marketing direct chez Random House, s’intéresse de très près aux bibliothèques. Elle y effectue ce qu’elle appelle un «  Library Listening Tour  », afin de recueillir l’avis et les attentes des lecteurs de livres numériques.

La grande vedette de cette édition de DBW, ce sont les métadonnées. Il semble bien que plus les éditeurs voient grandir la part numérique de leur activité, plus ils prennent au sérieux les métadonnées.  Deux sessions leur sont entièrement consacrées, mais on en parle dans de nombreuses autres, et c’est bien. Les métadonnées ne sont pas nées avec le livre numérique, bien évidemment. Il était déjà indispensable de fournir des informations détaillées concernant les livres imprimés, pour rendre possible la commercialisation d’objets qu’il était nécessaire d’identifier convenablement et de décrire, d’une part, et aussi pour constituer des catalogues utilisables en bibliothèque. Cependant les  métadonnées demeuraient l’affaire des spécialistes de la distribution, de la diffusion, de la vente, ou du catalogage en bibliothèque : le livre un fois posé sur l’étagère d’une librairie expose lui même aux yeux des clients ses propres métadonnées. Sa localisation dans tel ou tel rayon,  informe le lecteur potentiel de la catégorie à laquelle il appartient, de la thématique qu’il aborde, sa tranche donne le titre, l’auteur, l’éditeur, et il suffit à quiconque de se saisir du livre pour découvrir sa couverture, de le retourner pour lire un résumé, de le feuilleter pour lire un extrait et se faire une idée de son contenu. Lorsque le livre est un livre numérique, cette expérience de manipulation est exclue. L’œuvre doit être présentée au lecteur sur un écran, celui d’un PC, d’une liseuse, d’un smartphone ou d’une tablette, et pour que cette présentation permette au lecteur de découvrir le livre, chacune des informations affichées doit avoir été saisie et transmise : titre, auteur(s), éditeur, ISBN, prix, type de fichier, indication de la présence ou non d’une protection (DRM), et nature de celle-ci,  argumentaire descriptif…

Et là, on est dans le cas où le livre numérique a déjà été trouvé… Mais comment a-t-il été trouvé ?
Comment en arrive-t-on à ce stade où la description d’un livre numérique se trouve affichée sur notre écran, accompagnée du bouton qui va nous permettre de l’acheter ? De bien des manières, selon que l’on est à la recherche d’un titre précis ou que l’on souhaite parcourir les rayons d’une librairie en ligne à la recherche d’une lecture, sans savoir encore laquelle,  ou bien que l’on cherche la réponse à une question ou un problème que l’on se pose, les possibilités sont nombreuses. Selon le cas, on utilisera un moteur de recherche générique, on naviguera parmi les rayons virtuels de la e-librairie que l’on préfère ou on se servira de son moteur de recherche interne, on aura suivi un lien présent sur un site, blog, réseau social. Quelles que soient les actions qui auront précédé l’affichage des informations concernant un livre particulier, ces actions, pour nous conduire vers ce livre, mettent en jeu les métadonnées. De leur qualité, de leur richesse, de la manière dont elles sont exprimées, dépend en grande partie la probabilité que le lien vers le livre en question apparaisse dans la liste des résultats générée par une requête sur un moteur, que le livre soit classé de manière pertinente dans la rubrique qui lui convient sur le site d’une librairie.

Un exemple tout simple donné par un éditeur : en passant un livre de la catégorie «  fiction  » à la catégorie «  policier  », et en lui affectant un ISBN (ce qui n’est pas toujours le cas aux USA où les ISBN sont payants et où nombre de revendeurs disposent de leur propre code d’identificaiton), les ventes de celui-ci ont augmenté aussitôt de 300%. Pour obtenir ce résultat, il a simplement fallu que quelqu’un se préoccupe de renseigner convenablement un champ de description, et pour que cela soit fait systématiquement, il faut que chacun comprenne l’importance des métadonnées, l’enjeu essentiel qu’elles représentent aujourd’hui, et leur impact direct sur le «  découverabilité  » d’un livre, et donc sur les ventes de celui-ci.

J’ai parlé de deux panels consacrés aux métadonnées : l’un concernait les «  core metadata  » – les métadonnées essentielles, indispensables à la commercialisation d’un livre, et le second les «  enhanced metada  », ou métadonnées enrichies, qui visent à augmenter encore la possibilité pour un livre de rencontrer son public, en donnant plus d’informations à son sujet : biographie de l’auteur, interviews (texte, audio ou vidéo), critiques et recensions parues dans la presse,  possibilité de feuilleter un extrait, indications géographiques lorsque cela est pertinent, et permet de cibler des clients géolocalisés, liens vers d’autres ouvrages ou vers des sites web, mots clé, tags… Ainsi les métadonnées deviennent un véritable outil de marketing, et non plus seulement des informations destinées à la «  chaîne du livre  » ou aux catalogues bibliographiques. Elles sont ce que les lecteurs potentiels verront des livres avant de se décider ou non à les acquérir, elles sont ce qui permettra à ses clients de savoir que ce livre existe. Et on sait comme il est difficile pour un livre d’arriver à simplement faire connaître son existence à ses lecteurs potentiels. Fran Toolan, CEO de Firebrand technologies, ajoute que la manière dont les jeunes générations cherchent et trouvent leurs lectures est différente de celle de leurs aînées, et qu’il est nécessaire, lorsque l’on travaille sur ses métadonnées, de s’entourer de jeunes pour intégrer les métadonnées qui répondront à leurs attentes. Cette réflexion démontre à quel point la création des métadonnées ne peut être un geste machinal, d’ordre administratif, mais bien un processus réfléchi, fruit d’une décision, reflet d’une stratégie.

Enfin, je terminerai par le début, la remise des prix de l’innovation du livre numérique :

Dans la catégorie fiction :  DRACULA : The Official Stoker Family Edition (PadWorx Digital Media)
Finalistes :  Letters From Father Christmas (HarperCollins) ; War of the Worlds (Smashing Ideas)

Dans la catégorie Non fiction : Logos Bible Software (Logos Bible Software, Inc.)
Finalistes :  10 Greatest Card Tricks of All Time (Vook & Workman Publishing) ; Ansel Adams (Hachette Book Group, Inc.)

Dans la catégorie Jeunesse :  A Story Before Bed (Jackson Fish Market)
Finalistes : Cozmo’s Day Off (Ayars Animation, Inc.) ; The Pedlar Lady of Gushing Cross (Moving Tales)

Dans la catégorie Référence :  Star Walk for iPad (Vito Technology Inc.)
Finalistes : Let’s Eat Out with Celiac / Coeliac and Food Allergies ! (R & R Publishing) ; The Solar System (Touch Press)

Dans la catégorie BD : Robot 13 (Robot Comics)
Finalistes : Operation Ajax (Tall Chair, Inc.) ; Tumor (Archaia Studios Press)

Concernant les «  enhanced books  », dont je ne sais toujours comment les désigner en français, livres enrichis, augmentés ou bien prolongés (?), plusieurs sessions leur ont été consacré, et il a été question également de la prochaine version d’EPUB, toujours en développement, EPUB 3, qui autorisera l’ajout d’éléments multmédia et d’éléments d’interactivité dans des livres numériques.

Je reviendrai plus tard sur cette question, ce billet est déjà d’une longueur épouvantable, non ?

Changer nos façons de travailler (3)

Clément Laberge signale sur son blog le billet de Hugh Mc Guire sur O’Reilly Radar : The line between book and Internet will disappear. La dernière partie de ce billet me rappelle une question que j’avais posée à Christian Fauré il y a déjà deux ans : «  Comment expliquer ce qu’est une API à un patron d’édition ?  » et à laquelle il avait répondu dans ce billet. Que dit Hugh Mc Guire ? Que ce qui se passe aujourd’hui dans le monde de l’édition est une étape transitoire. Une étape que j’avais désignée un jour comme le «  moment ebook  » : une transposition, la plus littérale possible, des livres sur des supports numériques. Et cette étape, déjà, nécessite des changements importants dans les maisons d’édition.

Ce qu’évoque Hugh Mc Guire dans son billet, c’est l’étape suivante. C’est en pensant à cette étape suivante que j’avais eu envie de poser ma question à Christian. À ce moment, le monde de l’édition entrera de plain pied dans l’écosystème d’Internet. Les livres numériques que nous fabriquons aujourd’hui sont, du point de vue de la logique web, des objets assez paradoxaux, comme suspendus entre l’objet livre dont il sont le simulacre, et le destin numérique qui les attend :

«  Une API (Application Programming Interface) est une interface de programmation. C’est ce que les sympathiques entreprises du web construisent, pour faire en sorte que d’autres entreprises innovantes et développeurs puissent construire des outils et des services s’appuyant sur leurs propres bases de données et services.

Par exemple :

Google Maps a une  (et même plusieurs…) API(s), de sorte que les services de géolocalisation (par exemple Yelp) peuvent utiliser Google Maps et les informations business qu’il contient pour mieux servir ses clients de niche.

Twitter possède une API, ainsi des services tiers peuvent construire des clients Twitter, rechercher sur Twitter, fournir des statistiques sur Twitter etc…

Amazon a une API, qui permet aux développeurs de trouver des produits et de pointer sur l’information qui leur est associée.

Wikipedia a une API, ainsi on peut faire quelque chose comme de fabriquer des livres à partir de l’ensemble des versions successives de l’article de Wikipedia concernant la guerre d’Irak.

Nous sommes encore très très loin du moment où les éditeurs se considèreront eux mêmes comme des fournisseurs d’API, des Interfaces de Programmation des livres qu’ils publient. Mais nous avons observé à de nombreuses reprises que la valeur augmente lorsque les données s’ouvrent (parfois de manière sélective) au monde. C’est vraiment pour cela qu’Internet est fait ; et c’est là où l’édition de livres va aller. Finalement.

Je ne sais pas exactement ce à quoi une API pour les livres  pourrait bien ressembler.

Je ne sais pas quelles choses géniales les gens vont commencer à faire lorsque les livres seront réellement sur Internet.

Mais je sais que cela va arriver, et que l’avenir de l’édition a quelque chose à voir avec cela. Le monde actuel des livres numériques n’est qu’une transistion vers un écosystème de l’édition de livres numériques connectés qui ne ressemblera en rien au monde des livres dans lequel nous vivons aujourd’hui.  »

Aujourd’hui, déjà, nous changeons nos manières de travailler, pour créer et diffuser des livres en version numérique. Mais ne croyons pas qu’une fois cette transition effectuée, une fois que ces changements auront été parfaitement intégrés, nous pourrons nous asseoir et souffler. Il est fort probable, au contraire, que des changements bien plus importants nous attendent. Et c’est maintenant qu’il faut y penser, c’est aujourd’hui qu’il faut s’y préparer, en demeurant curieux et ouverts, attentifs à ce qui se passe sur le web, actifs sur les réseaux, curieux des avancées et des innovations. Pas plus que Hugh Mc Guire je n’ai une idée bien précise de ce à quoi ressembleront ces «  API des livres  ». Mais je partage cette intuition que c’est ce qui nous attend.

On ne s’étonnera pas de trouver Hugh Mc Guire parmi les intervenants d’un événements organisé par Internet Archive à San Francisco les 21 et 22 octobre prochain, intitulé «  Books in Browsers«  .

Cliquer ? Non : toucher.

John Makinson, CEO de Penguin Books, présentait mardi à  Londres une série d’exemples d’utilisation de l’iPad :

Pour ce qui concerne l’édition jeunesse et le documentaire, cela donne une forte impression  de déjà vu : l’illustration très fouillée de la cathédrale façon Dorling Kindersley, la planche anatomique dans laquelle on peut zoomer, l’animal qui pousse son cri lorsque l’on clique sur touche son image. Cela donne l’impression d’être revenus au temps du CD-Rom, à l’interface tactile près, et probablement cela fait-il une différence importante pour l’utilisateur. Ce geste de toucher l’écran compte, de le toucher directement et non virtuellement grâce au curseur dirigé par la souris. Ça fait aussi une grosse différence, cette tablette qu’on tient, qu’on porte, qu’on emporte, qui nous suit alors qu’il fallait aller se poster devant l’écran de son PC pour manipuler les CD-Rom que l’on produisait dans les années 90.

Alors, livres augmentés, applications Mike Shatzkin met en garde les éditeurs : ne recommencez pas les erreurs faites à l’époque des CD-Rom, si amusants à concevoir et à réaliser, faisant appel aux compétences de multiples créateurs, si coûteux, mais dont les ventes couvraient bien rarement les frais…

Que dit M. Makinson ?

«  L’iPad représente la première véritable opportunité de créer un modèle de distribution payant qui sera attractif pour le consommateurs  »

«  La psychologie du paiement sur une tablette est différente de celle du paiement sur un PC  »

«  Et la plupart des contenus que nous allons créer à partir de maintenant seront des applications, qui seront vendus sur l’app Store et en HTML, plutôt que sous la forme d’ebooks. La définition même du livre est à réinventer.

«  Nous allons encapsuler de l’audio, de la vidéo, du streaming dans tout ce que nous ferons. Le format .epub, qui est à présent le standard pour les ebooks, est conçu pour  s’adapter au texte narratif traditionnel, mais pas le genre de contenu dont nous sommes en train de parler.  »

«  Nous ne savons pas encore si oui ou non une introduction vidéo sera valable pour les utilisateurs. Nous trouverons la réponse à nos questions uniquement en procédant par essais-erreurs.  »

Alors, pour le patron de Penguin,  le ePub, ce serait déjà «  So 2009″ ?

On le voit, beaucoup d’excitation autour du iPad, mais aussi des supputations et de l’anticipation,  c’est du moins ce qu’on peut en conclure en lisant  ce post de  Clément Laberge, qui nous mijote visiblement quelque chose…

3/03 : et lire aussi ce billet de Jeremy Ettinghausen sur le blog de Penguin, avec la même vidéo. Je me disais bien que Jeremy devait être dans la boucle…
Il précise bien que ce qui est montré dans cette vidéo, ce ne sont pas des maquettes ou des prototypes (rien de tout ceci n’a réellement été encore développé) mais uniquement une simulation qui illustre différentes pistes de réflexion.