Apprenons à éditer des textes numériques

Nos livres en version numérique ? Bien sûr, ils existent déjà. Depuis des années, la chaîne de production des livres s’est informatisée : le manuscrit, déjà, est fourni à l’éditeur sous la forme d’un fichier, le plus souvent un fichier Word. Le fichier est transmis à la PAO, qui va se charger de sa mise en page, à l’aide d’un logiciel dédié, généralement XPress ou Indesign. Une fois terminées les corrections, on adresse à l’imprimeur un fichier PDF, dit le «  PDF imprimeur  ». Nos livres sont donc bien prêts pour le numérique, pas de doute… Sauf que…

Sauf que le fichier destiné à imprimeur a été conçu pour un usage précis, l’impression d’un livre à un format donné. Le numérique, aime-t-on penser, arrache le texte à la page, le rend indépendant de son support. Sauf que… un fichier destiné à l’impression «  re-soude  » le texte à la page, en mélangeant des informations de contenu et des informations de mise en forme. (L’indépendance contenu/mise en forme est d’ailleurs discutable, car la mise en forme véhicule un sens, qui ne se distingue pas forcément si facilement du «  sens du contenu  » mais interfère largement avec… mais cette indépendance est techniquement réalisable.)


Décidez de produire une version numérique de vos ouvrages, destinée non pas à l’impression mais à la lecture sur liseuse, sur PDA ou sur iPhone. Ne croyez pas qu’il suffira de mettre la main sur le fichier imprimeur à jour (ce qui d’ailleurs n’est pas toujours une mince affaire : qui l’a archivé, est-il resté chez vous, est-il chez l’imprimeur, êtes-vous sûr qu’il s’agit bien de la dernière version ?) puis de le passer dans une quelconque moulinette pour le mettre dans un format lisible par tous les outils de lecture actuellement disponible. Outre qu’il vous faudra soit opter pour un format lisible sur certaines machines et pas sur d’autres, soit créer différentes versions de votre fichier, il faudra également adapter le fichier aux caractéristiques des différents terminaux de lecture auxquels vous le destinez.

Ce qu’un lecteur peut espérer ? Au minimum, une qualité de mise en page qui respecte les césures, puisse afficher différentes polices de caractères, permette de faire varier la taille de la police au gré de son confort de lecture. Il apprécierait également de retrouver sur son livre numérique des caractéristiques auxquelles il s’attend s’il est familier des lectures électroniques : un sommaire interactif, la possibilité de poser des signets, celle de mémoriser la dernière page consultée…

Constance Krebs encourage les éditeurs à intégrer de nouvelles compétences dans leurs équipes :

L’édition en ligne a besoin d’un plus. Elle a des informaticiens, des webmestres, des stagiaires, des belles machines. Mais il lui manque l’essentiel, ce qui met en valeur tout l’intérêt du livre à ce jour. L’édition en ligne a besoin d’éditeurs capables d’adapter les textes aux supports numériques (XML doit être bien structuré, d’accord, mais c’est quoi une DTD, un Docbook corrects?), comme on adapte les livres au support de l’écran pour en faire des films.

Mais la généralisation d’une démarche basée sur la structuration XML ne fait pas l’unanimité. Les quelques campagnes de «  XMLisation  » entamées à grands frais il y a quelques années ont laissé à quelques uns des souvenirs amers.
Un intéressant débat a eu lieu en janvier sur La Feuille à propos de ces questions de formats.

Une chose est certaine : même si l’on s’en tient au format PDF, bien connu des éditeurs, le «  destin numérique  » des livres implique une adaptation des métiers. Comme le souligne Alain Pierrot dans la discussion sur La Feuille, il ne faut pas confondre un format et l’usage qui en est fait le plus souvent. Il est bien difficile, il est vrai, de distinguer ce qui relève du choix fait par le maquettiste et le metteur en page de ce qui est conditionné par le format lui même ou par le logiciel de lecture utilisé.

François Bon, qui est passé à l’action avec publie.net a bien du faire un choix (qu’il énonce dans cette même discussion) :

«  alors, provisoirement, solution, pour les textes longs : lien qui permette accès à une boîte avec format PDF standard pour lecture ordi, format rtf pour naviguer, chercher, bricoler, étudier, format PDF CyBook + Mobipocket – c’est bâtard, mais pas si difficile que ça à réaliser.  »

Pas eu encore le temps de tester autre chose que la version «  PDF standard  », très satisfaisante, de quelques uns des textes publiés, mais je compte bien le faire et en rendre compte ici. (Se souvenir que les textes proposés sur publie.net ne sont pas des «  versions numériques  » de textes précédemment imprimés, mais des textes publiés directement et exclusivement en version numérique.)
Editer des textes numériques, ce n’est pas seulement fournir des fichiers pour les PC, les liseuses ou les téléphones portables. C’est aussi, et Jean-Michel Salaün le rappelle aujourd’hui, tout un pan de l’édition qui bascule vers une logique de plate-forme, avec un accès payant à des contenus consultables en ligne, selon différents modèles. Les propos du président de Reed-Elsevier révèlent au passage les évolutions dans les savoir-faire que ces mutations impliquent :

«  L’évolution vers un portefeuille plus cohérent nous donne l’occasion d’accélérer nos progrès dans la consolidation et la rationalisation de nos technologies, activités et supports du back-office. Ce faisant Reed-Elsevier devient une société mieux intégrée, économisant d’importants frais de structure. (..)  »

«  Rationalisation des technologies, activités, et supports du back-office  ». Nous sommes loin du vocabulaire traditionnel de l’édition. Bien des changements en perspective, donc, dans les métiers comme dans les infrastructures.

76 réflexions au sujet de « Apprenons à éditer des textes numériques »

  1. F

    Il faudrait quand même s’interroger aussi sur Mobipocket : en le rachetant, Amazon a mis en libre accès la version «  pro  » de Mobipocket Creator, et donc possibilité de garder en gros dans un texte sous-titrage, table des matières active, gras et ital, mais guère plus : notion de texte «  liquide  » changeant de police et de pagination à volonté de l’utilisateur je veux bien, mais il semble que tout le poids mis par Mobipocket par amazon, avec relais chez nous par fabricants de nos «  liseuses  » c’est uniquement pour imposer les drm, dégradabilité temporelle ou selon nombre de copies… j’aimerais bien savoir (Alain?) si, pour son Kindle, amazon utilise – ou pour les services en ligne de conversion qu’ils proposent – une version non publique et plus élaborée du Mobipocket Creator ? ils en seraient bien capables…

    la remarque qui ouvre ton billet est importante : c’est nos pratiques de lecture qui changent – accès à des documents depuis notre poste principal de réflexion intellectuelle et travail personnel, ce n’est plus la bibliothèque ouvrant sur le salon du Cluedo, c’est notre ordi – et on lit différemment que ce qu’on cherche dans un livre – idem, la volonté d’emporter avec soi pour un trajet en train ou métro, ou juste dans le sac, un document qu’on sait avoir à lire, ou vouloir lire par plaisir, et on s’accommodera provisoirement de l’embarquer son iTouch ou smartphone, ou sur l’Asus…

    pour ma part, l’impression, depuis cette discussion sur La Feuille, d’avoir bougé un peu : au début, pour moi, le PDF c’était du word A4 transféré – maintenant, j’essaye de construire typos, marges, navigation directement pour l’écran, y compris dès l’étape du manuscrit, je ne m’étais pas rendu compte comment «  faire semblant que ce soit un livre  » pesait mentalement aussi lourd dans nos pratiques numériques

    c’est dans ce bousculement qu’il me semble qu’on a une responsabilité : introduire dans ce lieu de nos pratiques des contenus qui nous importent… à noter dans l’article de Jean-Michel la référence à l’abonnement «  sous licence  » des bibliothèques aux revues scientifiques, médicales ou juridiques : pour l’instant, on n’a pas transféré ce modèle à nos contenus éditoriaux littéraires…

    on en reparle le 17 au Salon du livre ?

  2. Hadrien GARDEUR

    Sujet très intéressant Virginie et qui mérite encore de faire considérablement évoluer les choses.

    C’est finalement une vaste confusion entre le principe de fichier source, et de fichier final.

    Un fichier source doit avant tout respecter la sémantique du texte via une DTD précise (sur Feedbooks on calque tout de plus en plus sur du DTBook, qui est recommandé à l’usage sur le nouveau standard epub) ainsi que quelques éléments de mise en forme (alignement, italique, gras, souligné, tableau etc…).
    A l’inverse un fichier final doit représenter une version destinée à l’impression ou un appareil précis.

    Dans certain cas (un fichier epub bien construit), un fichier peut faire office de format source et final. Actuellement, même une plateforme comme DTP d’Amazon a de très graves lacunes en la matière, se contentant de représenter des informations sémantiques du texte (un chapitre par exemple) par des éléments de mise en page. Le résultat ? Des problèmes comme des tables des matières sans liens par exemple (il faut dire qu’il est complètement idiot de représenter une table des matières par une liste de liens comme c’est malheureusement le cas sur un fichier Mobipocket/Kindle), alors qu’une table des matières est un élément qu’on peut générer automatiquement à partir de la sémantique du texte.

    Mis à part ces bonnes pratiques à mettre en place, il reste la question des DTD (TEI ? DTBook ? DocBook ?). Il est en effet assez dur pour l’ensemble des éléments d’un livre de faire une division stricte entre sens et présentation. C’est une réflexion qu’il faudra continuer à pousser dans les prochaines années pour adopter les meilleures pratiques en la matière.

  3. Aldus

    Deux remarques aussi :
    - le format PDF représente 90% du print dans le monde (j’ai lu la statistique récemment) et c’est pas près de s’éteindre avec les solutions du print-on-demand qui deviennent de plus en plus efficaces et des technologies d’impression de plus en plus numériques elles-aussi !
    - le problème de ces formats «  dérivés  » sont liés à deux raisons : l’une qui concerne la pose de drm «  sécurisées  » mais dont tout le monde sait très bien qu’elles sauteront (je ne pense pas que les acteurs du livre seront plus efficaces sur ce sujet que les acteurs de la musique qui n’ont rien réussi en la matière en dix ans ), l’autre la mise en format pour des appareils de petites tailles qui ne ne sont pas forcément très adaptés à la lecture de livres complexes (livres de cuisine, livres pratiques, livres de loisirs, livres universitaires, livres techniques, livres avec photographies, y compris des livres de grande taille, vous imaginez vous lire Les Bienveillantes sur un Iphone ? bon courage, bref ça fait beaucoup tout ça). C’est justement ce que j’aime avec l’Iliad et je saute le pas encore plus vite dès qu’un livrel 10 pouces se présentera, et je suis pas le seul je crois. Pourquoi Nemoptic avance si peu vite (ou donne-t-il cette impression), c’est qu’il avance vers ce livrel en grand format qui fera un véritable pont entre l’univers du print et celui du livre numérique…
    Quand les livrels de grand format seront là à des prix intéressants, on se reposera alors la question de la mise en page et de la présentation…
    Enfin, je ne parle pas bien sûr de ces formats propriétaires qui sont tout simplement un forme de racket de la part de certains acteurs dominants.
    Quand vous créez un PDF, demain un format e-pub, Adobe ne vous demande pas le versement d’une taxe… Vivent les livres numériques libres…

  4. F

    «  vive le numérique libre  », Hervé, d’accord : mais tu ne fais pas abicia.com sans penser à la petite famille derrière… je ne dis pas ça pour la question qui me semble tout aussi essentielle : quelle rémunération pour un travail d’auteur diffusé par voie numérique, y compris dans ce qu’il implique de part matérielle et d’exigence éditoriale ou artisanale, mais pour le flou aussi de ce mot «  livre  » – les éditeurs, eux, se gardent bien de l’employer dans leurs contrats : le texte numérique n’a pas statut de livre, n’entre pas dans la législation du droit d’auteur – alors «  vive les livres numériques libres  » ok, mais tu sais bien que l’offre en ce domaine c’est la daube de la daube : faudrait peut-être apprendre à monter au créneau ensemble sur ces questions ? (et ça ne m’empêche pas, tu le sais, de refuser tout drm sur les fichiers que je diffuse perso)

  5. Virginie Clayssen Auteur de l’article

    @François : Ne confondons pas les termes «  libre  » et «  gratuit  », auxquels il faut ajouter le terme «  ouvert  ».
    Un fichier peut être payant, et cependant disponible dans un format non propriétaire, et ne pas comporter de DRM.
    Ensuite, différentes combinaisons sont possible entre les termes.
    Ce sont encore les anglophones qui nous plantent avec leur «  free  » qui signifie à la fois libre ET gratuit.
    Un format ouvert, c’est un format dont les spécifications sont publiques, le code accessible, et que chacun est libre d’adapter. Libre est synonyme d’ouvert, le logiciel libre, par ailleurs généralement gratuit, autorise l’accès à ses sources. Mais on peut parfaitement utiliser des logiciels libres et adopter un format ouvert pour mettre à disposition du public des fichiers qui eux seront payants. Assez complexe, je te l’accorde, ce qui me fait dire avec toi : on n’est pas sortis de l’auberge. :)

  6. Aldus

    @François
    merci Virginie, quand je disais libres, je ne pensais pas du tout gratuits, libres de droits, la daube comme tu dis. Je disais simplement libres, affranchis d’Amazon, Sony et d’autres… je voyais la semaine dernière de nouveaux portails se créer dans la mouvance Mobipocket, Babelpocket (livres de science-fiction) et le logiciel dédié à télécharger, demain Actupocket, Libripocket, en sachant que derrière c’est Amazon qui passe à la caisse… Pour la rémunération de l’auteur 40% minimum, j’envisage pas le modèle autrement. Et toi ? La TVA à 19,6% fausse le débat en ce moment mais essayons de nous projeter au-delà…

  7. F

    ok pour la rectif, les amis

    ça confirme bien l’intérêt de revenir sur ce que dit Hadrien concernant la pauvreté et la mise sous séquestre de prc (l’affichage PDF sur CyBook c’est pas le pied…)

  8. Bruno Rives

    Question de formats pour papier électronique :

    Le PDF pose le problème de la difficile différenciation du texte et de l’image pour la compression, la qualité s’en ressent. Sa gestion sur Sony Reader est bonne, mais nous venons de tester des documents volumineux, et la vitesse de consultation se dégrade. Le PRC est très limité pour des éditions de qualité et les flux rss multiples. Ni le PDF, ni le PRC n’intègrent les possibilités de création avancées qu’autorise le papier électronique.

    Reste donc : Digital Edition/Flash, mais attendons de voir les ressources qu’il demande, LRF (la plupart des dispositifs japonais y compris Sony), qui est généré à partir d’outils spéciaux un peu capricieux pour certains, et GPF de Ganaxa, qui est produit à partir de flux XML ou de logiciels du marché comme InDesign. Ce sont les seuls à ma connaissance qui permettent d’intégrer des créations avancées pour l’encre électronique.

  9. Aldus

    merci pour les infos Bruno.
    pour l’iliad, la lecture des pdf ne se dégrade pas, j’ai pas observé des vitesse de consultation moindre, reste le problème de la lecture bien sûr, mais sur l’ensemble des documents que j’ai pu consulter, c’est très acceptable.
    cela recoupe également les infos de notre libraire suisse, possesseur de l’Iliad !http://www.letemps.ch/template/tempsFort.asp?page=3&article=226763
    bruno, avez-vous eu l’occasion de tester le format epub sur des livres un peu complexes ?

  10. Hadrien GARDEUR

    Concernant l’epub : ça fonctionne bien niveau ressources sur des appareils mobiles à condition d’être en multi-flux et non de mettre l’intégralité des ressources d’un livre dans un seul flux (ce qui est très long à paginer et demande beaucoup trop de CPU/RAM).

    J’ai récemment passé l’intégralité de la génération epub sur Feedbooks en multi-flux pour répondre à ce besoin, et on devrait bientôt voir ce que ça donne sur un appareil dédié.

    Par contre il reste un manque vis à vis du support de certains éléments CSS propres à l’epub dans la beta de Digital Editions 1.5, ce qui ne me permet pas encore d’accèder au pied de page pour y mettre les notes de bas de page (on peut par contre lui demander de ne jamais passer en multi-colonnes pour certaines pages, ce qui ne marchait pas sur Digital Editions 1.0).

    Enfin bref, du CSS, de véritables métadonnées (DublinCore), une représentation pour la table des matières (NCX) et une DTD (DTBook) c’est un début, mais il reste du travail à faire.
    J’aimerais en particulier savoir comment les standards du livre éléctronique vont intégrer des normes comme les microformats ou le RDFa par exemple. A titre d’exemple, dans les livres Feedbooks on a toujours des liens vers d’autres ouvrages qui sont aussi disponibles chez nous. A l’heure actuelle, il n’existe aucun élément structurant me permettant de référencer cet élément comme étant un livre, qui donc nécessite d’être traité par le logiciel de lecture, et non de me rediriger via mon navigateur.

  11. Aldus

    on m’ôtera pas de la tête qu’Adobe est au coeur des stratégies sur la diffusion du livre numérique ; merci Hadrien, on parle d’Hachette mais Editis doit aussi plancher sur ce type de structurations (Virginie?), je crois qui si tout le monde échangeait, on gagnerait un temps fou dans l’éllaboration d’un format universel ouvert, je me trompe ?

  12. Virginie Clayssen Auteur de l’article

    @Hervé : De ce que j’en sais ePub est un format pour le livre électronique développé par l’IDPF (Internation Digital Publishing Forum). L’IDPF est exactement une structure dont l’objectif est de mettre d’accord le maximum d’acteurs sur un seul format.

    IDPF regroupe de nombreux éditeurs, des fabricants de matériel, ainsi que Adobe, Mobipocket, Amazon, et de très nombreux acteurs du eBook.

    Mais rien n’empêche des acteurs de participer à ce type d’instance et de déveloper par ailleurs leur propre stratégie, les enjeux sont importants, et chacun peut espérer prendre les autres de vitesse et installer un standard «  de fait  ».

  13. Hadrien GARDEUR

    Oui je crois qu’il y a confusion entre le fait que Adobe est très impliqué dans l’adoption de ce format, et sa nature ouverte et standard.

    Il faut savoir qu’à terme, Mobipocket reposera surement sur de l’epub aussi et que la seule différence entre l’offre d’Adobe et de Mobipocket reposera sur une surcouche DRM.

    Mobipocket repose actuellement sur l’OEB (un peu étendu de manière peu conventionnelle) qui est l’ancêtre de ce nouveau standard.

  14. Aldus

    Le développement de l’e-pub dans un cadre IDPF semble conforter l’idée d’un format non-propriétaire et ouvert. Que les éditeurs l’aient vite à disposition pour offrir leurs livres, vite, très vite… Je vous laisse imaginer si Adobe touchait des royalties sur chaque PDF crée dans le monde. C’est exactement la stratégie d’Amazon pour l’instant…

  15. Aldus

    merci pour la précision Hadrien, en effet c’est loin d’être clair pour tout le monde

  16. Alain Pierrot

    Il faut bien réfléchir à la question du moteur de composition, au niveau de la typographie et de la mise en page, à ce qu’on lui demande et, qui le fournit : les fonctions incluses dans le système d’exploitation, appelées par les applicatifs ou réécrites sont cruciales pour les performances.
    L’affichage de pdf sur iPod Touch est instructif sur l’intrication entre le moteur pdf, la recomposition suivant l’orientation, les fonctions de recalcul après un mouvement de zoom et l’antialiasing : on voit nettement les passes de calcul avant l’affichage stabilisé.
    On peut avoir à faire avec un éditeur d’applicatif comme Adobe, un éditeur d’OS (qui intègre des fonctions achetées ailleurs), un fournisseur de chipset de carte graphique, un éditeur de fontes typographiques, et j’en oublie probablement…

  17. Olivier

    Il me semblait que la fondation créée pour soutenir l’epub avait cessée son activité  : http://www.openreader.org/. Quel est le statut de l’idpf par rapport à openreader.org ? Est-ce encore une fondation  ?

    Car il est nécessaire qu’un format soit adopté pour fonctionner (Cf la qualité du .ogg face au .mp3 qui peine pourtant à se faire une place).
    Espérons que les éditeurs de textes seront plus «  sages  » que leurs confrères de la musique.

    En termes de composition, le moteur de firefox 3 est capable de mieux gérer de la typographie «  avancée  » et peut zoomer aussi bien le texte que les photos, de façon à conserver la mise en page, et c’est du html.

    Une question : qu’utilisez-vous, sur ordinateur, pour lire le format epub  ?
    J’en suis à FBreader (sous linux, pas beaucoup de choix, en attendant que tout le monde passe à ConTeXt…).

  18. Virginie Clayssen Auteur de l’article

    Merci à tous pour vos commentaires vraiment intéressants. Cette discussion n’est pas près de se terminer, nul ne peut prédire encore ce qui va prévaloir dans les années qui viennent. En lisant tous vos commentaires, sont-ce mes vieux réflexes «  pédago  » qui fonctionnent ? Je me dis qu’il manque une page ou deux quelque part qui expliquent clairement l’ensemble des notions abordées ici, qui donne les clefs nécessaires à leur compréhension et les éléments d’information permettant d’en saisir les enjeux pour le monde de l’édition. DTD, standards, formats de fichiers, DRM, moteurs de composition… Il n’est pas si commode pour des non spécialistes de s’y retrouver. Ce n’est pas non plus si compliqué, pour peu que cela soit expliqué clairement. Les pages qui prétendent le faire comportent très souvent des inexactitudes ou des à peu près, ou bien sont lacunaires. Wikipédiens, wikipédiennes, à vos claviers !

  19. F

    merci, Virginie – perso, j’ai découvert l’ePub seulement aujourd’hui via cette discussion – suis plutôt en accord avec Hervé : le PDF a sacrément de ressources, pourvu qu’on veuille bien les utiliser et inventer un peu avec

    je crois que j’ai bien pigé ce que dit Alain, mais c’est un univers que je découvre complètement

    et par contre j’ai très peur «  techniciser  » à fond mon approche via inDesign, xtml etc alors que consultations sur ordi principal, pour les destinataires des textes que je propose, reste la base essentielle

    pensez-y, aidez nous à piger…

  20. Virginie Clayssen Auteur de l’article

    @François : Ta dernière remarque peut vraiment faire rebondir le débat, et revient à mon post initial, que la discussion sur ePub avait finalement éludé plus ou moins. ePub c’est un format basé sur Xml, qui s’appuie sur une DTD, et nécessite une préparation spécifique des textes, une structuration, qui n’est pas une mise en page mais l’inscription de la structure du texte dans un document, avec la possibilité ensuite d’associer des indications de mise en page et de typographie avec cette structure.

    C’est très différent d’une mise en page dans InDesign ou XPress, suivie d’un export vers le PDF. (Mais, pour compliquer un peu les choses, un fichier InDesign ou même -mais moins «  nativement  »- un fichier XPress, bien structurés, peuvent générer un fichier XML convenable…)

    Avec XML on parle souvent de flux, parce que réellement le texte est considéré comme un flux, qu’un logiciel peut mettre en page «  à la volée  », en interprétant les balises qu’il contient et les feuilles de style qui sont associées au flux. Le flux s’oppose à la page, qui est un concept lié au monde de l’imprimé.

    C’est cette approche basée sur XML que défend Constance, avec son expérience chez 0h00. C’est aussi quelque chose qui en effraie beaucoup : on ne peut pas nier la complexité de tout cela, la rigueur que cela impose, familière aux informaticiens mais assez répulsive pour ceux qui sont de formation plutôt littéraire (Bon enfin toi tu rentres pas dans les cases, y a pas beaucoup de littéraires qui se sont pris du 450 volts en pleine poire dans le cadre d’une mission en Inde).

    Mais la composition et la mise en page traditionnelles aussi sont des métiers complexes, nécessitant une formation pointue, et c’est parce qu’il existe aujourd’hui des outils qui ont «  numérisé  » en partie cette complexité que plus de gens qu’autrefois peuvent s’y essayer (avec des résultats divers). XML est encore un bébé, les outils qui permettent d’en masquer la complexité commencent à peine à apparaître.

    Demande à Alain de confirmer : peu de gens en savent aussi long que lui sur ces questions.

  21. Olivier

    Peut-être tout bêtement wikipédia pour regrouper tout ça  ? J’avais déjà proposé l’idée dans un billet sur le sujet il y a quelque temps, sous forme d’un grand tableau, avec les formats, les lecteurs…

    L’XML est un peu pointu, oui mais… le format odt d’openoffice est du xml (et l’équivalent mal documenté de microsoft aussi).
    Je veux dire par là qu’on arrivera surement à un moyen simple de générer un xml «  de base  » qui sera ensuite réinterprété par différents «  moteurs de rendu  » fonction du support voulu.
    Ce moteur étant dans l’appareil lui-même ou sur le site où acheter le livre, via un script en php.

    J’ajoute que le fomat docbook est du xml et que l’éditeur O’Reilly l’utilise pour l’ensemble de ses publication (papier et en ligne). Le savoir faire existe donc déjà par endroits.

    Ça sort beaucoup de mes compétences (et un peu du sujet) mais ConTeXt, qui permet d’obtenir une typographie de haute voltige, en tant que langage à balise lui aussi, peut s’interfacer avec du xml…

  22. cgat

    je suis littéraire et j’essaie de me soigner … mais là j’avoue être un peu larguée : quelqu’un peut-il me dire où la néophyte que je suis pourrait trouver des livres au format ePub pour se faire une idée du résultat, avant d’essayer de comprendre comment ils sont fabriqués ?

  23. F

    remerci bis, Virginie – et ça me redonne les sensations du PCF dans l’avant Mitterrand, quand on parlait «  d’intellectuel collectif  » ! – là je sais bien par exemple qu’avec Constance on est sur les 2 côtés de la même rivière, mais on n’en aura pas pour longtemps à remettre la passerelle

    en tout cas, les «  outils qui masquent la complexité  » je vois via Linux le temps que ça peut mettre à se fabriquer et venir, et j’attendrai vaillamment les fonctions «  export xml  » que me vendra bien cher le cher Adobîîîî

    pour cgat : je sais pas si ça passerait sur CyBook ? mais chez Hadrien / FeedBook il doit y avoir… mieux vaut s’en aller relire un bout d’Espèces d’Espaces tiens…

  24. cgat

    merci F de venir au secours des littéraires larguées !
    je viens d’y aller voir, mais en effet mon cybook ne connait pas, ni mon pc d’ailleurs … sur quel écran peut-on le lire ce format ePub si vanté ?
    (à moins qu’on ne puisse pas le lire, auquel cas le vieux rêve du livre totalement illisible serait atteint… pardon, la littéraire resurgit!)

    du point de vue de la littéraire de service, voilà quelque chose d’important me semble-t-il : seul un format souple et lisible sur tous les supports numériques (liseuses (pour faire plaisir à notre hôtesse!), pc, mac, umpc, pda, smartphones et autres iphone) aura des chances de s’imposer durablement (Olivier parlait ci-dessus du succès du mp3 : il me semble qu’il tient justement à cela)

  25. cgat

    c’est moi le troll ? pas très gentil, ça ? … allez, ne résistez pas, postez une bordée de liens, ça soulage ?

  26. Alain Pierrot

    @cgat
    Un bon lien pour explorer :
    International Digital Publishing Forum (idpf) qui donne une définition de «  .epub  » sur laquelle on peut essayer de clarifier quelques notions :

    «  .epub  » is the file extension of an XML format for reflowable digital books and publications. «  .epub  » is composed of three open standards, the Open Publication Structure (OPS), Open Packaging Format (OPF) and Open Container Format (OCF), produced by the IDPF. «  .epub  » allows publishers to produce and send a single digital publication file through distribution and offers consumers interoperability between software/hardware for unencrypted reflowable digital books and other publications. The Open eBook Publication Structure or «  OEB  », originally produced in 1999, is the precursor to OPS.

    «  .epub  » est une «  extension de fichier  », c’est à dire une convention, qui signifie que quand un programme tiers rencontre un fichier dont le nom se termine par les caractères «  .epub  », il doit s’attendre à ce que le contenu soit écrit en XML, selon trois autres conventions, OPS, OPF et OCF.
    À ce stade, dans la mesure où le programme tiers a accès aux grammaires publiques («  Open  ») XML, epub, OPS, OPF et OCF, il est capable de vérifier que le contenu du fichier est conforme à ce qu’il déclare être et d’entreprendre d’en faire quelque chose…
    Par exemple le programme tiers peut envisager de «  distribuer  » ce fichier en le mettant dans un catalogue avec la description de son contenu et les indications de conditions légales et commerciales préconisées par le créateur du fichier .epub. Les indications nécessaires à la création du catalogue sont exprimées dans la partie encodée selon le «  vocabulaire  » et la «  grammaire  » OPF du fichier, donc vérifiables et lisibles.
    Si le logiciel tiers veut afficher une partie de la «  publication  » («  document  » ?) ou du «  digital book  » (livrel), il pourra l’extraire du fichier grâce aux indications exprimées en OCF, le contenu lui-même étant exprimé selon OPS. La responsabilité de la «  recomposition  » et de la maquette lui incombe : «  reflowable  ». Choix de police, de corps, de justification, de césure, d’affichage peuvent être imposés par la partie de document (image «  bitmap  » déjà composée ou, dans une certaine mesure et certains choix préalables, pdf), préconisés (XHTML avec feuille de style CSS, schéma/DTD XML avec feuille de style) ou laissés totalement libres (texte pur, XHTML et XML sans feuille de style).
    Difficile donc de «  voir de l’epub  » : ce qu’on voit c’est un rendu très en aval de l’encodage .epub. L’affichage est une instance d’un fichier .epub sur un matériel donné, avec l’intervention de multiples modules de traitement.

  27. Bruno Rives

    @cgat
    Le seul fournisseur très proche des développeurs d’Adobe, pour l’instant, est Sony. Une nouvelle version de logiciel lecteur de PDF/ePub pour le PRS505 devrait sortir très bientôt, permettant au texte (pas encore aux images) d’être recomposé lors du zoom (c’est indispensable).
    @Hadrien
    Adobe va toucher des royalties sur chaque PDF, la transaction de gestion du DRM passe par leur serveur…
    @tous
    Attention, les lecteurs de PDF ne sont pas du tout les mêmes selon les readers. Aldus soulève très justement que celui de l’Iliad est bon, le plus avancé à ma connaissance est celui de Sony, mais les ressources nécessaires ne cessent d’augmenter. Le PRS505 a un processeur 2,5 fois plus rapide que les autres.
    Et PDF ne gère pas des fonctions autorisées sur papier électronique, comme la notion de collection, de chemin de lecture, et bien d’autres encore.

  28. Alain Pierrot

    @Bruno Rives

    PDF ne gère pas des fonctions autorisées sur papier électronique, comme la notion de collection, de chemin de lecture
    Je ne pense pas qu’il faille parler ici de «  papier électronique«  , mais de liseuse.
    En soi le papier électronique est un dispositif d’affichage comme un autre. C’est le logiciel qui décide de ce qui doit être affiché et des transitions entre les différents états de l’afficheur.

  29. Hadrien GARDEUR

    @Bruno Rives :
    La recomposition lors du zoom sur le texte sans images c’est sur le PDF (et c’est une excellente nouvelle d’ailleurs), en ePub pas de problème de ce côté la.
    Le lecteur PDF sur le Sony PRS-500/505 est developpé par la même équipe que celle de Digital Editions. Si c’est bien le plus avancé en terme de fonctionnalités, il a quelques soucis par contre. Par exemple sur un document PDF avec un Sony Reader, le fond est un peu plus gris que sur un document LRF (bug très étrange) ou encore il y a quelques soucis de lisibilité sur les polices de caractères que les autres lecteurs n’ont pas.
    Sur les autres lecteurs c’est en général basé sur Poppler qui est une librairie libre issue du monde *nix : http://poppler.freedesktop.org/
    Le rendu est en général bon mais les fonctionnalités plus limitées (par exemple retrouver la table des matières directement dans l’appareil n’est possible que sur le Sony).

    @Alain Pierrot : Très bonne description à laquelle j’ajouterais que quand on force une composition précise du texte, il y a un système qui s’assure de la compatibilité quand même en affichant une autre version au cas où le système de lecture ne peut pas supporter ce qui est préconisé. Ainsi un même document pourrait préserver sa mise en page à l’impression, et passer en XHTML/CSS sur un écran par exemple.
    Les modules de traitement sont à mon goût encore trop limités en terme de typographie, et la césure par exemple est quelque chose qui pourrait facilement être automatisé avec l’algorithme utilisé dans TeX par exemple (on dispose dans les métadonnées DublinCore de la langue pour cela).
    Après j’aurais envie de dire que quelque soit le format basé sur du SGML/XML, on est effectivement systématiquement dans une interprétation de celui-ci.

    Sinon pour tous ceux curieux de voir la tête d’un fichier epub, vous pouvez en dézipper un provenant de Feedbooks : j’ai utilisé la dernière version d’epubcheck pour m’assurer du fait que ce qu’on génère soit bien standard.

  30. Olivier

    @cgat, non, non, ce n’est pas une insulte  ! Vraiment désolé. Je répondais à François concernant son «  je vois via Linux le temps que ça peut mettre à se fabriquer et venir  ». Un troll, sur le net, est un sujet soumis à controverse et à propos duquel les discussions sont plus ou moins vaines. Or linux avance très vite…

    Pour lire le epub sur beaucoup de platformes : FBreader mais il manque encore d’ergonomie et de fonctions. Le développement avance assez vite.
    Il y a aussi, Dotreader, Adobe digital édition, mobipocket ebook reader…

    Pour les images dans le texte, avec le gain de puissance, j’attends ça.

  31. Bruno Rives

    Mes commentaires ne concernent que le papier électronique.

    @Alain Pierrot
    Vous avez raison, mais j’emploie ce terme de papier électronique, car il couvre également les applications autres que celles des dispositifs de lecture. Or, elles sont concernées par la production de contenu. Une quatrième de couverture va être consultable aussi bien sur l’affiche/borne du libraire que sur un e-reader (désolé, je ne me fais pas à liseuse, qui est déjà employé pour d’autres objets. Liseur?).

    @tous
    Quant au PDF, c’est un format très limité par rapport aux possibilités de l’encre électronique et de ses dispositifs. Il est nécessaire, mais pas suffisant. Il n’est fait que pour l’impression et l’affichage, peu pour l’interactif ou les systèmes cognitifs. Il ne répond pas aux spécifications de la plupart des projets que j’accompagne.

  32. cgat

    @Alain Pierrot et Bruno Rives
    Merci pour l’effort pédagogique !

    J’ajoute que – depuis la rive des utilisateurs où je me trouve – je vous rejoins tout à fait sur un point : je n’ai jamais aimé le PDF, mais je le trouve plus limité encore depuis que je l’ai testé sur une tablette électronique (cybook) : il est urgent de trouver d’autres solutions avant qu’il ne s’impose définitivement

  33. Bruno Rives

    @cgat
    Testez le pdf sur d’autres tablettes (Sony, Jinke, Iliad,…) et d’autres formats comme LRF (Sony, Canon, …) et GPF (Ganaxa) qui permettent beaucoup plus. Je crois que c’est avec ces derniers que la rupture d’écriture va s’opérer.

  34. F

    C’est quand même prendre le client pour un gogo, à ce prix là, sur 2 machines aussi strictement identiques que le Cybook et le Sony, au bouton près, qu’on bride l’affichage PDF pour privilégier les formats maison ?

    Quant à Ganaxa, Bruno, vraiment convaincu par la qualité du rapport texte/illustration montré l’autre jour avec les Dürer, mais encore faudrait-il que de notre côté du texte on puisse proposer nous-mêmes ce format à partir de nos contenus (un Ganaxa Creator en libre accès, et qui soit dispo sur Mac, alors que ma haine contre les prc c’est que je suis obligé de lancer windows sur mon MacBook pour les créer : ordi à jambe de bois…) ?

  35. Virginie Clayssen Auteur de l’article

    L’interopérabilité, ce serait un format qui fonctionne quelle que soit la liseuse utilisée. Restera le pb des DRM, comme le souligne très justement Hadrien. Car à quoi servira un fichier interopérable si la «  couche DRM  » le rive à un système et un seul ?

    Il me semble peu probable que ce soit la qualité des terminaux de lecture qui détermine une «  rupture d’écriture  ». Si l’on rêve au multimédia, sa grammaire s’est inventée pendant les «  années cédérom  » et se poursuit sur le web. Culture de l’interactivité, de l’hypertexte, des mélanges texte / image fixe / image animée / audio. On n’a pas attendu le papier électronique pour explorer tout cela. Essayons déjà de trouver moyen de fournir aux lecteurs des livres en version électronique ( en grand nombre) avec une qualité de restitution qui leur procure une expérience de lecture de qualité, ce sera déjà pas mal.

  36. guillaume

    @Virginie : la nouvelle politique d’Adobe pour la protection DRM du pdf et l’epub, c’est de permettre le transfert du fichier sur 5 supports différents, de manière assez simple avec Digital Editions (version 1.5, encore en beta mais enfin traduite en français). C’est suffisant pour l’immense majorité des lecteurs, pour les autres il leur suffit de demander à leur librairie une réactivation du lien de téléchargement, comme ils le font habituellement.
    ça permet d’éviter le piratage du fichier, et ce n’est pas contraignant pour les lecteurs (sauf ceux qui font un blocage idéologique sur les DRM, mais bon…)

  37. Hadrien GARDEUR

    @Bruno
    Je ne crois pas vraiment dans le LRF et toute la clique de formats propriétaires comme étant capables d’amener une quelconque rupture… d’ailleurs Sony semble l’avoir compris, d’où ses liens très forts avec Adobe pour qu’ils aient au plus vite un meilleur support des formats ouverts.
    Je vais dans le sens de Virginie aussi quand au fait qu’il faut d’abord proposer une expérience optimale pour le livre, et créer un véritable marché avant de se lancer de nouveau dans l’aventure multimédia bis-repetita.
    D’ailleurs pas besoin de réinventer la roue pour faire du rich media, les nouveaux standards du livre éléctronique supportent tout cela, et on pourra leur ajouter ce type de contenu à terme.

    @F

    Il n’y a pas sabordage du PDF de façon volontaire de la part des constructeurs, mais plutôt une difficulté à maitriser ce format clairement conçu pour l’impression dans un environnement mobile. On sait que Sony/Adobe fait particulièrement des efforts pour améliorer ce support avec bientôt du PDF qui sera transformé en flux XML pour une lecture plus souple sur le PRS-505, la communauté d’utilisateurs de l’iLiad améliore peu à peu iPDF (lecteur PDF de l’iLiad) et Bookeen semble aussi vouloir améliorer leur support PDF.

    @Virginie

    Je dirais que même sans DRM interopérable, c’est déjà un progrès si on a une représentation plus standardisée du livre électronique. Certes le consommateur sera toujours face à des problèmes de DRM en tout genre, mais on peut raisonnablement espérer voir l’offre devenir plus conséquente, et la qualité des fichiers augmenter si tout se normalise autour d’un vrai standard.
    A ma connaissance, il y a des discussions autour d’un DRM interopérable aussi au sein d’IDPF mais je ne sais pas où en sont les discussions à ce sujet (plus d’infos courant Mars/Avril à mon avis).

  38. Alain Pierrot

    @Hadrien

    Pas inutile, à mon avis, de garder un œil sur ACAP, qui se présente actuellement au monde de l’édition avec au moins un sain principe : distinguer l’expression numérique des droits (numériques, le cas échéant, le seul sens valide de «  DRM  » selon moi) des mesures techniques de protection (MTP ou TMP suivant notre degré de franglais).
    ACAP= «  Automated Content Access Protocol  », contrôle automatique de protocole, sigle (un peu) malheureux quand il s’agit en fait de simplement spécifier (sans les imposer) les conditions consenties par un ayant-droit à des utilisateurs de propriété intellectuelle.
    Pour ma part, j’aimerais que les techniques ACAP servent, par exemple, de support aux Creative Commons…
    PS : j’aurais bien mis le lien vers les Creative Commons et quelques autres, mais tant que Virginie n’a pas pu faire quelques «  upgrades  », au deuxième lien, les commentaires subissent un ostracisme passablement aléatoire. Ou bien on se cotise pour lui offrir (au choix, cadeau d’anniversaire — très bientôt —, lapin/œuf de Pâques, whatever) les moyens de son autonomie réseautée, ou bien on renonce au commentaire multilien…

  39. Virginie Clayssen Auteur de l’article

    @Alain : tiens, le voilà ton lien vers Creative Commons. J’aimerais autant qu’on ne me parle pas trop d’anniversaire. :) Parlons plutôt de DRM, le commentaire de Guillaume, (de Numilog), ci-dessus, était resté en attente de modération depuis quelques heures, tout comme les précisions d’Olivier concnernant son allusion à un troll.

    @Guillaume : On peut légitimement se poser des questions à propos des DRM, en observant ce qui s’est passé pour la musique. Nombreux sont ceux qui s’interrogent à ce sujet, sans pour cela faire de «  blocage idéologique  ».

  40. Bruno Rives

    @ F
    Je vais voir cela avec l’équipe de Ganaxa. Il faudrait qu’ils diffusent leur process. L’essentiel de la production se fait dans des logiciels standards. Je crois qu’ils ont juste besoin de formaliser leur offre pour l’ouvrir à d’autres qu’à leurs seuls clients, mais ils peuvent sans doute préparer des contenus à la demande.

    @Hadrien
    La plupart des projets que j’observe demandent plus en terme de mise en forme et de traitement des contenus que ce que l’on trouve sur les readers génériques. Le PDF et l’XML peuvent aider, mais les readers actuels n’en tirent pas partie (et la prochaine version de Sony va être limitée dans l’intégration d’images dans les publications). D’où l’intérêt d’autres plates-formes.

    @Virginie, Hadrien
    Je continue à penser qu’il faut profiter des bienfaits de l’encre électronique, mais loin de moi l’idée de multimédia ! Je vous rejoins sur la qualité indispensable. La plupart des productions sont assez médiocres, il faut le dire. Souvent moins bonnes que sur papier classique, c’est un comble.

  41. guillaume

    @virginie : tout à fait d’accord, les constructeurs doivent tirer les leçons de ce qu’il s’est passé dans la musique : rien ne sert de pouvoir transférer un fichier sur 5 supports différents si les supports en question ne sont pas capables de lire le bon format. ça a l’air d’aller dans le bon sens chez sony, apparemment bientôt compatible avec l’epub (protégé ou non), mais pourra t’on demain lire un fichier acheté chez mon libraire du coin sur le kindle d’amazon ou l’ibook d’apple ? c’est un enjeu vital.

  42. Hadrien GARDEUR

    @guillaume :

    Tous les appareils resteront ouverts à des formats sans DRM. Et si les libraires du coup se mettaient à vendre des livres sans DRM ?

    Le problème étant que bien évidemment, tout cela ne dépend pas que de leur bon vouloir…

    Dans le monde de la musique, eMusic a pris cette piste là qui leur a permis de se hisser juste derrière l’iTunes store. Maintenant tout le monde abandonne progressivement le DRM sur la musique.

  43. guillaume

    Le jour où les libraires vendront des livres sans DRM, les livres seront gratuits sur emule et cie, les éditeurs pourront changer de métier et laisser google, apple ou orange engranger les bénéfices de leur travail. je ne suis pas sûr que ça soit bon pour l’ensemble du secteur, mais comme pour la musique certains y trouveront leur compte : les auteurs auto-édités, les fournisseurs d’accès internet, les fabricants d’électronique, et sûrement quelques nouveaux entrants, des eMusic ou des Deezer pour le livre ?

  44. Hadrien GARDEUR

    A ma connaissance, les livres se trouvent déjà sur emule et d’ailleurs aucun DRM ne tient la route sur les formats livres (le LIT est utilisé par beaucoup d’utilisateurs car il est facile d’enlever la surcouche DRM et de le convertir dans un autre format, et pareil sur du Mobipocket dont les utilisateurs un tant soit peu technophiles savent comment s’y prendre pour enlever les DRMs aussi).

    Donc DRM ou non, les livres circuleront sur des réseaux p2p. Par contre, il est certainement plus simple pour la majorité des utilisateurs d’aller voir un vrai vendeur, dont c’est le métier de vendre des livres. Sauf si bien sûr, il est plus compliqué à cause des solutions DRM d’acheter un livre que d’en télécharger un…

  45. Virginie Clayssen Auteur de l’article

    @Guillaume
    Que signifie «  apprendre  » en regardant ce qui s’est passé du côté de la musique ? C’est se souvenir qu’aucun producteur de musique n’a jamais souhaité que des fichiers musicaux soient échangés en peer-to peer. Et pourtant cela s’est produit. Que tous les producteurs de musique ont souhaité mettre en ligne des fichiers protégés par DRM, au moment de construire une offre légale de téléchargement. Et pourtant aujourd’hui les DRM sont abandonnés progressivement. Qu’aucun producteur de musique n’a souhaité vendre ses titres à 0,99 €, et c’est pourtant bien le prix qui a été appliqué. Donc, il ne suffit pas de dire «  ça ne va pas se passer comme dans la musique  ». Tous ont dit dans ce secteur, comme on le dit aujourd’hui dans l’édition, avec la même unanimité et la même force : «  nous ne voulons pas de peer-to-peer, nous voulons des DRM, nous voulons maîtriser nos prix  ». Et rien ne s’est passé comme ils le souhaitaient.

    Je n’ai pas de solution. Mais ce qui est probable, c’est qu’en souhaitant que le scénario du livre numérique soit différent de celui de la musique en ligne, on le répète tout simplement, sans tirer les leçons de ce qui s’est passé. et les leçons à en tirer ne sont pas forcément aussi simples que ce que ton commentaire avance.

  46. guillaume

    Hadrien ce que ce qu’on trouve sur emule ce sont des bouquins scannés pas des livres numériques craqués. Pour le LIT ok et nous n’en vendons quasiment plus, pour le prc je souhaite bon courage à l’utlisateur un tant soit peu technophile qui souhaiterait le pirater, et pour le pdf crypté aucune solution de décryptage ne circule.
    L’idéal c’est un format interopérable, au moins protégé contre la copie de masse et, en effet, suffisamment simple à utiliser pour ne pas décourager les lecteurs. Ou pas de DRM, si l’éditeur et l’auteur sont d’accord (mais en général, bizarrement, ils ne le sont pas)

  47. guillaume

    Virginie, tu me dis que tu n’as pas de solutions pour éviter ce qu’il se passe dans la musique mais je suis sûr que comme tous ceux qui lisent ton blog tu as des centaines d’idées de nouveaux services, de nouvelles offres, on est quand même dans un secteur passionnant, non ? La seule solution, comme le souligne Hadrien, c’est de rendre l’accès légal au livre plus attrayant que l’accès illégal.

  48. F

    est-ce que ça ne vaut pas aussi pour le numérique ? la libre disposition du texte numérique est un «  plus  » absolu pour un livre – un Pléiade devrait systématiquement être vendu avec accès à sa version numérique pour recherche plein texte et lecture nomade en accompagnement du livre dans la bib – titelive réfléchit à des clés usb qui pourraient être tirées à moins d’1 euro et diffusées par les libraires eux-mêmes avec dossier numérique

    en se disant bien que le dossier numérique lié à un livre ça n’a rien à voir avec la seule mise à disposition du texte – voir ce qu’a fait Philippe Vasset pour accompagner son bouquin Fayard en septembre – c’est tout un ensemble, images, itw, doc de préparation, et pourquoi pas textes du patrimoine en affinité etc

    alors oui nos chers éditeurs pourraient comprendre qu’il ne s’agit pas de transférer leur métier dans autre support, mais d’ «  éditer  » un ensemble différent (qui pourrait donc aussi passer par les bornes de téléchargement libraires) ou le texte numérique seul peut bien circuler tant qu’on veut sur eMule : il ne prend «  valeur  » marchande que pour les machins genre Vinci Code ou Bruni la Bio 4, mais ne dispose pas en soi de valeur symbolique

    plein à inventer, et à ce moment là ça pourra aussi rebondir sur l’envie de claquer 200 euros aux States pour le Sony ou le eReadius en complément de nos ordis portables…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>