Archives pour la catégorie DRM

big data, publication agile : et TOC !

Lorsque l’on revient d’une conférence comme le TOC (ou comme Digital Book World), s’ensuit toujours un moment un peu confus, où plusieurs interventions se mélangent dans votre mémoire, où l’impression globale est un peu floue, où l’on se demande «  mais finalement, que vais-je retenir de cette conférence ?  » La réponse, cette année, n’est pas très romantique : data, data, data. (Prononcer  à l’américaine : «  daita  », en trainant un peu sur le «  ai  »). Malgré ma légère tendance à l’ «  innumeracy  », j’ai été impressionnée par la présentation de Roger Magoulas, Directeur des études marketing chez O’Reilly. L’éditeur dispose en effet d’un outil de présentation de ses données qui semble à la fois simple et efficace, et Magoulas explique fort bien pendant sa présentation, que l’efficacité de cet outil dépend en quelque sorte de sa simplicité. Et la simplicité n’est jamais le résultat d’une approche rustique, elle est au contraire le fruit d’un travail très approfondi, d’une réflexion menée à son terme. Ce qui est vrai pour le design (la légendaire simplicité du design des objets produits par la firme Apple étant l’exemple le plus souvent cité, mais il en est d’autres), est vrai aussi pour la visualisation de données. Simple is beautiful ! Et pour construire un tel outil, il importe de se poser quantité de questions : quelles sont les données dont je dispose ? Quelles sont les données dont j’ai besoin ? Sous quelles formes ces données doivent-elles être restituées pour que je puisse en tirer des conclusions ? Quelles sont les prises de décisions qui pourraient être facilitées par des données, lesquelles, et sous quelle forme ? Magoulas évoque la nécessité d’utiliser le «  storytelling  » pour rendre ces données parlantes, lisibles, frappantes, faciles à mémoriser. Il faut que les données racontent une histoire (mais il est indispensable aujourd’hui de raconter une histoire, semble-t-il, si on veut retenir l’attention des gens, comme si nous vivions tous une enfance prolongée, et que toute information devait être précédée d’un «  il était une fois…  » )

Comment se vend tel titre ? Comment se vendent les autres titres sur le même thème ? Sur quel canal, à quel moment se vend-il le mieux ? Le moins bien ?  Quelles répercussions sur les ventes a eu tel ou tel événement ? Ces questions ne sont pas nouvelles, ni la fonction analyse de données dans les entreprises. Ce qui est plus nouveau, c’est la quantité de données disponibles et la sophistication des outils toujours croissante, la possibilité de mise en circulation de ces données, l’immédiateté de leur disponibilité. Après avoir montré quelques exemples de mise en forme des données, Roger Magoulas donne des conseils à ceux qui voudraient adopter une démarche proche : la clé, indique-t-il, c’est l’intégration des compétences. Le fait qu’il n’y ait pas une équipe isolée qui s’occupe des données dans l’indifférence générale, mais que chacun ait une «  culture des données  », qui passe par un peu d’apprentissage  mathématique. Il dit aussi «  sortez, allez voir dehors !  » ce qui signifie   : les données ne sont pas seulement dans vos systèmes, il est quantité de données que vous pouvez extraire du web, de Twitter, de Facebook, et traiter de plus en plus finement. Enfin, cette réflexion, déjà entendue certainement, mais qu’on ne répétera jamais assez : «  If you don’t run something, what are you learning ?  ». Oui : si vous ne bougez pas, si vous n’essayez pas, qu’allez-vous apprendre ?

Il est à noter que l’éditeur pour lequel travaille Roger Magoulas est un éditeur bien particulier, puisqu’il s’agit d’O'Reilly, qui édite principalement des livres destinés aux informaticiens. Cette maison d’édition est située au cœur de la Silicon Valley, dont Tim O’Reilly, son fondateur, est l’une des figures. C’est Tim O’Reilly qui a, dans un célèbre article, popularisé le concept de Web 2.0. C’est d’ailleurs ce qui donne à l’événement TOC sa tonalité particulière :  l’ancrage de ses organisateurs dans la culture web, sa proximité avec les idées qui ont cours parmi les entreprises du web, et la certitude d’y entendre exprimées des idées qui font bouger les lignes, et bousculent les habitudes des éditeurs. C’est d’autant plus important qu’aujourd’hui, les maisons d’édition, grandes et petites, sont amenées à travailler avec des entreprises issues de cette culture et maîtrisant parfaitement les savoir-faire dont nous parle Roger Magoulas,  les «  acteurs globaux  », comme on dit, Amazon, Google, Apple. Le framework utilisé par O’Reilly et cité dans la présentation,  Hadoop a été inspiré par les publications MapReduce, GoogleFS et BigTable de Google. Pour se familiariser avec cette thématique des big data, il existe d’excellents articles en français, celui d’Henri Verdier, ceux d’Hubert Guilllaud sur Internet Actu.

Une autre thématique qui a retenu l’attention en cette édition 2012, c’est celle de la publication agile (Agile Publishing). Là aussi, il s’agit d’importer dans le monde de l’édition un concept issu du monde informatique, celui de la méthode agile. Là aussi, l’un des intervenants de la session dédiée à ce thème travaille chez O’Reilly (Joe Wikert), et l’autre est la très dynamique  (et sympathique) Dominique Raccah, sans qui il semble aujourd’hui difficile de boucler la programmation d’une conférence sur l’édition numérique. La méthode agile, c’est une méthode de développement informatique itérative et incrémentale, basée sur un esprit collaboratif, intégrant le dialogue avec le client et l’acceptation du changement en cours de projet. Les principes du développement agile ont été publiés en 2001 dans un manifeste, le web adore les manifestes…

Il est intéressant de voir comment un concept résiste à la transplantation d’un univers à un autre, même si cela peut être aussi la porte ouverte à beaucoup d’à peu près. (Lire à ce sujet le livre ravageur de Jacques Bouveresse, Prodiges et vertiges de l’analogie : De l’abus des belles-lettres dans la pensée, Raisons d’Agir, 1999 - ou simplement cette conférence,  critiquant la légèreté avec laquelle certains philosophes se sont pris d’affection pour des concepts scientifiques et ont voulu les importer dans le monde de la philosophie, sans se donner la peine de chercher à comprendre ces concepts avec le minimum de rigueur.)

L’idée de publication agile repose bien sur une analogie   : au cœur de la méthode agile se trouve un logiciel, une application. Ce qui fait l’objet de la publication agile, c’est un livre. Un logiciel répond à un cahier des charges (même si avec la méthode agile, on peut s’attendre à un cahier des charges moins volumineux), un logiciel doit permettre à ses utilisateurs d’accomplir un certain nombre de tâches bien définies. Il n’en est pas tout à fait de même pour un livre, même dans le cas des livres pratiques, qui répondent à des besoins spécifiques. Le plus pratique des livres de cuisine ne «  fonctionne  » pas, au sens où il n’est pas doté de la moindre «  fonctionnalité  » (l’objet livre est doté de fonctionnalités, toutes les mêmes, liées à sa forme,  mais pas l’œuvre). Il peut permettre à celui qui le lit d’agir, mais il ne déclenche pas directement des actions, comme doit le faire un logiciel. Une application dérivée d’un livre de cuisine peut, elle, disposer de fonctionnalités. Elle peut calculer par exemple les quantités d’ingrédients en fonction du nombre de convives, générer votre liste de courses, suggérer une recette en fonction de critères (difficulté, temps de préparation etc.).  Le livre est avant tout destiné à être lu, même si la lecture peut prendre bien des  formes, immersive ou non, continue ou non, rapide ou lente, méditative ou superficielle, silencieuse ou à voix haute, solitaire ou partagée.  L’art de la mise en page est tout entier orienté vers l’agrément de la lecture, il ne s’agit pas d’une démarche totalement assimilable à la recherche ergonomique qui préside à la conception d’une interface. Ainsi, la nécessité de tests itératifs avec des utilisateurs en ce qui concerne un livre doit-elle se justifier par d’autres raisons que celles qui coulent de source lorsqu’on teste un logiciel : on doit alors vérifier que l’utilisateur comprend ce qu’il doit faire, et que les manipulations de celui-ci permettent le fonctionnement du logiciel, et ne conduisent pas à des fonctionnements inattendus. Cela demeure vrai lorsque l’on parle de livres numériques. Des problèmes ergonomiques doivent bien être résolus, mais par les concepteurs de moteurs de lecture. Ceux qui produisent les fichiers se posent essentiellement des problèmes d’affichage, de rendu, s’inquiètent de la manière dont l’intention du compositeur sera respectée avec tel et tel moteur de lecture. Nulle nécessité de tester techniquement chaque livre numérique auprès des utilisateurs, sauf si on utilise déjà EPUB3, et que les livres intègrent des éléments d’interactivité non portés par le moteur de lecture grâce à la balise «  canvas  » et à javascript.

De la méthode agile, lorsqu’elle l’a transposée dans l’univers de l’édition, Dominique Raccah a principalement retenu le principe de proximité entre client et équipe de développement, le transposant bien sûr en une proximité auteur / lecteurs. L’auteur, dans ce mode de publication, demeure celui qui écrit le livre, il ne s’agit pas de co-écrire le livre avec les lecteurs, mais il soumet le livre en cours d’écriture à la communauté de lecteurs, qui peuvent réagir au fur et à mesure, indiquer des manques, demander des précisions, réagir, soumettre des idées. L’auteur peut ensuite intégrer ou non les remarques en retravaillant les chapitres déjà publiés. L’écriture du livre n’est pas confiée à la communauté des lecteurs, mais cette communauté est associée au processus.

De même, Joe Wikert a cité des exemples de livres qui ont fait chez O’Reilly l’objet d’une méthode de publication agile, comme «  Books, a Futurist’s Manifesto  » de Hugh Mc Guire et Brian O’Leary. Ce livre a été rédigé et révisé sur PressBooks, l’outil de production en ligne développé par son auteur Hugh Mc Guire, et publié dès qu’un contenu «  juste suffisant  » a été disponible, puis les chapitres se sont ajoutés, et des mises à jour ont été faites.  Aujourd’hui, il est disponible en téléchargement payant et gratuitement en streaming sur le site PressBooks.  Joe Wikert a également cité une offre déjà ancienne chez O’Reilly, destinée aux utilisateurs de la bibliothèque en ligne Safari, nommée Rough Cuts, qui consiste à donner accès à des livres encore en cours d’écriture. Effectivement, c’est un peu ancien, car j’ai consacré l’un des premiers articles de ce blog à Rough Cut…  En 2007, j’étais déjà assez enthousiaste à l’idée de nouvelles formes de publication, même si le terme de publication agile n’est pas présent dans mon billet.

Et vous, croyez-vous que ce mode de publication va se répandre ? Jugez-vous pertinent l’emploi du terme de Publication Agile ?

Scribd, le « YouTube du livre », ouvre une partie payante

Sur Twitter ce matin :

@adamhodgkin «  RT @naypinya : scribd launches ecommerce platform for publishing ;  : – http://bit.ly/wB7tE publishers get 80% of revenue  »

A bloguer en urgence !

Le site de partage de documents en ligne Scribd va commencer aujourd’hui à tester une plateforme de commerce électronique (Scribd Store). Sur Scribd,  les utilisateurs ont la possibilité de charger et de partager tout type de document écrit. Tout comme cela arrive fréquemment sur YouTube pour la vidéo, certains utilisateurs déposent parfois sur Scribd des livres protégés par le droit d’auteur, ce contre quoi Scribd s’efforce de lutter, mais qui lui vaut parmi les éditeurs la réputation de site favorisant le piratage, comme cela a été évoqué récemment dans cet article du New York Time. Scribd a déjà en vue la déclinaison de son service sur iPhone.

le site PaidContent a été hier le premier a annoncer l’ouverture de Scribd Store, qui devrait publier seulement aujourd’hui son communiqué de presse. Voici ce qu’ils écrivent : (traduction maison)

«  Les prix seront fixés par les éditeurs. Contrairement au modèle de partage de revenus en usage chez Amazon, qui peut aller jusqu’à une part de 70% de revenus prélevés pour certains fournisseurs de contenu, la nouvelle boutique Scribd permettra aux ayants droits de conserver 80%  des revenus provenant de l’achat de leurs œuvres, a déclaré Tammy Nam, Vice Présidente de Scribd chargé du contenu et du marketing, dans une interview avec paidContent. Les auteurs et les éditeurs, dans la boutique Scribd pourront fixer eux-mêmes leurs prix et choisir leurs options de DRM. Actuellement, les prix vont de 1$ pour un « graphic novel panel » à 5000$ pour un rapport de recherche détaillé sur le marché chinois. »

« Beaucoup d’œuvres vont êtres mises en ligne, alors nous souhaitons abaisser les barrières » ajoute Nam à propos du raisonnement qui a présidé à cette politique de prix et de DRM. « Notre objectif principal est d’ajouter du contenu au site. Nous pensons que cela sera un peu comme eBay, sous de nombreux aspects, où vous trouvez un mélange de contenu fourni par des vendeurs amateurs et par des professionnels. Mais surtout, en tant que site fréquenté chaque mois par 60 millions de lecteurs, nous croyons qu’il y a une superbe « longue traîne » de contenu non professionnel. »

‘L’introduction de la boutique Scribd et son système de DRM à la demande ne va pas nécessairement faire cesser le plagiat et les violations du copyright. Mais en donnant aux auteurs et aux éditeurs une chance de gagner de l’argent sur son site, Scribd espère que les critiques vont s’atténuer. Séparément, Scribd maintient une « base de données de copyrights » des œuvres protégées, et fait son possible pour lutter contre les usages non autorisés. Chaque œuvre chargée sur la boutique Scribd sera automatiquement ajoutée à cette base de données, qui couvre aussi la partie gratuite du site. Par exemple, le site communautaire et éditeur de guide de voyages Lonely Planet  va commencer à vendre des chapitres à partir de 2,50$  et 12,50$. «  

C’est une annonce très importante : Scribd est un site particulièrement bien fait, qui touche une audience très large. Savoir dans quelle mesure et dans quelles proportions ses utilisateurs vont accepter de passer, pour accéder à des œuvres protégées, à un modèle payant sera tout à fait crucial pour la détermination de modèles économiques dans l’édition numérique. Le modèle de Scribd qui permet à la fois la consultation en ligne et le téléchargement en fait un concurrent aussi bien d’Amazon que du futur Google Recherche de Livres (si le règlement est approuvé). On peut se réjouir de l’arrivée d’un acteur significatif alors que la rivalité Google / Amazon risque de s’accentuer pour la domination de l’accès aux contenus et celle du commerce du livre numérique.

Qu’en pensez-vous ? ( Les commentaires de plus de 140 caractères sont acceptés, allez, lâchez un peu Twitter et revenez sur les blogs ! )

Penguin adopte le format epub

Dans un article qui nous fait part des dernières nouvelles du numérique chez quelques éditeurs, le blog  Persona Non Data annonce l’adoption du format epub (celui de l’IDPF) par Penguin. Un pas de plus pour ce format vers ce qu’il a vocation à devenir : le format standard pour la publication numérique.
Les autres  nouvelles ?

- Le feuilletage en ligne rendu accessible, via un widget,  pour 5000 ouvrages chez Random House. PND souligne que Random s’est doté depuis quelques années d’un Digital Warehouse («  entrepôt numérique  ») et est en mesure de produire et distribuer massivement aujourd’hui des contenus numériques variés.

- On travaille chez Macmillan sur l’idée d’eBooks contenant des «  bonus  », du «  extra-content  », sorte de version augmentée des livres imprimés. L’idée est développée sur the digitalist. 

Apprenons à éditer des textes numériques

Nos livres en version numérique ? Bien sûr, ils existent déjà. Depuis des années, la chaîne de production des livres s’est informatisée : le manuscrit, déjà, est fourni à l’éditeur sous la forme d’un fichier, le plus souvent un fichier Word. Le fichier est transmis à la PAO, qui va se charger de sa mise en page, à l’aide d’un logiciel dédié, généralement XPress ou Indesign. Une fois terminées les corrections, on adresse à l’imprimeur un fichier PDF, dit le «  PDF imprimeur  ». Nos livres sont donc bien prêts pour le numérique, pas de doute… Sauf que…

Sauf que le fichier destiné à imprimeur a été conçu pour un usage précis, l’impression d’un livre à un format donné. Le numérique, aime-t-on penser, arrache le texte à la page, le rend indépendant de son support. Sauf que… un fichier destiné à l’impression «  re-soude  » le texte à la page, en mélangeant des informations de contenu et des informations de mise en forme. (L’indépendance contenu/mise en forme est d’ailleurs discutable, car la mise en forme véhicule un sens, qui ne se distingue pas forcément si facilement du «  sens du contenu  » mais interfère largement avec… mais cette indépendance est techniquement réalisable.)

Lire la suite