Archives mensuelles : février 2012

big data, publication agile : et TOC !

Lorsque l’on revient d’une conférence comme le TOC (ou comme Digital Book World), s’ensuit toujours un moment un peu confus, où plusieurs interventions se mélangent dans votre mémoire, où l’impression globale est un peu floue, où l’on se demande «  mais finalement, que vais-je retenir de cette conférence ?  » La réponse, cette année, n’est pas très romantique : data, data, data. (Prononcer  à l’américaine : «  daita  », en trainant un peu sur le «  ai  »). Malgré ma légère tendance à l’ «  innumeracy  », j’ai été impressionnée par la présentation de Roger Magoulas, Directeur des études marketing chez O’Reilly. L’éditeur dispose en effet d’un outil de présentation de ses données qui semble à la fois simple et efficace, et Magoulas explique fort bien pendant sa présentation, que l’efficacité de cet outil dépend en quelque sorte de sa simplicité. Et la simplicité n’est jamais le résultat d’une approche rustique, elle est au contraire le fruit d’un travail très approfondi, d’une réflexion menée à son terme. Ce qui est vrai pour le design (la légendaire simplicité du design des objets produits par la firme Apple étant l’exemple le plus souvent cité, mais il en est d’autres), est vrai aussi pour la visualisation de données. Simple is beautiful ! Et pour construire un tel outil, il importe de se poser quantité de questions : quelles sont les données dont je dispose ? Quelles sont les données dont j’ai besoin ? Sous quelles formes ces données doivent-elles être restituées pour que je puisse en tirer des conclusions ? Quelles sont les prises de décisions qui pourraient être facilitées par des données, lesquelles, et sous quelle forme ? Magoulas évoque la nécessité d’utiliser le «  storytelling  » pour rendre ces données parlantes, lisibles, frappantes, faciles à mémoriser. Il faut que les données racontent une histoire (mais il est indispensable aujourd’hui de raconter une histoire, semble-t-il, si on veut retenir l’attention des gens, comme si nous vivions tous une enfance prolongée, et que toute information devait être précédée d’un «  il était une fois…  » )

Comment se vend tel titre ? Comment se vendent les autres titres sur le même thème ? Sur quel canal, à quel moment se vend-il le mieux ? Le moins bien ?  Quelles répercussions sur les ventes a eu tel ou tel événement ? Ces questions ne sont pas nouvelles, ni la fonction analyse de données dans les entreprises. Ce qui est plus nouveau, c’est la quantité de données disponibles et la sophistication des outils toujours croissante, la possibilité de mise en circulation de ces données, l’immédiateté de leur disponibilité. Après avoir montré quelques exemples de mise en forme des données, Roger Magoulas donne des conseils à ceux qui voudraient adopter une démarche proche : la clé, indique-t-il, c’est l’intégration des compétences. Le fait qu’il n’y ait pas une équipe isolée qui s’occupe des données dans l’indifférence générale, mais que chacun ait une «  culture des données  », qui passe par un peu d’apprentissage  mathématique. Il dit aussi «  sortez, allez voir dehors !  » ce qui signifie   : les données ne sont pas seulement dans vos systèmes, il est quantité de données que vous pouvez extraire du web, de Twitter, de Facebook, et traiter de plus en plus finement. Enfin, cette réflexion, déjà entendue certainement, mais qu’on ne répétera jamais assez : «  If you don’t run something, what are you learning ?  ». Oui : si vous ne bougez pas, si vous n’essayez pas, qu’allez-vous apprendre ?

Il est à noter que l’éditeur pour lequel travaille Roger Magoulas est un éditeur bien particulier, puisqu’il s’agit d’O'Reilly, qui édite principalement des livres destinés aux informaticiens. Cette maison d’édition est située au cœur de la Silicon Valley, dont Tim O’Reilly, son fondateur, est l’une des figures. C’est Tim O’Reilly qui a, dans un célèbre article, popularisé le concept de Web 2.0. C’est d’ailleurs ce qui donne à l’événement TOC sa tonalité particulière :  l’ancrage de ses organisateurs dans la culture web, sa proximité avec les idées qui ont cours parmi les entreprises du web, et la certitude d’y entendre exprimées des idées qui font bouger les lignes, et bousculent les habitudes des éditeurs. C’est d’autant plus important qu’aujourd’hui, les maisons d’édition, grandes et petites, sont amenées à travailler avec des entreprises issues de cette culture et maîtrisant parfaitement les savoir-faire dont nous parle Roger Magoulas,  les «  acteurs globaux  », comme on dit, Amazon, Google, Apple. Le framework utilisé par O’Reilly et cité dans la présentation,  Hadoop a été inspiré par les publications MapReduce, GoogleFS et BigTable de Google. Pour se familiariser avec cette thématique des big data, il existe d’excellents articles en français, celui d’Henri Verdier, ceux d’Hubert Guilllaud sur Internet Actu.

Une autre thématique qui a retenu l’attention en cette édition 2012, c’est celle de la publication agile (Agile Publishing). Là aussi, il s’agit d’importer dans le monde de l’édition un concept issu du monde informatique, celui de la méthode agile. Là aussi, l’un des intervenants de la session dédiée à ce thème travaille chez O’Reilly (Joe Wikert), et l’autre est la très dynamique  (et sympathique) Dominique Raccah, sans qui il semble aujourd’hui difficile de boucler la programmation d’une conférence sur l’édition numérique. La méthode agile, c’est une méthode de développement informatique itérative et incrémentale, basée sur un esprit collaboratif, intégrant le dialogue avec le client et l’acceptation du changement en cours de projet. Les principes du développement agile ont été publiés en 2001 dans un manifeste, le web adore les manifestes…

Il est intéressant de voir comment un concept résiste à la transplantation d’un univers à un autre, même si cela peut être aussi la porte ouverte à beaucoup d’à peu près. (Lire à ce sujet le livre ravageur de Jacques Bouveresse, Prodiges et vertiges de l’analogie : De l’abus des belles-lettres dans la pensée, Raisons d’Agir, 1999 - ou simplement cette conférence,  critiquant la légèreté avec laquelle certains philosophes se sont pris d’affection pour des concepts scientifiques et ont voulu les importer dans le monde de la philosophie, sans se donner la peine de chercher à comprendre ces concepts avec le minimum de rigueur.)

L’idée de publication agile repose bien sur une analogie   : au cœur de la méthode agile se trouve un logiciel, une application. Ce qui fait l’objet de la publication agile, c’est un livre. Un logiciel répond à un cahier des charges (même si avec la méthode agile, on peut s’attendre à un cahier des charges moins volumineux), un logiciel doit permettre à ses utilisateurs d’accomplir un certain nombre de tâches bien définies. Il n’en est pas tout à fait de même pour un livre, même dans le cas des livres pratiques, qui répondent à des besoins spécifiques. Le plus pratique des livres de cuisine ne «  fonctionne  » pas, au sens où il n’est pas doté de la moindre «  fonctionnalité  » (l’objet livre est doté de fonctionnalités, toutes les mêmes, liées à sa forme,  mais pas l’œuvre). Il peut permettre à celui qui le lit d’agir, mais il ne déclenche pas directement des actions, comme doit le faire un logiciel. Une application dérivée d’un livre de cuisine peut, elle, disposer de fonctionnalités. Elle peut calculer par exemple les quantités d’ingrédients en fonction du nombre de convives, générer votre liste de courses, suggérer une recette en fonction de critères (difficulté, temps de préparation etc.).  Le livre est avant tout destiné à être lu, même si la lecture peut prendre bien des  formes, immersive ou non, continue ou non, rapide ou lente, méditative ou superficielle, silencieuse ou à voix haute, solitaire ou partagée.  L’art de la mise en page est tout entier orienté vers l’agrément de la lecture, il ne s’agit pas d’une démarche totalement assimilable à la recherche ergonomique qui préside à la conception d’une interface. Ainsi, la nécessité de tests itératifs avec des utilisateurs en ce qui concerne un livre doit-elle se justifier par d’autres raisons que celles qui coulent de source lorsqu’on teste un logiciel : on doit alors vérifier que l’utilisateur comprend ce qu’il doit faire, et que les manipulations de celui-ci permettent le fonctionnement du logiciel, et ne conduisent pas à des fonctionnements inattendus. Cela demeure vrai lorsque l’on parle de livres numériques. Des problèmes ergonomiques doivent bien être résolus, mais par les concepteurs de moteurs de lecture. Ceux qui produisent les fichiers se posent essentiellement des problèmes d’affichage, de rendu, s’inquiètent de la manière dont l’intention du compositeur sera respectée avec tel et tel moteur de lecture. Nulle nécessité de tester techniquement chaque livre numérique auprès des utilisateurs, sauf si on utilise déjà EPUB3, et que les livres intègrent des éléments d’interactivité non portés par le moteur de lecture grâce à la balise «  canvas  » et à javascript.

De la méthode agile, lorsqu’elle l’a transposée dans l’univers de l’édition, Dominique Raccah a principalement retenu le principe de proximité entre client et équipe de développement, le transposant bien sûr en une proximité auteur / lecteurs. L’auteur, dans ce mode de publication, demeure celui qui écrit le livre, il ne s’agit pas de co-écrire le livre avec les lecteurs, mais il soumet le livre en cours d’écriture à la communauté de lecteurs, qui peuvent réagir au fur et à mesure, indiquer des manques, demander des précisions, réagir, soumettre des idées. L’auteur peut ensuite intégrer ou non les remarques en retravaillant les chapitres déjà publiés. L’écriture du livre n’est pas confiée à la communauté des lecteurs, mais cette communauté est associée au processus.

De même, Joe Wikert a cité des exemples de livres qui ont fait chez O’Reilly l’objet d’une méthode de publication agile, comme «  Books, a Futurist’s Manifesto  » de Hugh Mc Guire et Brian O’Leary. Ce livre a été rédigé et révisé sur PressBooks, l’outil de production en ligne développé par son auteur Hugh Mc Guire, et publié dès qu’un contenu «  juste suffisant  » a été disponible, puis les chapitres se sont ajoutés, et des mises à jour ont été faites.  Aujourd’hui, il est disponible en téléchargement payant et gratuitement en streaming sur le site PressBooks.  Joe Wikert a également cité une offre déjà ancienne chez O’Reilly, destinée aux utilisateurs de la bibliothèque en ligne Safari, nommée Rough Cuts, qui consiste à donner accès à des livres encore en cours d’écriture. Effectivement, c’est un peu ancien, car j’ai consacré l’un des premiers articles de ce blog à Rough Cut…  En 2007, j’étais déjà assez enthousiaste à l’idée de nouvelles formes de publication, même si le terme de publication agile n’est pas présent dans mon billet.

Et vous, croyez-vous que ce mode de publication va se répandre ? Jugez-vous pertinent l’emploi du terme de Publication Agile ?

Bookcamp à New Work City

Non, il n’y a pas de faute de frappe dans mon titre, c’est bien New Work City avec un W et pas un Y que j’ai voulu écrire, NewWork City c’est le nom du lieu où se déroulait le Bookcamp où je me suis rendue aujourd’hui. Ce lieu ressemble à La Cantine, qui a abrité plusieurs Bookcamps à Paris, un lieu de coworking, qui offre espaces de réunion, postes de travail et connections aux startup. J’ai découvert assez tard l’existence de ce Bookcamp, et même si ça pourrait faire assez chic d’essayer de vous faire croire que j’ai fait le déplacement tout exprès depuis Paris, je sais bien que ce serait difficile de vous convaincre. Non, j’y suis allée parce qu’il se trouve que j’étais déjà à New York en prévision de la conférence Tools of Change qui commence demain. Me voici donc embarquée dans une «  non conférence«  en prélude à la «  conférence  ».

Première observation, le principe de la non conférence est ici mieux respecté que nous ne le faisons lors de nos Bookcamps parisiens : il n’y a vraiment pas de programme préparé. Une personne anime le Bookcamp (ce que fait Hubert Guillaud lors des bookcamps parisiens) : elle rappelle les principes, invite les participants à réfléchir aux sujets qu’ils aimeraient voir aborder et à les noter sur un papier. Puis chacun de ceux qui ont noté quelque chose lit son papier à voix haute, des regroupements peuvent s’effectuer si des thèmes sont très proches, et le planning de l’après-midi se remplit ainsi très vite : 4 lieux, 4 sessions, cela fait 16 sujets…

La première session à laquelle je me joins est consacrée à la «  lecture sociale  » et animée par Iris Blasi. Elle utilise pour lancer la discussion les distinctions proposées par Bob Stein pour distinguer les différents types de sociabilité liées à la lecture :

Catégorie 1 – Discuter d’un livre en personne avec des amis ou des connaissances
(hors ligne, informel, synchrone, éphémère)

Catégorie 2 – Discuter d’un livre en ligne
(en ligne, informel, synchrone ou asynchrone, éphémère)

Catégorie 3 – Discuter d’un livre en classe ou dans un club de lecture
(hors ligne, formel, synchrone ou asynchrone, éphémère)

Catégorie 4 – S’engager dans une discussion DANS les marges d’un livre
(en ligne, formel, synchrone ou asynchrone, persistent)

Lors de la discussion qui suit cette taxinomie est rapidement perdue de vue, et les arguments s’échangent sur un mode un peu «  pour ou contre  » sans que soit toujours bien précisé de quoi on est en train de parler exactement. Mais cela n’enlève pas tout intérêt à l’échange, qui fait émerger des questions pertinentes, la plus importante à mes yeux étant probablement   » avec qui souhaite-t-on partager ses lectures au sens de la catégorie 4 de Bob Stein ?  » . C’est une question qui renvoie à l’usage des réseaux sociaux, à cette notion d’ami-qui-n’en-est-pas-un introduite par Facebook, à cette sociabilité élargie à des inconnus que permet le web, inconnus qui ne restent pas vraiment des inconnus même si on ne les rencontre pas, parce que les échanges créent un lien et chacun montre de soi quelque chose dans ces échanges. On entend les arguments des sceptiques de la lecture sociale, ceux qui s’écrient «  ah non, moi, quand je lis, c’est justement pour vous oublier, tous tant que vous êtes !  », ceux des obsédés de la vente (ben ça nous intéresse pas ce que les gens font une fois qu’ils ont acheté un livre, nous, ce qui nous intéresse c’est le prochain livre qu’ils achèteront), ceux qui rappellent que ce qui marche dans les réseaux sociaux c’est la simplicité (on peut partager quantité de choses en ligne sans rien avoir à rédiger du tout, avec des outils comme Foursquare ou Pinterest). La difficulté de citer et de partager les livres protégés par des DRM est également mentionnée, ainsi que la disparité des systèmes de partage d’annotation, eux aussi dépendants des plateformes de lecture. La dichotomie «  parler d’un livre / se parler depuis l’intérieur d’un livre  » est bien soulignée.

L’atelier suivant se veut une réflexion sur les caractéristiques respectives du livre numérique et du livre imprimé. Nick Ruffilo qui l’anime est venu avec un Scrabble, et pendant que la discussion se poursuit, la moitié des participants joue contre l’autre moitié, plusieurs personnes représentant les équipes se succédant pour chercher et placer des mots. Je n’ai pas très bien saisi le pourquoi de cette mise en scène, je l’avoue, une analogie demeurée indéchiffrée, mais c’était assez plaisant… Sur les pratiques de lecture, rien de très nouveau pour qui, comme toi, lecteur bien-aimé, s’intéresse de près à ces questions. Différents sondages auprès des participants (qui lit comment ?), qui montraient une fois encore que personne n’abandonne complètement un type de lecture pour un autre, que certaines qualités du livre imprimé demeurent inégalées (en particulier sa manière d’être un objet que l’on peut reconnaître à sa forme, sa taille, sa couleur, alors que tous les livres numériques prennent la forme du terminal que l’on utilise pour les lire, demeurant hors de portée de la curiosité d’autrui.)

Une chose me frappe qui rend très différent ce bookcamp des expériences françaises, c’est  la manière d’échanger des Américains. On sent qu’ici l’expression orale est enseignée à l’école. Les élèves, les étudiants, sont encouragés à prendre la parole et à s’exprimer, et cela se sent. En conséquence, les personnes qui ne possèdent pas naturellement une aisance à parler en public sont capables cependant de prendre la parole. Chez les personnes au tempérament le plus introverti, on peut discerner un côté «  j’ai appris à m’exprimer  », avec une gestuelle et une diction  dont on voit bien qu’elles sont le fruit d’un entrainement. Les autres semblent parfaitement à l’aise.  Mais le résultat, ce sont des débats où la parole circule très librement, où l’écoute de l’autre est la règle, et où beaucoup de gens différents prennent la parole.

Chez nous, la timidité est plus forte, ainsi qu’une sorte de «  révérence  » pour les personnes auxquelles on prête une autorité, et qu’on va difficilement contredire ou questionner. Autre chose :  la peur de passer pour un idiot est très forte, on préfère ne rien dire que de risquer de dire une chose incongrue. Le résultat c’est que les ateliers de nos Bookcamps  ressemblent parfois plus à des mini conférences, et que ceux qui y prennent la parole sont le plus souvent ceux qui sont habitués à le faire en public.

Parmi les participants au troisième atelier, Joshua Tallent, de chez Ebooks Architects , un expert en formatage de livres numériques, conseille à l’assistance de participer au wiki eprdcton.org, et de suivre sur twitter le hashtag #eprdctn.

L’une des questions débattues ici est très familière à tes oreilles, cher lecteur : est-il possible de produire un fichier  EPUB «  single source  », qui servira de base à toutes les conversions vers les formats propriétaires ou vers les EPUB-qui-ne-sont-plus-tout-à-fait-des-EPUB ? Pour Joshua la réponse est non, car ce format unique, qui fait tant rêver les éditeurs, obligerait à des compromis sacrifiant trop la qualité, en usant du plus petit dénominateur commun. Mieux vaut accepter de produire plusieurs formats qui divergent, chacun tirant au mieux parti de la manière dont sont développés les moteurs de lecture. Ce n’est pas l’avis de plusieurs éditeurs présents qui considèrent que lorsque les titres à publier se comptent en milliers, il n’est pas possible de faire ce patient travail artisanal sur chacun des titres, et qu’il faut trouver des solutions duplicables favorisant le maximum d’automatisation. Tout le monde s’accorde à dire qu’il ne faut pas s’attendre à plus de stabilité, mais que l’adaptation à de perpétuels changements dans le domaine du formatage est désormais la règle.

Le dernier débat auquel j’assiste a pour thème «  crowdsourcing the perfect business model  » et,  je vous le dis tout de suite, la «  foule  » n’a pas réussi malgré ses efforts à trouver ce business model idéal. L’équation est un peu compliquée, mais tous s’accordent à dire que l’on est encore loin d’avoir tout inventé. Une personne de chez Harlequin indique que des modèles basés sur l’accès, qui permettent aux lecteurs de charger 6 livres de leur choix chaque mois choisis parmi un catalogue thématique, commencent à sérieusement concurrencer les modèles de vente à l’unité. La conversation tourbillonne, il est question du nombre de titres produits par les éditeurs, quelqu’un évoque le problème des retours, certains disent qu’il ne faut pas produire plus de livres qu’on ne peut en soutenir activement d’un point de vue marketing.

Après les ateliers, ce qui va se passer ressemble énormément à ce qui clôt habituellement nos Bookcamps parisiens : on entend le bruit des bouchons qui sautent, le pas des bookcampeurs qui se rapprochent des bouteilles et des verres. Un petit détail aussi, pratique et simple à mettre en œuvre : sur la table, à l’entrée, un tas de feutres de toutes les couleurs et des paquets d’étiquettes auto-collantes. La plupart des gens y ont inscrit en arrivant leur  leur nom et leur pseudo twitter, certains ajoutent le nom de leur société. C’est pratique, plus simple que les trucs en plastiques avec épingles à nourrice qui piquent, et ça simplifie bien les échanges. Cela me permet de mettre des visages sur de très nombreux habitants de ma timeline : les participants sont nombreux, et bon nombre d’entre eux viennent de grands groupes d’édition (Random House, Macmillan, Penguin…). Je n’ai pas besoin de regarder son étiquette pour reconnaitre Cristina Mussinelli, une consultante qui travaille pour  l’AIE (l’équivalent du SNE en Italie), et qui siège aussi à l’IDPF. Elle et moi sommes ici les deux seules européennes. Mais, dans mon souvenir, il n’y avait, me semble-t-il,  pas un seul Américain cet automne au Bookcamp Paris…   (Bon, il n’y avait pas non plus de TOC juste après, c’est vrai.)