Du spam sur les étagères d’Amazon

Vous détestez le spam. Vous avez appris, lorsque vous cherchez une information sur Google à détecter d’un coup d’œil dans la liste de résultats les «  faux sites  » des vrais. Vous vous êtes fait prendre une fois ou deux, puis vous avez mémorisé les URL à bannir, et les signes qui annoncent un site sans véritable contenu. Vous avez compris depuis longtemps qu’il existe quantité de sites sans auteurs, qui se contentent d’agréger sans objectif de service du texte aspiré ici et là, uniquement en fonction des requêtes les plus fréquentes, afin d’attirer l’internaute, peu importe s’il ne trouve pas de réponse sur le faux site, il a cliqué, il est venu, le compteur tourne, le nombre de visiteurs uniques augmente, le page rank grimpe, et voilà, le tour est joué.

Google vous donne un coup de main, modifiant son algorithme deux fois coup sur coup, une fois pour pénaliser dans ses résultats les sites produits par des fermes de contenu, réalisés par des volontaires sous-payés recrutés pour écrire le plus vite possible sur n’importe quel sujet, une autre pour pénaliser les «  scraper websites », qui ne contiennent aucun contenu original.

Vous avez en tête les déclarations maintes fois entendues, qui diabolisent le web et ce qui s’y écrit, les dangers d’un lieu non régulé, où tout un chacun peut publier.  Alors que les livres, disent souvent les mêmes personnes, sont infiniment plus dignes de confiance  : les auteurs sont sélectionnés, leurs textes sont relus, l’éditeur veille sur la qualité du fond et de la forme.

Mais, alors que vous avez appris à trier vous même les résultats de votre moteur de recherche, et à trouver les pépites parmi les cailloux sans intérêt, alors que Google vous aide désormais en veillant à reléguer loin dans son classement les sites sans intérêt, voici que les spammeurs ont trouvé une autre cible  : les ebooks.


Vous vous souvenez de Jack Nicholson dans Shining, tapant sans fin sur sa machine à écrire la phrase «  All work and no play makes Jack a dull boy  »  ?  Le personnage du film pourrait aujourd’hui sans problème (pour peu qu’il y ait du réseau dans son hôtel perdu dans la montagne) publier un livre composé uniquement de cette phrase répétée sur 500 pages. Il aurait facilement transformé le fichier en EPUB, puis mis en vente ce fichier dans la section ebooks d’Amazon. Je ne dis pas qu’il aurait pu l’y laisser très longtemps, ni qu’il en aurait vendu des quantités, mais l’essai a été tenté par Mike Essex, un spécialiste de la recherche en ligne de l’agence britannique de marketing numérique Impact Media. Il a copié puis collé des centaines de fois les paroles d’une chanson, en a fait un fichier numérique qu’il a publié sur Amazon, et a attendu. Rien. Rien n’est mis en place pour détecter un faux livre de ce type. Bien sûr, personne d’autre ne s’amuse à publier exactement ce type de faux livres, mais il en existe bien d’autres, fabriqués à partir de texte aspiré sur le web, ou bien reprenant sans aucun effort éditorial particulier des ouvrages du domaine public. Faites l’expérience  : tapez   »Manuel Ortiz Braschi  » dans le moteur de recherche d’Amazon US. Cet «  auteur  » a 3090 ebooks à son actif  à l’heure où j’écris , vendus le plus souvent 3,44 $…

Les quelques commentaires montrent le désarroi des acheteurs qui se font piéger, mais hésitent à se mobiliser pour une dépense de 3,44 $, et il est probable que la personne qui se cache derrière ce nom et perçoit 70% du prix de vente doit tirer un revenu régulier de ces centaines de titres.

Essex plaide pour la mise en place d’un minimum de contrôle de la part des plateformes de livres numériques, afin de détecter les «  faux livres  ». Amazon, très attaché à l’expérience utilisateur, devra apporter une réponse, avant que les spammeurs du livre numérique ne se multiplient, et encombrent les étagères virtuelles, noyant des livres de valeur parmi une masse de pseudo livres.

7 réflexions au sujet de « Du spam sur les étagères d’Amazon »

  1. Raymonde Wicky

    Les pseudos maisons d’éditions alphascript et betascript reproduisent des articles de wikipedia et les vendent comme des livres. et pas à 3 francs 6 sous ! un exemple : WAR HORSE (PLAY) [Paperback]
    LAMBERT M. TENNOE, MARIAM T. HENSSONOW, SUSAN F. SURHONE (Author) vendu entre 52 et 68 dollars.. Attrape-nigaud-e-s de première ! Il y a en d’autres aussi, de pseudos-éditeurs, c’est proprement scandaleux … et même des bibliothèques achètent de leurs livres ;-)

  2. Guillaume

    Dans le même esprit, tu as l’excellent Livres Groupe, que j’avais découvert parce qu’il avait écrit un livre sur Babelio, c’est flatteur : http://www.amazon.fr/Application-Catalogage-Social-Librarything-Researchgate/dp/1159689423/ref=sr_1_1?ie=UTF8&qid=1302254754&sr=8-1

    Il s’agit cette fois-ci de «  vrais  » livres et non de fichiers (je n’ose imaginer à quoi ils ressemblent), constitués de compilations automatisées d’articles Wikipedia, dans le respect le plus cynique des licences Creative Commons.

    Note que Manuel Ortiz Braschi est enfoncé. Livres Groupe a signé 63931 livres, sur des thèmes aussi variés que :

    - Les instruments de musique iranienne : http://www.amazon.fr/Instrument-Musique-Iranienne-Santour-Tombak/dp/1159502862/ref=sr_1_38?s=books&ie=UTF8&qid=1302255095&sr=1-38

    - Les femmes pirates : http://www.amazon.fr/Femme-Pirate-OMalley-Charlotte-Alvilda/dp/1159684073/ref=sr_1_54?s=books&ie=UTF8&qid=1302255150&sr=1-54

    - Et bien entendu, les lois relatives au d’auteur en France (ouvrage indisponible) : http://www.amazon.fr/Loi-Relative-Droit-DAuteur-France/dp/1159756805/ref=sr_1_6?ie=UTF8&qid=1302255239&sr=1-6

  3. Hubert Guillaud

    Du spam, il y en a beaucoup sur les étagères. Actuellement, on en voit aussi chez certains éditeurs numériques, qui mettent un peu n’importe quoi en métadonnées de leurs livres. Tant et si bien que des romans jeunesse se retrouvent en science humaines parce qu’ils traitent d’histoire ou d’écologie…

  4. Virginie

    @Hubert qu’il y ait encore d’immenses progrès à faire en ce qui concerne la qualité des métadonnées, c’est sûr, c’est un point crucial. Je crois cependant que c’est un problème distinct de celui du spam. Le résultat du désordre dans les métadonnées, c’est qu’un livre mal renseigné devient introuvable, ou apparaît de manière non pertinente sur les sites de e-libraires ou dans les résultats des moteurs de recherche. Le spam est le fait ds gens qui intentionnellement détournent l’objet des e-libraires en fabriquant sciemment de pseudos contenus. Les deux (désordre dans les métadonnées et spam) perturbent l’expérience utilisateur, mais cela ne permet pas, je trouve, d’assimiler à du spam les livres numériques dont les métadonnées sont mal renseignées. Cela produit sans doute un peu de bruit dans les résultats, mais cela nuit en premier aux titres concernés, et je ne trouve pas qu’on peut assimiler ce bruit, non intentionnel, à du spam.

  5. Ping : « C’est la nature même des livres qui est en train de changer » | La Feuille

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>