Du crowdsourcing pour traduire des textes Chinois

By | 13/05/2012

Le crowdsourcing est maintenant bien ancré chez les internautes. Les exemples fleurissent, allant du célèbre wikipedia à la création de la base de données des dépenses des députés Anglais, en passant par du crowdsourcing « involontaire », comme le célèbre reCaptcha qui fait faire aux internautes de la reconnaissance de caractère gratuite pour Google.

Le crowdsourcing est une technique puissante, car elle utilise les « temps libres » de multiples contributeurs pour effectuer des tâches distribuées mais cohérentes. Il y a néanmoins une condition fondamentale pour qu’il fonctionne: il faut que la communauté profite de l’effort collectif. Si le crowdsourcing sert à alimenter les bases de Google gratis pro deo, alors la communauté va se lasser. A l’inverse, la traduction de Facebook en 70 langues a été réalisée en mode crowdsourcing parce que, justement, les communauté en ont profité, en ayant accès au réseau social dans leur langue natale.

C’est bien le sens du projet Marcopolo, créé et animé par Julien Leyre, un français qui habite à Melbourne. Combinant sa passion pour les langues et sa compréhension du Web, Julien s’est intéressé au problème de la traduction de textes Chinois.

Partant du constat qu’il y a énormément de travail de traduction effectué par des étudiants Chinois ou Occidentaux qui est « perdu », dans le sens où il n’est pas réutilisé malgré sa qualité, Julien a construit une plateforme permettant aux étudiants de continuer de se faire la main en traduisant des textes Chinois qui alimentent la communauté. Il vient donc tout juste de lancer le site Marcopolo, dont il a fait une description en anglais.

Le fonctionnement est simple: une équipe de stagiaires scanne des sites Chinois, tels que bulloger ou 1510, à la recherche de textes d’intellectuels, et les propose pour traduction sur marcopolo. L’internaute qui le souhaite peut alors traduire tout ou partie du texte. Le site étant basé sur un wiki, tout internaute peut corriger, amender, améliorer, continuer les traductions en cours. Les traductions sont ensuite évaluées par l’équipe éditoriale. Julien annonce les nouveaux textes et les traductions sur la page facebook du projet.

Cette méthode permet de découvrir des textes chinois qui seraient inaccessibles autrement. J’avoue avoir éclaté de rire en découvrant grâce la traduction française du texte « Réflexion sur la violence verbale » que les insultes occidentales envoient les gens en enfer mais tout entier, tandis que les chinois trouvent cette méthode paresseuse et préfère y envoyer seulement des parties du corps !

Il y a actuellement 60 textes proposés sur le site, et 70 en attente de validation. Les langues cibles sont l’anglais et le français, et déjà un peu d’espagnol. Julien négocie actuellement des accords avec des Universités pour augmenter le nombre de traducteurs.

Julien ne cherche pas à faire une start-up qui gagnera de l’argent ou sera vendue très cher. Marcopolo fait parti de ces sites modernes qui ne cherchent qu’à appliquer le principe de la réutilisation des surplus, cher à Robin Chase, qui est pour moi la meilleure manière de ne pas gaspiller, bien plus intelligent que l’abominable concept de décroissance.

Gageons que MarcoPolo a tout pour devenir un site de références.

 

 

 

17 thoughts on “Du crowdsourcing pour traduire des textes Chinois

  1. Pingback: Weekly blog posts (weekly) | Lelapin's Weblog

  2. Pingback: Weekly blog posts (weekly) « Lelapin's Weblog

  3. Pingback: veilles divers

  4. Pingback: André

  5. Pingback: Outils, services, sites à (re)découvrir 2012 S19 | La Mare du Gof

  6. Pingback: JFP

  7. Pingback: pierre-yves revaz

  8. Pingback: Circulez

  9. Pingback: Serge Meunier

  10. Pingback: Julien Leyre

  11. Pingback: serge soudoplatoff

  12. Pingback: Ludovic Chaker

  13. Pingback: veilles divers

  14. Pingback: André

  15. Pingback: hyronde benoit

  16. Pingback: veilles divers

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *