Translate

Affichage des articles dont le libellé est crowdsourcing. Afficher tous les articles
Affichage des articles dont le libellé est crowdsourcing. Afficher tous les articles

16 sept. 2009

Google achète recaptcha : crowdsourcing et numérisation

Google vient d'acquérir Re-captcha, mais pourquoi cette achat?
  • Tout d'abord qu'est ce que re-captcha?


L’objectif d’un captcha est de s’assurer que c’est une personne qui répond et non pas un automate informatique. Pour cela, on peut notamment présenter à l'utilisateur une image représentant un texte déformé et lui demander de l'écrire , un robot ne pouvant réussir l'exercice.

Une équipe de jeunes informaticiens a eu l’idée d’utiliser cette technique pour aider à digitaliser des livres : le projet Recaptcha était né!

Des milliers d’ordinateurs sont utilisés pour digitaliser des ouvrages anciens, écrits avant l’arrivée de l'informatique. Les logiciels de lecture, OCR (Optical Recognition Character) sont très performants, mais buttent parfois sur des mots qu’ils n’arrivent pas à déchiffrer.

L’idée de l’équipe de Carnégie Mellon est la suivante : on va utiliser les mots que ces programmes OCR ne savent pas lire pour créer des captchas. La méthode utilisée est la suivante:

On propose un captcha composé de deux mots :


- Le premier a déjà été identifié par l’ordinateur.


- Le second est celui que l’on cherche a comprendre.


- Si vous identifiez le premier, on fait l’hypothèse que vous allez interpréter intelligemment le second. Par sécurité, ce deuxième mot sera présenté plusieurs fois, et ne sera confirmé que si trois personnes différentes ont donné la même interprétation


Luis von Ahn, l’un des responsables du projet, estime à 60 millions le nombre de captchas utilisés chaque jour. A raison de 10 secondes par opération, cela représente 150 000 heures de travail par jour ! C’est l’équivalent de 20 000 personnes à temps plein !


L’utilisation reste inchangée pour l’internaute (par rapport à autre système de captcha )il n’a donc pas l’impression de fournir un travail supplémentaire et l’installation est facile et gratuite pour le Webmaster (via un widget et une API).


L’atout de ce site est donc de jouer la quantité des contributions plus que sur l’importance de chacune d’entre elles. Ainsi, le service profite seul à son créateur qui n’a pas à partager la valeur créée.


  • Mais quel lien avec Google? Ne possède t-il pas son propre système de captcha?

Le lien c'est Google Books , dont wikipédia donne la définition suivante :


"Google Books est un service en ligne permettant d'accéder à des livres numérisés. Anciennement appelé Google Print, le début de la numérisation des livres a été annoncé par Google en décembre 2004. Disposant de moyens considérables, cette bibliothèque virtuelle comptait plus de sept millions de livres en novembre 2008[1]. Google numérise des livres provenant de nombreuses universités américaines et de tout horizon pour ensuite les diffuser sur ses serveurs. Droits d'auteurs obligent, certains ne sont que partiellement publiés. Pour le moment, les livres imprimés entre 1839 et 1922 sont rarement accessibles en entier pour les internautes basés hors des Etats-Unis."

Depuis le service s'est tout de même internationalisé et des livres du monde entier sont en train d'être numérisés pour rejoindre la bibliothèque google!

Des accords sont en cours de préparation avec des bibliothèques françaises et notamment celle de la ville de Lyon pour que google numérise gratuitement leurs collections!

Quand on sait que la numérisation de la seule Bibliothèque de Lyon représenterait un coût de 60 000 000€, on comprend qu'avec un système de crowdsourcing comme Re-captcha Google peut voir là un moyen efficace d'économiser de l'argent à longs termes.


Hazard ou pas, c'était justement le sujet d'un petit reportage sur le JT de france 2 ce soir même! Je me suis donc débrouillé pour vous le récupérer (la qualité est moyenne mais c'est regardable).






Se faisant, Google veut intelligemment assoir sa position dominante comme porte d'accès à l'information en ligne.


Ce billet vous à plu? Pensez à vous abonner au flux RSS et à voter sur Wikio (bouton en bas)


Bookmark and Share






4 sept. 2009

Du crowdsourcing à l'exploitation


J'ai déjà traité à différentes reprises du crowdsourcing, j'ai même proposé ma définition du crowdsourcing.
D'un point de vue théorique, je trouve ce concept très intéressant voire très porteur.

Néanmoins du crowdsourcing à l'exploitation il n'y a qu'un pas (ou deux).

Je viens en effet de tomber sur un billet qui soulève en moi quelques interrogations. Ce billet traite de la "brillante idée" d'un entrepreneur de faire sous traiter des tâches dans des pays pauvres à des  possesseurs de téléphone.

J'avais déjà entendu parler des paysans chinois qui arrêtaient leur activité agricole pour devenir revendeur de compte WOW sur ebay...
mais là il s'agit tout de même d'un site dédié dont le concept initial est de sous traiter DANS LES PAYS PAUVRES des micro tâches , et non pas à qui souhaite  participer comme le fait amazon avec mechanical turk !



Est-ce mal ou simplement moins hypocrite?
Finalement si cela permet à ces gens d'avoir un revenu qui est certes très minime à nos yeux mais qui remis dans le contexte du pouvoir d'achat du pays est correct, n'est ce pas une bonne chose? 
Est-ce simplement une forme moderne de délocalisation?

Plus je réfléchie et moins j'arrive à y voir clair! Alors je sollicite votre avis (via les commentaires ) qui m'aidera peut-être à me positionner plus clairement...

N'hésitez pas à invitez d'autres personnes à participer au débat, plus il y aura d'avis divergents plus la réflexion sera constructive....



Ce billet vous à plu? Pensez à vous abonner au flux RSS



31 août 2009

Musique et Crowdsourcing

Un nouveau service de crowdsourcing s’invite dans le monde la musique, son nom : MyMusicCircle.

Partant du constat que dans ce secteur on emploie beaucoup les petites annonces, les porteurs du projet ont décidé d’améliorer les choses et l’idée de base est assez simple en soit : créez une place de marché en ligne où porteurs de projets musicaux et professionnels de la musique peuvent se rencontrer.


image Liste des différents professionnels ciblés

J’expliquais il y a déjà quelque temps dans un billet cherchant à donner une définition du crowdsourcing, qu’il il a pour moi deux voire trois façons d’envisager le crowdsouring.
Après lecture de cette définition, vous comprendrez que MyMusicCircle emprunte la troisième voie bénéficier à la fois des compétences et de la disponibilité de la foule et comme wilogo ou creads emploie à cette fin un système de concours déployés sur la plateforme.
En effet, dès la page d’accueil le schéma résume bien l’ambition première du service :
image
Néanmoins il semble que les créateurs souhaitent aller plus loin en mettant à disposition des membres de la plateforme différents outils : un studio virtuel, un outil de visioconférence pour permettre aux  professionnels et aux clients de communiquer.
De plus  un dispositif permettra à des beatmakers de vendre des pistes audios (battements), aux  chanteurs de vendre des voix, aux mandataires pour vendre les heures facturables,  aux compositeurs pour vendre la musique de feuille, aux fabricants de vendre des paquets pour des T-shirts ou des Cd, etc., directement de leurs différents profils où chaque membre pourra créer son portofolio…
Bien sûr dans ce genre de marché bifaces il est nécessaire de réussir rapidement à faire monter à bord de la plateforme des utilisateurs d’au moins une face du marché.

Le responsable marketing de MyMusicCircle courageux ou utopiste?dit que dans un premier temps, ils éplucheront les annonces postées sur craiglist et prendront contact directement avec les porteurs de projets les plus intéressants pour les inviter à devenir membre.
Au niveau du Business Model le projet semble s’acheminer vers des services premiums à 3 niveaux.
Il s’agit là d’un projet ambitieux et intéressant qui devra faire face à des problématiques stratégiques complexes, difficile de dire aujourd’hui si celui-ci aboutira? Vous y croyez- vous?
 


Bookmark and Share



23 mai 2008

Du Web 2.0 au Crowdsourcing : définition

[Tentative de définition ]
Dans le présent billet, je tente de définir les concepts de Web 2.0 et de Crowdsourcing. Je ne fais pas ici le lien avec les marchés multifaces, mais le lecteur avisé verra se dessiner ces derniers en filigrane... Cela vient du fait que cette définition avait été réalisée en bonne partie avant de de connaitre ce concept et d'examiner la littérature traitant de la question.

Aussi, j'attends vos commentaires sur ces définitions, pour les compléter/modifier. Je m'attacherais alors à expliciter les liens entre Crowdsourcing et marché multiface.
Si vous voyez des voies intéressantes à explorer dans mon mémoire suite à la lecture de ce billet n'hésitez pas à laisser également des commentaires dans ce sens!

Guy Parmentier, Valérie Chanal, Marie Laurence Carron, Xavier Wauthy, Lecocq et bien d'autres chercheurs spécialistes de ces questions ont été invités à consulter ce Blog. Seul X. Wauthy a pour le moment poster un commentaire mais, chacun de vous est mis à contribution dans une optique de recherche ouverte et j'espère que ce blog pourra devenir un espace de partage vivant grâce à vous! N'hésitez pas à invitez d'autres chercheurs intéressés par ces questions.


Du Web 2.0 au Crowdsourcing, tentatives de définition des concepts



Le Crowdsourcing est un concept à la définition encore peu précise. Cela peut s’expliquer par le fait qu’il est issu d’un phénomène plus large : le Web 2.0, dont la définition est encore débattue.
Il nous semble donc nécessaire d’expliciter clairement et simplement ce que nous entendrons comme relevant du Web 2.0 avant de pouvoir caractériser le concept de Crowdsourcing.

Le terme Web 2.0 est utilisé pour désigner une évolution, voir pour certain une révolution du Web. Le Web qualifié de Web 1.0 se caractérisait par des pages figées dont le contenu était créé par l’éditeur du site, ce contenu n’évoluant pas ou peu.
Une première évolution fut amenée par des solutions techniques (langages tels que PHP, SQL…) se basant sur un Web dynamique (parfois appelé Web 1.5), où des systèmes de gestion de contenus servaient des pages Web dynamiques, créées à la volée à partir d'une base de données en constant changement.
Néanmoins si les pages évoluaient à chaque nouvelle génération par le serveur, ces évolutions restaient contrôlées par l’éditeur du site (c’est lui qui programmait ces évolutions/personnalisations du contenu de la page à l’aide de son code source).

Le Web 2.0 propose lui de créer des pages aux contenus réellement évolutif et interactif. Ce changement s’appuie tout d’abord lui aussi sur des solutions techniques (langage XML, technologies RSS, AJAX…). En effet, ces technologies ont rendu possible la multiplication d’interconnexions entre les sites de la toile engendrant le développement de la syndication et de l’agrégation de contenu.
Afin de permettre/faciliter les échanges, un mouvement de standardisation/normalisation a vu le jour. Un style épuré a également été adopté dans un premier temps dans ce même souci d’inter connectivité.
Autre caractéristique du Web 2.0, les utilisateurs eux mêmes sont invités à créer/déposer du contenu sur la page afin de la faire évoluer (exemple wikipédia, youtube…).

La polémique autour du Web 2.0 consiste en fait à savoir si ce phénomène d’évolution du Web est plutôt technique ou social.
Pour notre part, nous rejoignons Huber Guillaud pour qui « le Web 2.0 n’est pas une révolution technique accessible aux seuls développeurs. Il repose sur des outils simples d’utilisation centrés sur l’utilisateur, l’utilisateur en réseau car cet individu n’est pas atomisé, mais bien relié aux communautés qui sont les siennes. »

Plus qu’une évolution du Web, nous pensons que le Web 2.0 se caractérise comme une :

"évolution du rôle des créateurs (professionnels) de sites Web : le créateur de site Web n’est plus un créateur de contenu mais un créateur de plateforme permettant de collecter puis de diffuser le contenu d’utilisateurs. Il s’appuie pour cela sur des solutions techniques plus standardisées permettant l’interconnexion des contenus et des utilisateurs ainsi qu’une plus grande facilité d’utilisation."

Ainsi, de nombreux créateurs de sites ont pu faire fortune en attirant des visiteurs grâce au contenu déposé gratuitement par des utilisateurs. C’est le cas de Youtube pour les vidéos, de Flicker pour les photos… Ce genre de site permet à leurs utilisateurs de mettre en ligne du contenu qui revêt un intérêt pour d’autres utilisateurs et ainsi, à créer un trafic important sur le site. Ce trafic est ensuite valorisé, généralement au moyen de publicité.

Ici le contenu généré par les utilisateurs n’est pas directement une source de revenu pour le créateur du site web. C’est l’agrégation de ce contenu qui présente un intérêt, et chaque contribution individuelle ne serait pas valorisable. C’est pourquoi les utilisateurs acceptent de le déposer sans contrepartie.

Désormais, certains sites vont plus loin et commencent à valoriser directement le contenu/ ou le travail des utilisateurs lui-même. C’est cela qui pour nous relève du Crowdsourcing.

Deux alternatives « extrêmes » sont alors possibles : soit on recherche la compétence, soit on recherche la disponibilité des utilisateurs.
  • Dans le premier cas on simplifie le travail habituellement réalisé par un agent spécialisé en tâches élémentaires qui pourront être accomplies par des utilisateurs lambda (ce qui au passage caractérise une extension du taylorisme, rendu possible par la présence d’Internet). (Un exemple caractéristique de cette pratique est celui de reCAPCHA.net ou http://www.mturk.com/mturk/welcome.) Cette pratique particulièrement efficace pour les tâches à faible valeur ajoutée et répétitives semblent également très prometteuse dans le cadre de projets plus complexes.

  • Dans ce second, on fait l’hypothèse que parmi un grand nombre d’utilisateurs on trouvera les compétences pour mener à bien des projets en leur ensemble mieux qu’une entreprise limitée aurait pu le faire. (Les sites cambrianhouse.com et crowdspirit.com qui illustrent bien nos propos )

Le type de rémunération est le niveau d’implication de l’utilisateur recherché seront eux aussi différents.

  • Dans le premier cas il s’agit d’une simple externalisation, à la nuance près qu’au lieu de s’adresser à un fournisseur déterminé, on réalisera « un appel d’offre public » à tout internaute souhaitant participer en l’échange d’une rémunération à la tâche. Cette rémunération pourra être pécuniaire ou non (ce peut être en l’échange d’un bénéfice informationnel, ludique…). L’implication recherchée sera minime.

  • Dans le second, on organisera une communauté où au contraire on cherchera à impliquer au maximum les utilisateurs. Cette communauté sera alors elle même à l’origine des projets sur lesquelles elle sera sollicitée. En effet, tous pourront suggérer des idées puis la communauté se chargera de les évaluer afin de retenir les plus pertinentes. On demandera ensuite aux utilisateurs de réaliser des contributions plus complexes relevant de leur compétence spécifique. En réalité, la communauté sera découpée en équipe projet évoluant au cours de l’avancé de chaque projet.

Selon que l’on fasse le pari de l’une ou de l’autre de ce ces hypothèses, cela influera l’organisation de l’entreprise ainsi que son modèle de revenu.
En effet, dans le premier cas l’entreprise gardera une organisation relativement classique si ce n’est qu’elle utilisera une main d’œuvre dispersée, qu’elle pourra rémunérer faiblement et à la tâche. Elle tirera alors tout ou part, de ses revenus en valorisant le travail de cette main d’œuvre bon marché (par la vente de services généralement). Ici, ce sera l’entreprise qui décidera comment créer de la richesse et qui rétribuera pécuniairement ou non les participants.
Dans le second cas, l’entreprise a pour rôle d’animer la communauté, de veiller à son bon fonctionnement et à sa notoriété et de créer des « outils de travail collaboratifs » performants. Elle devra également assurer la protection du travail de la communauté et faciliter l’enchaînement des tâches du processus. Dans cette hypothèse c’est la communauté qui créera de la richesse et rémunérera l’entreprise au pourcentage. La communauté fonctionne alors comme ce que nous appellerons une « entreprise ouverte » où chaque internaute ayant une compétence pourra jouer son rôle sur tel ou tel projet.

Entre ces deux groupes « extrêmes », des entreprises ont bien senti le pouvoir des communautés virtuelles et l’émergence d’un savoir faire semi professionnel (toujours plus qualifié) parmi les internautes mais, elles ne sont pas prêtes à abandonner le système classique consistant à réaliser un projet pour un donneur d’ordre (externe à la communauté). Leur modèle économique est fortement influencé par le Business Model dit de «courtier » consistant à « rapprocher une demande et une offre, à faciliter la transaction, et à se faire payer pour cette prestation ». La particularité de leur proposition de valeur consiste alors à favoriser le donneur d’ordre en faisant travailler un grand nombre de contributeurs (issu de la communauté) sur son cahier des charges et à ne récompenser que les contributions qu’il retiendra. Cela se concrétise sous forme de concours proposés aux membres de la communauté où à une partie d’entre eux triés sur le volet. Autre intérêt de cette proposition de valeur, les membres de la communautés voir l’ensemble des internautes, peuvent évaluer les contributions ce qui facilite le travail de sélection du donneur d’ordre. (Le site Wilogo.com semble bien illustrer nos propos).
Bien entendu, ces 3 catégories ne sont pas figées et de nombreux sites mixent déjà ces approches.

En retenant cette définition élargie du crowdsourcing, vous semblent-il pertinent de mettre ce concept en perspective avec les travaux sur les marchés multifaces? Voyez vous déjà quelques voies pour le faire?




Related Posts with Thumbnails

Derniers Commentaires