Publicités

Vous vous méfiez de Google reCaptcha ? Voici une alternative populaire

Vous vous méfiez de Google reCaptcha ? Voici une alternative populaire

hCaptcha aide les entreprises d’apprentissage automatique à taguer leurs données, à payer les éditeurs pour leurs difficultés et les utilisateurs ne font pas la différence.

À l’automne 2018, Google a publié une nouvelle version de reCaptcha, le détecteur de bot largement utilisé de la société. reCaptcha v3, comme son nom l’indique, est excellent pour détecter les robots mais il a un côté obscur, car les chercheurs soupçonnent que Google compromet la vie privée des utilisateurs pour alimenter le système. (on commence à s’y habituer).

Heureusement, il y a une alternative à reCaptcha pour les propriétaires de sites Web qui ne font pas confiance à Google – et qui pourraient avoir besoin d’un peu d’argent supplémentaire.

Appelé hCaptcha, c’est un détecteur de robot qui agit comme les utilisateurs de captchas y sont déjà habitués, où on leur demande d’étiqueter ce qu’ils voient dans différentes images. Mais au lieu de montrer les images – images de Google que la société utilise pour former ses algorithmes d’apprentissage machine, Captcha montre aux utilisateurs des images provenant d’ensembles de données, qui appartiennent à d’autres sociétés qui ont également besoin d’images étiquetées pour des applications d’apprentissage machine. En théorie, le service aide tout le monde : vous prouvez que vous n’êtes pas un robot tout en aidant les entreprises à affiner leurs algorithmes, et les sites Web gagnent de l’argent sur l’ensemble du marché.


[Image : gracieuseté de hCaptcha]

Parce qu’un étiquetage précis est si précieux pour ces entreprises, les sites Web qui hébergent hCaptcha sont payés en fonction du nombre d’utilisateurs qui cliquent sur hCaptcha et répondent aux questions avec succès. Selon leur trafic et le nombre de robots qui les attaquent, les sites Web peuvent rapporter des milliers de dollars par mois. C’est une bonne affaire pour les entreprises d’apprentissage automatique qui ont besoin de gens pour étiqueter leurs données, et pour les sites Web qui veulent la sécurité d’une captcha – et un peu d’argent supplémentaire. Quant aux utilisateurs : L’expérience reste la même que d’habitude, bien que vous puissiez voir la différence si vous regardez de près, car il y aura un logo hCaptcha à la place du symbole reCaptcha auquel vous êtes habitué. Aujourd’hui, 10 millions de personnes interagissent avec hCaptcha chaque mois sur des milliers de sites Web, alimentant des dizaines à des centaines de projets d’apprentissage machine – étiquetage à la fois.
hCaptcha (le « h » signifie humain) est l’idée d’Eli-Shaoul Khedouri, un entrepreneur de longue date et expert en IA qui a fondé la société d’apprentissage machine Intuition Machines en 2017. Chez Intuition Machines, Khedouri et son équipe construisent des algorithmes d’apprentissage machine à grande échelle pour les entreprises du top 50 Fortune. Bien que M. Khedouri ait refusé de partager des détails en raison d’accords de non-divulgation, il a dit à Fastcompany que Intuition crée des algorithmes qui peuvent faire des choses comme analyser le contenu des vidéos. Pour accomplir de telles tâches, les modèles d’Intuition nécessitent des millions, voire des milliards de points de données, dont la plupart doivent être étiquetés par des personnes. Une fois qu’ils ont les vidéos ou images annotées, l’équipe d’Intuition peut commencer à enseigner à un algorithme comment reconnaître ce qui se passe dans une vidéo. « En fait, nous avons fini par faire du captcha par accident parce que nous étions devenus un gros consommateur de main-d’œuvre [annotation humaine] « , explique M. Khedouri. « Les services disponibles n’étaient pas vraiment ce que nous voulions. »


[Image : gracieuseté de hCaptcha]

Trouver suffisamment de personnes pour étiqueter des ensembles de données aussi vastes a été un défi de taille. Tout d’abord, Khedouri a essayé de constituer sa propre équipe au Vietnam qui pourrait annoter les ensembles de données. Mais certains jours, il avait assez de travail pour 12 personnes, et d’autres jours, il en avait assez pour 50. Étant donné que la quantité de données à étiqueter a tellement changé en fonction des projets sur lesquels l’équipe travaillait, avoir une équipe à temps plein n’était pas la solution la plus rentable (même si c’était probablement mieux pour les travailleurs).

Au lieu de cela, Khedouri s’est tourné vers les travailleurs de fermes de captcha qui sont payés une fraction d’un centime pour résoudre les captchas sur Internet (le même genre de métier que les éboueurs du web qui trient les images offensantes publiées sur les réseaux sociaux dont je vous parlais ici.) Son équipe a construit une plateforme pour que les « fermiers » captcha puissent étiqueter les ensembles de données pour les machines de chez Intuition, et a conçu des mesures pour évaluer la précision de l’étiquetage de chaque fermier. C’était le moyen le plus efficace et le moins coûteux pour Khedouri d’étiqueter ses données, en temps réel.

hCaptcha a les mêmes origines que cette plate-forme que Khedouri a construite spécialement pour Intuition, mais depuis janvier 2019, elle est ouverte à toute entreprise qui a besoin d’ensembles de données étiquetés. Et au lieu de captcha agriculteurs qui font l’étiquetage, ce sont des utilisateurs réguliers de l’Internet comme vous et moi. Selon le site Web de hCaptcha, les entreprises paieront environ 1 111 $ pour un million d’images qui nécessitent chacune une étiquette.

Bien sûr, les utilisateurs pourraient s’opposer à l’idée de faire du travail gratuit pour les entreprises, un phénomène omniprésent dans le monde de la technologie. Khedouri a mis en place hCaptcha pour que tous les paiements effectués aux sites Web soient publiés via le Protocole humain, un registre décentralisé qui fonctionne en haut de la blockchain Ethereum. Cela signifie que vous êtes au moins en mesure de voir quels sites Web gagnent de l’argent grâce à votre travail, mais pas à quoi serviront les données que vous étiquetez. (Tous les projets d’étiquetage des données font l’objet d’accords de non-divulgation parce qu’ils s’adressent surtout aux grandes entreprises, explique M. Khedouri.)

hCaptcha offre donc une alternative plus transparente, sinon parfaite, à l’un des services gratuits les plus répandus de Google. Ce faisant, il rejoint les rangs des plus petits services de navigation, de recherche et d’analyse vers lesquels les personnes axées sur la protection de la vie privée peuvent se tourner si elles veulent échapper à la portée omniprésente du géant de la technologie.

Peut-être que vous le saviez ou pas, mais voilà, quasiment aucune de nos actions en ligne n’est pas monnayée…

Publicités

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

%d blogueurs aiment cette page :