Tech&Co
Vie numérique

L'intelligence artificielle au secours de Wikipedia pour détecter les spammeurs

-

- - Wikipedia

L’encyclopédie en ligne lance Ores, un service capable de repérer les contributions malveillantes et de proposer une aide aux auteurs de bonne foi qui éditent des textes avec des erreurs.

Wikipedia aussi se fait spammer! Des milliers articles sont édités chaque jour sur l’encyclopédie en ligne et parmi eux, un certain nombre de textes polluent l’ensemble. Pour éviter cela, le site s’abritait jusqu’à maintenant derrière des règles strictes de contribution et des modérateurs prompts à la censure pouvant décourager les internautes. Les collaborations auraient ainsi décliné de 40 % au cours des huit dernières années. Une situation qui devrait évoluer grâce un nouvel outil: Ores (Objective Revision Evaluation Service).

Ores émet un avis comme un professeur

Pour maintenir la qualité de la production et trier le bon grain de l’ivraie, la fondation Wikimedia lance ce service basé sur des algorithmes de machine learning. Ores est ainsi capable d’identifier le degré de sincérité d’un texte. Le second degré et le sarcasme ne sont toutefois fois pas encore aisément identifiés. Ores peut aussi repérer les articles comportant des erreurs non intentionnelles. 

Il émet ensuite un avis, un peu à la manière d'un professeur : "de bonne foi", "à revoir", "vandalisme". Les modérateurs en sont avertis et peuvent signifier aux auteurs qu’ils doivent revoir leur copie. Mais Wikimedia espère surtout, de cette façon, les inviter à la clémence et ainsi encourager davantage de contributions.

Pour parvenir à ce résultat, des modèles d'articles représentatifs ont été sélectionnés par des éditeurs et ont fourni une première base de données servant de point de comparaison. Ores s'est ensuite perfectionné durant les mois de tests qui ont suivi.

Le service est désormais disponible dans 14 langues (allemand, anglais, espagnol, estonien, néerlandais, perse, français, hébreu, indonésien, italien, portugais, turque, ukrainien et vietnamien) et a déjà produit 45 millions de révisions.

Amélie Charnay