Des rançongiciels, (ransomware en anglais), est un logiciel malveillant qui prend en otage des données personnelles. aux botnets,(de l’anglais, contraction de «robot» et «réseau») est un réseau de bots informatiques, des programmes connectés à Internet qui communiquent avec d’autres programmes similaires pour l’exécution de certaines tâches. Les logiciels malveillants prennent des formes apparemment infinies et prolifèrent sans cesse. Les humains qui défendraient nos ordinateurs sont en train de se noyer face à l’assaut, alors ils se tournent vers l’IA pour obtenir de l’aide.

Il n’y a qu’un seul problème : les outils d’apprentissage machine ont besoin de beaucoup de données. C’est parfait pour des tâches comme la vision par ordinateur ou le traitement du langage naturel, où de grands ensembles de données de source ouverte sont disponibles pour enseigner aux algorithmes à quoi ressemble un chat, par exemple, ou comment les mots sont liés les uns aux autres. Dans le monde des logiciels malveillants, une telle chose n’existait pas jusqu’à présent.

Cette semaine, la société de cybersécurité Endgame a publié un grand jeu de données open-source appelé EMBER (pour « Endgame Malware Benchmark for Research »). EMBER est une collection de plus d’un million de représentations de fichiers exécutables Windows, un format où les logiciels malveillants se cachent souvent. Une équipe de l’entreprise a également publié un logiciel d’IA qui peut être formé sur l’ensemble de données. L’idée est que si l’intelligence artificielle doit devenir une arme puissante dans la lutte contre les logiciels malveillants, il faut qu’elle sache ce qu’il faut rechercher.

Les entreprises de sécurité disposent d’une mer de données potentielles pour former leurs algorithmes, mais c’est un avantage mitigé. Les mauvais acteurs qui fabriquent des logiciels malveillants modifient constamment leur code dans le but de rester en avance sur la détection, de sorte qu’une formation sur des échantillons de logiciels malveillants qui sont périmés pourrait s’avérer un exercice futile.

« C’est un jeu de whack-a-mole », dit Charles Nicholas, professeur d’informatique à l’Université du Maryland, dans le comté de Baltimore.

EMBER est destiné à aider les programmes automatisés de cybersécurité à se maintenir à jour.

Au lieu d’une collection de fichiers réels, qui pourrait infecter l’ordinateur de tout chercheur qui les utilise, EMBER contient une sorte d’avatar pour chaque fichier, une représentation numérique qui donne à un algorithme une idée des caractéristiques associées aux fichiers bénins ou malveillants sans l’exposer à l’article authentique.

Cela devrait aider les membres de la communauté de la cybersécurité à former et à tester rapidement un plus grand nombre d’algorithmes, ce qui leur permettra de construire des IA plus efficaces et plus adaptables pour la recherche de programmes malveillants.

Bien entendu, le fait de rendre l’ensemble des données accessibles à tous pourrait également constituer une responsabilité si elles tombaient entre de mauvaises mains. Les créateurs de logiciels malveillants pourraient utiliser les données pour concevoir des systèmes que la chasse aux virus ne reconnaîtra pas, un problème que Hyrum Anderson, directeur technique de la science des données de Endgame, dit que l’entreprise a bien réfléchi. Anderson, qui a travaillé sur EMBER, dit qu’il espère que les avantages de cette ouverture l’emportent sur les risques. En outre, la cybercriminalité est si lucrative que les auteurs de logiciels malveillants sont déjà bien motivés pour continuer à perfectionner leurs outils d’attaque.

« Le pirate trouvera quand même un exemple « , dit Gerald Friedland, professeur d’informatique à l’Université de Californie, Berkeley.

https://www.technologyreview.com/

Laisser un commentaire