Cette carte offre une façon alternative de parcourir les 2 619 833 images contenues dans la collection de livres des Archives Internet. Elle montre 5500 sujets différents qui ont été disposés algorithmiquement par leurs relations thématiques. La taille de chaque lien ressemble à la quantité d’images disponibles pour ce sujet. Cliquez sur un lien pour ouvrir la page flickr contenant toutes les images de ce sujet. Le fait de cliquer sur un lien mettra en évidence tous les sujets qui ont un lien direct avec le sujet.

La carte peut être déplacée à l’aide de la souris et vous pouvez effectuer un zoom avant ou arrière à l’aide de la molette de la souris ou de gestes multi-touch. Vous pouvez également utiliser le champ de recherche de votre navigateur pour trouver et mettre en surbrillance les sujets qui vous intéressent (appuyez sur CTRL-F sur votre clavier pour l’ouvrir).

Note: sur les écrans tactiles qui ne supportent pas le survol du premier clic sur un lien, les sujets associés seront mis en évidence et le second clic ouvrira la page flickr.

Les données de relation pour cette carte ont été générées en récupérant d’abord toutes les balises des images d’Internet Archive sur flickr et en connectant ensuite les sujets qui apparaissent ensemble sur une image. La matrice de similarité résultante a été traitée en utilisant la technique t-Distributed Stochastic Neighbor Embedding (t-SNE) qui regroupe les sujets par la force de leur relation. Lors de la dernière étape, la mise en page est automatiquement nettoyée afin qu’aucun bloc de texte ne se superpose.

Le caractère automatique du processus explique aussi certaines particularités de la mise en page résultante: parfois, un sujet qui fait clairement partie d’un cluster est placé très loin.

Allez voir ici.

 

1 commentaire »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.