Les élites littéraires adorent représenter le vocabulaire de Shakespeare : sur l’ensemble de son corpus, il utilise 28 829 mots, ce qui suggère qu’il connaissait plus de 100 000 mots et qu’il possédait sans doute le plus grand vocabulaire jamais vu.

Matt Daniels a décidé de comparer ce point de données avec les artistes les plus célèbres du hip hop. Il utilisé les 35 000 premières paroles de chaque artiste. Ainsi, les artistes prolifiques, comme Jay-Z, pourraient être comparés aux artistes plus récents, comme Drake.

(ps. Obtenez ce projet sous forme d’affiche sur Pop Chart Lab  Il inclut 40 autres rappeurs dans l’analyse, dont Childish Gambino, 2 Chainz, Immortal Technique, et Kendrick Lamar.

35 000 mots pour 3 à 5 albums studio. Sont incluses les mixtapes si l’artiste était proche des 35 000 mots. Beaucoup de rappeurs n’ont pas assez de matériel officiel pour être inclus (ex. : Biggie, Kendrick Lamar). Comme point de repère, sont inclus des points de données pour Shakespeare et Herman Melville, en utilisant la même approche (35 000 mots sur plusieurs pièces pour Shakespeare, les premiers 35 000 de Moby Dick).

Il a utilisé une méthodologie de recherche appelée analyse symbolique pour déterminer le vocabulaire de chaque artiste. Chaque mot est compté une fois, donc les pimpspimppimping, and pimpin sont quatre mots uniques. Pour éviter les problèmes avec les apostrophes (p. ex.,pimpin’ vs. pimpin), ils sont supprimés de l’ensemble de données. Ce n’est toujours pas parfait. Le hip-hop est rempli d’argot difficile à transcrire (p. ex., shorty vs. shawty), de mots composés (p. ex., king shit), de chanteurs vedettes et de chœurs répétitifs.

C’est toujours intéressant sur le plan directionnel. Des 85 artistes de l’ensemble de données, regardons qui est en tête de liste.

#1 – AESOP ROCK

Quand cette analyse a été publiée pour la première fois, Aesop Rock était exclu, jugé trop obscur. La communauté hip hop de Reddit était en ébullition, affirmant qu’Aesop serait absolument #1. Bien sûr, Aesop Rock est bien au-dessus de tous les artistes de cette base de données d’où la nécessité de l’ajouter à la liste. En fait, son point de référence est tellement à droite qu’il devrait être en dehors du graphique.

#2, #6, #7, #9, #9, #20, ET #23 – WU-TANG CLAN AINT NOTHINGHIN TA FUCK WIT WIT

Wu-Tang Clan n°6 est vraiment impressionnant étant donné que 10 membres, avec des styles très différents, contribuent également aux paroles. Ajoutez à cela le fait que GZA, Ghostface, Raekwon, et Method Man sont également dans le top 20 – notamment, GZA au #2. Peut-être que leurs innombrables heures de studio ensemble (et le mentorat de RZA) ont exposé le vocabulaire de chaque rappeur les uns aux autres.

Jetons un coup d’oeil plus approfondi sur les cinq albums studio de Wu-Tang pour mieux comprendre la contribution de chaque membre. Voici une ventilation du nombre et du pourcentage de mots utilisés par chaque membre.

Pour comprendre le vocabulaire de chaque rappeur (nombre de mots uniques) dans les cinq premiers albums du Wu-Tang, il a choisi un seuil de 3 500 mots pour que chacun soit sur un pied d’égalité. De cette façon, il est possible d’inclure GZA, mais malheureusement exclure Ol’ Dirty Bastard, Cappadonna et Masta Killa, qui ont trop peu de versets dans le corpus du Wu-Tang.

U-God et GZA renforcent nettement la moyenne du groupe. Les contributions de Raekwon et Method Man ont une moyenne inférieure à celle des autres membres, mais reconnaissent que leurs points de données dépasseraient la plupart des artistes du hip hop.

#3 – 5 – KOOL KEITH, CANIBUS, CUNNINLYNGUISTES

Au-delà de la domination du Wu-Tang, les trois artistes suivants sont relativement moins connus. Des trois, Kool Keith a le vocabulaire le plus diversifié. Pour un avant-goût de son travail, jetez un coup d’oeil à son album avec le plus grand vocabulaire : Dr Octagonecologiste. Les numéros 2 et 3 sont deux oeuvres relativement confidentielles (mais accomplies) : Le rappeur jamaïcain Canibus et le groupe Cunnin-Lyguists basé dans le sud.

14 – 15 – OUTKAST ET E-40

Bien sûr, E-40 est dans le top 20 ; il est considéré comme l’inventeur de beaucoup d’argot. Juste quelques-uns dont il a été responsable : tous les all good, pop ya collar, shizzle, et you feel me.

Au numéro 15, le vocabulaire profond d’Outkast est certainement une fonction de leur style : utilisation fréquente de portmanteau (p. ex., ATLiens, Stankonia), d’expressions du sud (p. ex., nahmsayin, ery’day) et d’argot inventé (p. ex., flawsky-wawsky).

Comme on pouvait s’y attendre, d’autres groupes du sud ne sont pas de la trempe d’Outkast. Jetez un coup d’œil à la répartition régionale ci-dessous :

Le sud a la moyenne la plus basse (4 268) et la côte est la plus haute (4 804). En fait, seulement 4 des 17 artistes du Sud de l’ensemble de données sont au-dessus de la moyenne. C’est une fonction du style d’appel et de réponse de la musique crunk, ce qui entraîne une plus grande répétition des mots.

#26 ET #33 – BUSTA RHYMES ET TWISTA

Comme les deux rappeurs sont connus pour leur vitesse, c’est bien de voir que leurs couplets sont aussi variés que ceux de leurs pairs.

67, 68, 71 ET 72 – SNOOP DOGG, 2PAC, KANYE WEST ET LIL WAYNE.

Certains des plus grands noms du hip hop étaient dans les 20% inférieurs. Examinons à nouveau les données :

Bien que Lil Wayne n’ait jamais été célébré pour la complexité de ses choix de mots, on aurait pu s’attendre à ce que 2pac, Snoop et Kanye soient bien au-dessus de la moyenne.

Il est également à noter que Drake, l’un des artistes les plus populaires de ces derniers temps, est au 83e rang de cette liste.

85 – DMX

Au numéro 85 et à la dernière place : DMX. Mais cela ne doit pas porter atteinte à un artiste dont l’énergie brute et l’honnêteté sont les qualités les plus mémorables de sa musique.

Alors, qu’est-ce que ça veut dire ?

L’écrivain Robert Gonzalez, écrivain de la série io9, a ce point de vue : « Sur le morceau ‘Moment of Clarity’ de The Black Album, Jay-Z oppose son lyrisme à celui de Common et Talib Kweli (les deux « rang » supérieurs à lui, quand il s’agit de la diversité de leur vocabulaire) :

I dumbed down for my audience to double my dollars

They criticized me for it, yet they all yell « holla »

If skills sold, truth be told, I’d probably be

Lyrically Talib Kweli

Truthfully I wanna rhyme like Common Sense

But I did 5 mil – I ain’t been rhyming like Common since

The Pudding

Publicités

2 commentaires »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.