Dans l’écosystème Hadoop, le stockage des données se fait sur le système de fichier HDFS. L’accès à une donnée ponctuelle stockée dans un fichier, revient à faire un « full scan » sur tout le cluster ou du moins sur une partie. Une opération coûteuse en temps et en calcul.
Accéder à cette … Lire la suite