Calculs distribués sur des données massives

Bonjour,

Après une lecture très claire du cours je bloque depuis un moment sur l'exécution du tuto wordcount dans la version java ooc_cours1_wordcount.jar après la compilation sans erreur ainsi que dans la version Python avec l'utilisation de hadoop-streaming.jar, avec toujours la même erreur :

Erreur : impossible de trouver ou charger la classe principale org.apache.hadoop.mapreduce.v2.app.MRAppMaster

Ce cours a plus de deux ans et je suis maintenant en hadoop-3.2.1, python 3.8.2, JDK 8. Cette config. a bien fonctionné avec les tutos Hadoop du cours "Créez votre Data Lake" avec mes 3 datanodes adaptés en LAN (utilisation de HDFS, Fastavro et Spark).

J'ai beau vérifier la config. Hadoop, MapReduce et Yarn ou forcer l'export des variables et classpath dans le .bashrc ou dans les fichiers de config, rien n'y fait, toujours la même erreur, peu documentée dans le version 3 d'Hadoop. Un job MapReduce démarre, puis impossible d'allouer un container Application.

Auriez-vous une idée sur cette erreur qui me semble pourtant basique ?

Merci d'avance.

console

-
Edité par lip1024 3 juin 2020 à 17:42:31

Familiarisez-vous avec Hadoop

Calculs distribués sur des données massives

Supprimer

Modérer

Signaler le message aux modérateurs