Partage
  • Partager sur Facebook
  • Partager sur Twitter

Calculs distribués sur des données massives

Familiarisez-vous avec Hadoop

    3 juin 2020 à 17:41:05

    Bonjour,

    Après une lecture très claire du cours :) je bloque depuis un moment sur l'exécution du tuto wordcount dans la version java ooc_cours1_wordcount.jar après la compilation sans erreur ainsi que dans la version Python avec l'utilisation de hadoop-streaming.jar, avec toujours la même erreur :

    Erreur : impossible de trouver ou charger la classe principale org.apache.hadoop.mapreduce.v2.app.MRAppMaster

    Ce cours a plus de deux ans et je suis maintenant en hadoop-3.2.1, python 3.8.2, JDK 8. Cette config. a bien fonctionné avec les tutos Hadoop du cours "Créez votre Data Lake" avec mes 3 datanodes adaptés en LAN (utilisation de HDFS, Fastavro et Spark).

    J'ai beau vérifier la config. Hadoop, MapReduce et Yarn ou forcer l'export des variables et classpath dans le .bashrc ou dans les fichiers de config, rien n'y fait, toujours la même erreur, peu documentée dans le version 3 d'Hadoop. Un job MapReduce démarre, puis impossible d'allouer un container Application.

    Auriez-vous une idée sur cette erreur qui me semble pourtant basique ?

    Merci d'avance.

    console

    -
    Edité par lip1024 3 juin 2020 à 17:42:31

    • Partager sur Facebook
    • Partager sur Twitter

    Calculs distribués sur des données massives

    × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
    × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
    • Editeur
    • Markdown