Partage
  • Partager sur Facebook
  • Partager sur Twitter

[COURS] Analyse exploratoire de données

ACP et clustering

    Team OC 20 septembre 2018 à 17:32:53

    Bonjour ! Voilà le fil de discussion dédié au cours Réalisez une analyse exploratoire de données.

    N'hésitez pas à poser vos questions ici et à échanger les uns avec les autres ! Si vous ne trouvez pas les réponses parmi la communauté, j'essaierai d'y répondre.

    Si vous avez une question concernant le fonctionnement du cours (accès aux exercices, envoi des exercices, inscription au cours…), contactez directement OpenClassrooms à hello@openclassrooms.com

    Bon courage et à bientôt !

    • Partager sur Facebook
    • Partager sur Twitter
      18 octobre 2018 à 7:30:54

      Bonjour,

      Merci pour ce cours très intéressant. Savez-vous quand les vidéos seront ajoutées ?

      Bonne journée,

      • Partager sur Facebook
      • Partager sur Twitter
        12 novembre 2018 à 5:47:20

        Bonjour, 

        J'ai aussi trouvé le cours très intéressant, merci à vous pour votre travail !

        • Partager sur Facebook
        • Partager sur Twitter
          Team OC 12 novembre 2018 à 10:45:48

          AlexandreBardiaux a écrit:

          Bonjour,

          Merci pour ce cours très intéressant. Savez-vous quand les vidéos seront ajoutées ?

          Bonne journée,


          Les vidéos sont ajoutées ;)
          • Partager sur Facebook
          • Partager sur Twitter
            4 décembre 2018 à 13:28:27

            Bonjour,

            Existe-t-il une version R des codes en Python fournis dans le cadre du cours?

            Merci,

            Alexandre.

            • Partager sur Facebook
            • Partager sur Twitter
              Team OC 10 décembre 2018 à 12:07:31

              Bonjour Alexandre,

              Malheureusement, il n'y a pas de version R à l'heure actuelle.

              En R, les fonctions sont déjà toutes faites et il y a beaucoup moins de code. Si vous avez compris le principe, c'est déjà très bien. Pour le code en question, je vous invite à regarder ces ressources (qui se répètent un peu entre elles) :

              http://factominer.free.fr/index_fr.html

              • Factominer est un package phare en R spécialisé dans l’analyse exploratoire multivariée (ACP, CAH, etc.) Retrouvez un exemple d’ACP avec Factominer à cette adresse.

              http://www.sthda.com/english/articles/31-principal-component-methods-in-r-practical-guide/117-hcpc-hierarchical-clustering-on-principal-components-essentials/

              • Tutoriel en anglais de clustering avec Factominer.

              http://www.grappa.univ-lille3.fr/~ppreux/ensg/miashs/fouilleDeDonneesII/tp/segmentation-hierarchique/

              https://datascienceplus.com/k-means-clustering-in-r/

              • Si vous travaillez avec R, regardez le code de ces deux ressources.

              alexandrevitet a écrit:

              Bonjour,

              Existe-t-il une version R des codes en Python fournis dans le cadre du cours?

              Merci,

              Alexandre.



              • Partager sur Facebook
              • Partager sur Twitter
                14 décembre 2018 à 16:36:06

                Bonjour Nicolas et la communauté!

                Tout d'abord merci pour vos cours! Ils sont très clairs et facile à appliquer!

                J'ai plusieurs questions...

                Je débute en Python et j'aurais aimé savoir faire le fameux "zoom" dans la slide "TP: Réalisez une ACP" sur le cercle des corrélations  et la projection des individus dans l'acp. Pourriez-vous m'aider sur ce point?

                Aussi, je m'intéresse à l'ACM (Analyse des correspondances multiples pour les variables qualitatives) et l'AFDM (Analyse Factorielle de Données mixtes pour variables qualitatives et quantitatives). Les pages Wikipédia et les cours théoriques de François Husson sur Youtube sont de bonnes bases à mon sens, mais je n'ai pas trouvé de documentations pratiques françaises "claires" faisant lien avec Python.

                #J'ai installé avec grande difficulté le module mca pour l'ACM mais je suis incapable de l'utiliser au vue de mon niveau de connaissance Python... https://pypi.org/project/mca/#description

                Est-ce que vous auriez 2 exemples de code python "tout fait" pour ces 2 cas respectivement ACM et AFDM avec les types de tableaux en entrée si possible... (par exemple, je crois savoir que pour l'ACM, il faut convertir les variables quantitatives en modalités binaires (1 ou 0) avec l'aide de FactoMiner sous R, c'est peut être la même chose sous Python)? 

                Encore merci pour votre aide!

                Bon week-end à tous!

                Francko

                • Partager sur Facebook
                • Partager sur Twitter
                  15 janvier 2019 à 16:38:29

                  Bonjour,

                  Au chapitre "Téléchargez les jeux de données analysés dans ce cours" le script n'a pas pu être exécuté comme le dashboard d'Open Classrooms ne contient plus de colonne "Score" pour chaque cours depuis un mois ou deux.

                  J'ai le message d'erreur suivant à l'exécution du script : "Error: La colonne 'Score' n'a pas été trouvée dans la page html. Êtes-vous bien sur votre page d'accueil ? ..."

                  Serait il possible de faire une mise à jour du script ? Ou qu'Open Classrooms remette la colonne manquante ?

                  Cordialement

                  • Partager sur Facebook
                  • Partager sur Twitter
                    25 janvier 2019 à 5:58:47

                    Bonjour,

                    J'ai le même soucis que huynguyen2. Problème avec la colonne Score.

                    Une solution est de supprimer cette colonne dans le code javascript (supprimer la ligne 10) mais il manquera certainement une variable dans le dataset.

                    Bruno

                    • Partager sur Facebook
                    • Partager sur Twitter
                      11 février 2019 à 13:34:19

                      Bonjour,

                      Dans le chapitre " Comprenez l'enjeu de l'Analyse en Composantes Principales", je n'ai pas compris comment sont calculés les coefficients des combinaisons linéaires entre les variables et l'axe principal d'inertie.

                      Exemple : F1 = 0.8x + 0.6y

                      Je vous remercie pour votre éclairage.

                      Mathieu

                      • Partager sur Facebook
                      • Partager sur Twitter
                        12 mars 2019 à 11:36:58

                        Bonjour,

                        Même requête que huynguyen2 et umogo concernant la possibilité de télécharger les datas de notre dashnoard personnel.  Je connais pas assez le JS pour pouvoir faire la modif' moi-même.

                        Il est plus intéressant de faire ce cours avec son propre jeu de données car cela nous permet de mieux comprendre et déjà de "pratiquer" un peu et d'avoir des résultats un peu différents de l'exemple.

                        Merci pour votre retour sur ce point.

                        Cordialement

                        • Partager sur Facebook
                        • Partager sur Twitter

                        [COURS] Analyse exploratoire de données

                        × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                        • Editeur
                        • Markdown