Partage
  • Partager sur Facebook
  • Partager sur Twitter

[Cours] Machine learning supervisé linéaire

Entraînez un modèle prédictif linéaire

    6 juillet 2017 à 18:04:19

    Bonjour ! Voilà le fil de discussion dédié au cours Entraînez un modèle prédictif linéaire.

    Dans ce cours, vous allez apprendre à entraîner des algorithmes linéaires de régression et de classification : régression linéaire et logistique, leurs versions régularisées (ridge, lasso, elastic net), et SVMs en particulier. Vous apprendrez aussi à utiliser des algorithmes de classification binaire pour faire de la classification multi-classe.

    N'hésitez pas à poser vos questions ici et à échanger les uns avec les autres ! Je ferai de mon mieux pour vous répondre régulièrement.

    Si vous avez une question concernant le fonctionnement du cours (accès aux exercices, envoi des exercices, inscription au cours…), contactez directement OpenClassrooms : http://oc.cm/contact

    Bon courage et à bientôt !

    -
    Edité par OsitoLoco1 22 septembre 2022 à 17:59:19

    • Partager sur Facebook
    • Partager sur Twitter
      10 juillet 2017 à 17:36:24

      Bonjour Chloé-Agathe,

      1. Il semble que le fichier "prostate" accessible via le lien ne soit pas le même (en CSV et surtout sans la colonne de booléen), ce qui nécessite de faire +1 dans les indices pour créer X et y, par exemple pour X :

      X_train = raw_data.iloc[:60,1:-2]

      2. Il manque la déclaration du ridge, je suppose :

      from sklearn.linear_model import Ridge
      ridge = linear_model.Ridge()

      Les cours ML sont excellents, merci.

      Olivier

      -
      Edité par OlivierChotin 10 juillet 2017 à 17:52:19

      • Partager sur Facebook
      • Partager sur Twitter
        11 juillet 2017 à 5:20:22

        Bonjour a tous,

        j'aurais une petite question, dans le premier projet a rendre, on demande deux amelioration de model, est ce que utilise get_dummies pour les categories en est une ? a fin de convertire les arrondissements en feature. Je ne vois pas d autre type de chose que je dois faire, peut etre utilise une regression avec un polynome?

        Merci et bonne journee

        • Partager sur Facebook
        • Partager sur Twitter
          10 août 2017 à 8:54:57

          Bonjour,

          le lien vers le fichier du cancer de la prostate me renvoie une page 404, est-ce que vous avez un autre emplacement ?

          • Partager sur Facebook
          • Partager sur Twitter
            14 septembre 2017 à 7:28:47

            Bonjour,

            en ce qui concerne le quizz 1, j'obtiens une valeur différente (0.0346878)

            de la correction concernant la question de détermination de beta pour les valeurs. Bien cordialement

            X y
            -0.78768 -34.59703199
            -1.51760513 -30.79543532
            0.74416271 19.31018182
            -0.62288928 -19.44809959
            • Partager sur Facebook
            • Partager sur Twitter
              4 octobre 2017 à 15:04:11

              Bonjour, pour le quizz j'obtiens également sur Excel un beta différent.

              En ce qui concerne le jeu de donnée du TP - Comparez le comportement du lasso et de la régression ridge , il est inaccessible. Pouvez vous le rendre accessible asap?

              merci

              • Partager sur Facebook
              • Partager sur Twitter
                17 octobre 2017 à 17:43:08

                Bonjour,

                Vos retours ont bien été traités,

                Bonne journée
                • Partager sur Facebook
                • Partager sur Twitter
                  23 avril 2018 à 13:53:11

                  bonjour, 

                  j ai eu un algorithme TSNE des données numeriques,  j ai eu des classes des données mais j ai pas pu lire ces classes et comment interpreter les resultats obtenus .

                  Merci de votre aide

                  • Partager sur Facebook
                  • Partager sur Twitter
                    25 mai 2018 à 12:31:56

                    Bonjour à tous

                    Un plaisir de joindre ce forum

                    • Partager sur Facebook
                    • Partager sur Twitter
                      21 août 2018 à 8:27:23

                      Concernant l'évaluation 1ère partie, je ne trouve pas du tout le béta de la correction, si on pouvait avoir votre calcul détaillé.

                      Concernant le TP : il y a un problème manifeste sur les données car le Ridge sur données standardisées n'a pas d'effet positif (réduction de l'erreur quadratique comparée à la baseline).

                      par ailleurs, votre version cours n'intègre pas la standardisation ni l'import de Ridge...

                      Je pense qu'il y a un bug quelque part non ?

                      • Partager sur Facebook
                      • Partager sur Twitter
                        11 septembre 2018 à 18:32:57

                        Bonjour,

                        Pour le TP final, le second lien ne fonctionne pas. je récupère le fichier d'entrainement mais pas de test.

                        Par contre, quand je vais sur le site, je récupère l'ensemble des fichiers. Cependant, le fichier de test n'a pas d'étiquettes. Est-ce normal?

                        Merci

                        • Partager sur Facebook
                        • Partager sur Twitter
                        José Castro
                          25 novembre 2018 à 12:37:46

                          JoséCastro a écrit:

                          Bonjour,

                          Pour le TP final, le second lien ne fonctionne pas. je récupère le fichier d'entrainement mais pas de test.

                          Par contre, quand je vais sur le site, je récupère l'ensemble des fichiers. Cependant, le fichier de test n'a pas d'étiquettes. Est-ce normal?

                          Merci


                          Bonjour,

                          Je suis dans la même situation. Peut-on avoir un retour à ce sujet? Je ne vois pas comment évaluer le modèle si le fichier test n'a pas d'étiquettes.

                          Merci

                          Nicolas

                          • Partager sur Facebook
                          • Partager sur Twitter
                            28 novembre 2018 à 15:09:26

                            Bonjour,

                            Pour ma part, j'ai comparé les algo entre-eux.

                            José

                            • Partager sur Facebook
                            • Partager sur Twitter
                            José Castro
                              20 octobre 2019 à 20:02:22

                              Bonjour à tous.

                              Heureux d'y être pour le partage

                              • Partager sur Facebook
                              • Partager sur Twitter
                                21 janvier 2021 à 7:09:50

                                Bonjour,

                                Une erreur s'est glissée dans le cours quand après avoir parlé du LASSO qui est équivalent à résoudre : arg min ||y-Xbeta||2 tel que ||beta||1 <= t, on compare avec la régression ridge qui est équivalente à arg min ||y-Xbeta||2 tel que ||beta||1 <= t cad la même chose alors que ça devrait être ||beta||2<= t si j'ai bien compris.

                                Merci pour votre retour,

                                • Partager sur Facebook
                                • Partager sur Twitter
                                  17 mars 2021 à 10:21:43

                                            Bonjour la commu, je suis nouveau et je travailles sur l'optimisation (comme avec les modele en ML, DL etc.) et j'ai un soucis. En effet je cherches a retrouve les meilleurs parametres d'un modele non lineaire qui resulte de la superposition d'un polynome de degree 1 ajoute d'un produit d'une exponentielle et d'un cosinus; le modele a 07 parametres et on m'a demande d'utiliser l'algorithme de la descente du gradient pour un debut (avant plus tard d'utiliser ceux de newton et Levenberg-Marquardt) pour retrouver ces 07 parametres.

                                  - J'ai define la fonction cout de maniere quadratique et que je cherches a minimise 

                                  - J'ai calculer le gradient de cette fonction qui me retourne un vecteur 7*1 (dont les composantes sont les derives par rapport a chaque parametre du modele)

                                  - Ensuite j'actualise les parametres du modele suivant la methode de la descente du gradient

                                  - Apres je joues sur alpha(vitesse de convergence ou learning rate) et le nombre d'iterations pour faire converger mon algorithme

                                               Un plot de mes donnees initiales donne un signal module en amplitude que j'essai de reproduire en utilisant le modele non lineaire bien definie coe suit:

                                  I(t,theta) = a't+a + b*exp(-alpha*t^2+mu*t)*cos(2*pi*f*t - phi) avec

                                  theta = [a',a,b,alpha,mu,f,phi]  mon vecteur de parametreset dont je dois retrouver ses 07 composante qui puisse faire l'affaire tout en minimisant l'erreur.

                                  J'initialise theta de facon aleaoire et je lance plusieurs simulations, le resultat n'est pas bon. Pour pouvoir bien initialiser f, j'ai du faire la transformee de fourier du signal et prendre la frequence adequate du signal et les autres parametres toujours initialiser de facon aleaoire et je relances plusieurs essai d'entrainement, je constates que mon algorithme ne converge pas mais donne deja quelque chose d'interessant.

                                  J'aimerais avoir quelques conseils et orientations en vu de reussir a faire converger ce dernier. Merci d'avance



                                  -
                                  Edité par Florentino perez 17 mars 2021 à 10:56:29

                                  • Partager sur Facebook
                                  • Partager sur Twitter
                                    18 mars 2021 à 9:50:21

                                    Bonjour,

                                    Dans le chapitre Prédisez linéairement la probabilité de l’appartenance d’un point à une classe, paragraphe "Solution de la régression logistique", il est dit que " la fonction objective est concave"

                                    Or, dans le résumé, il est dit que la vraisemblance est convexe. Je pensais que la fonction objective était dans ce cas la vraisemblance.

                                    S'agit-il d'une erreur ou je n'ai pas bien compris ce concept ?

                                    Merci par avance pour votre aide,

                                    Vincent-Paul

                                    • Partager sur Facebook
                                    • Partager sur Twitter

                                    [Cours] Machine learning supervisé linéaire

                                    × Après avoir cliqué sur "Répondre" vous serez invité à vous connecter pour que votre message soit publié.
                                    × Attention, ce sujet est très ancien. Le déterrer n'est pas forcément approprié. Nous te conseillons de créer un nouveau sujet pour poser ta question.
                                    • Editeur
                                    • Markdown