[Cours] Machine learning supervisé linéaire

Entraînez un modèle prédictif linéaire

6 juillet 2017 à 18:04:19

Bonjour ! Voilà le fil de discussion dédié au cours Entraînez un modèle prédictif linéaire.

Dans ce cours, vous allez apprendre à entraîner des algorithmes linéaires de régression et de classification : régression linéaire et logistique, leurs versions régularisées (ridge, lasso, elastic net), et SVMs en particulier. Vous apprendrez aussi à utiliser des algorithmes de classification binaire pour faire de la classification multi-classe.

N'hésitez pas à poser vos questions ici et à échanger les uns avec les autres ! Je ferai de mon mieux pour vous répondre régulièrement.

Si vous avez une question concernant le fonctionnement du cours (accès aux exercices, envoi des exercices, inscription au cours…), contactez directement OpenClassrooms : http://oc.cm/contact

Bon courage et à bientôt !

-
Edité par OsitoLoco1 22 septembre 2022 à 17:59:19

OlivierChotin

10 juillet 2017 à 17:36:24

Bonjour Chloé-Agathe,

1. Il semble que le fichier "prostate" accessible via le lien ne soit pas le même (en CSV et surtout sans la colonne de booléen), ce qui nécessite de faire +1 dans les indices pour créer X et y, par exemple pour X :

X_train = raw_data.iloc[:60,1:-2]

2. Il manque la déclaration du ridge, je suppose :

from sklearn.linear_model import Ridge
ridge = linear_model.Ridge()

Les cours ML sont excellents, merci.

Olivier

-
Edité par OlivierChotin 10 juillet 2017 à 17:52:19

Petit biscuit

11 juillet 2017 à 5:20:22

Bonjour a tous,

j'aurais une petite question, dans le premier projet a rendre, on demande deux amelioration de model, est ce que utilise get_dummies pour les categories en est une ? a fin de convertire les arrondissements en feature. Je ne vois pas d autre type de chose que je dois faire, peut etre utilise une regression avec un polynome?

Merci et bonne journee

reynal

10 août 2017 à 8:54:57

Bonjour,

le lien vers le fichier du cancer de la prostate me renvoie une page 404, est-ce que vous avez un autre emplacement ?

JeromeBernier

14 septembre 2017 à 7:28:47

Bonjour,

en ce qui concerne le quizz 1, j'obtiens une valeur différente (0.0346878)

de la correction concernant la question de détermination de beta pour les valeurs. Bien cordialement

X	y
-0.78768	-34.59703199
-1.51760513	-30.79543532
0.74416271	19.31018182
-0.62288928	-19.44809959

JeromeG13

4 octobre 2017 à 15:04:11

Bonjour, pour le quizz j'obtiens également sur Excel un beta différent.

En ce qui concerne le jeu de donnée du TP - Comparez le comportement du lasso et de la régression ridge , il est inaccessible. Pouvez vous le rendre accessible asap?

merci

Yannnis

17 octobre 2017 à 17:43:08

Bonjour,

Vos retours ont bien été traités,

Bonne journée

FatiGuerss

23 avril 2018 à 13:53:11

bonjour,

j ai eu un algorithme TSNE des données numeriques, j ai eu des classes des données mais j ai pas pu lire ces classes et comment interpreter les resultats obtenus .

Merci de votre aide

MezghaniSaloua

25 mai 2018 à 12:31:56

Bonjour à tous

Un plaisir de joindre ce forum

GaranceRichard1

21 août 2018 à 8:27:23

Concernant l'évaluation 1ère partie, je ne trouve pas du tout le béta de la correction, si on pouvait avoir votre calcul détaillé.

Concernant le TP : il y a un problème manifeste sur les données car le Ridge sur données standardisées n'a pas d'effet positif (réduction de l'erreur quadratique comparée à la baseline).

par ailleurs, votre version cours n'intègre pas la standardisation ni l'import de Ridge...

Je pense qu'il y a un bug quelque part non ?

JoséCastro

11 septembre 2018 à 18:32:57

Bonjour,

Pour le TP final, le second lien ne fonctionne pas. je récupère le fichier d'entrainement mais pas de test.

Par contre, quand je vais sur le site, je récupère l'ensemble des fichiers. Cependant, le fichier de test n'a pas d'étiquettes. Est-ce normal?

Merci

José Castro

NicolasMarchal3

25 novembre 2018 à 12:37:46

JoséCastro a écrit:

Bonjour,

Pour le TP final, le second lien ne fonctionne pas. je récupère le fichier d'entrainement mais pas de test.

Par contre, quand je vais sur le site, je récupère l'ensemble des fichiers. Cependant, le fichier de test n'a pas d'étiquettes. Est-ce normal?

Merci

Bonjour,

Je suis dans la même situation. Peut-on avoir un retour à ce sujet? Je ne vois pas comment évaluer le modèle si le fichier test n'a pas d'étiquettes.

Merci

Nicolas

JoséCastro

28 novembre 2018 à 15:09:26

Bonjour,

Pour ma part, j'ai comparé les algo entre-eux.

José

José Castro

LasndromaKabdanaDieudonne

20 octobre 2019 à 20:02:22

Bonjour à tous.

Heureux d'y être pour le partage

Jean-BaptisteRichard2

21 janvier 2021 à 7:09:50

Bonjour,

Une erreur s'est glissée dans le cours quand après avoir parlé du LASSO qui est équivalent à résoudre : arg min ||y-Xbeta||2 tel que ||beta||1 <= t, on compare avec la régression ridge qui est équivalente à arg min ||y-Xbeta||2 tel que ||beta||1 <= t cad la même chose alors que ça devrait être ||beta||2<= t si j'ai bien compris.

Merci pour votre retour,

Florentino perez

17 mars 2021 à 10:21:43

Bonjour la commu, je suis nouveau et je travailles sur l'optimisation (comme avec les modele en ML, DL etc.) et j'ai un soucis. En effet je cherches a retrouve les meilleurs parametres d'un modele non lineaire qui resulte de la superposition d'un polynome de degree 1 ajoute d'un produit d'une exponentielle et d'un cosinus; le modele a 07 parametres et on m'a demande d'utiliser l'algorithme de la descente du gradient pour un debut (avant plus tard d'utiliser ceux de newton et Levenberg-Marquardt) pour retrouver ces 07 parametres.

- J'ai define la fonction cout de maniere quadratique et que je cherches a minimise

- J'ai calculer le gradient de cette fonction qui me retourne un vecteur 7*1 (dont les composantes sont les derives par rapport a chaque parametre du modele)

- Ensuite j'actualise les parametres du modele suivant la methode de la descente du gradient

- Apres je joues sur alpha(vitesse de convergence ou learning rate) et le nombre d'iterations pour faire converger mon algorithme

Un plot de mes donnees initiales donne un signal module en amplitude que j'essai de reproduire en utilisant le modele non lineaire bien definie coe suit:

I(t,theta) = a't+a + b*exp(-alpha*t^2+mu*t)*cos(2*pi*f*t - phi) avec

theta = [a',a,b,alpha,mu,f,phi] mon vecteur de parametreset dont je dois retrouver ses 07 composante qui puisse faire l'affaire tout en minimisant l'erreur.

J'initialise theta de facon aleaoire et je lance plusieurs simulations, le resultat n'est pas bon. Pour pouvoir bien initialiser f, j'ai du faire la transformee de fourier du signal et prendre la frequence adequate du signal et les autres parametres toujours initialiser de facon aleaoire et je relances plusieurs essai d'entrainement, je constates que mon algorithme ne converge pas mais donne deja quelque chose d'interessant.

J'aimerais avoir quelques conseils et orientations en vu de reussir a faire converger ce dernier. Merci d'avance

-
Edité par Florentino perez 17 mars 2021 à 10:56:29

Vincent-PaulVincentelli

18 mars 2021 à 9:50:21

Bonjour,

Dans le chapitre Prédisez linéairement la probabilité de l’appartenance d’un point à une classe, paragraphe "Solution de la régression logistique", il est dit que " la fonction objective est concave"

Or, dans le résumé, il est dit que la vraisemblance est convexe. Je pensais que la fonction objective était dans ce cas la vraisemblance.

S'agit-il d'une erreur ou je n'ai pas bien compris ce concept ?

Merci par avance pour votre aide,

Vincent-Paul