Niveau d'étude
BAC +4
ECTS
4 crédits
Composante
Faculté des sciences
Description
Contenu :
Régression linéaire (simple/multiple) ; analyse de variance (1F/2F) ; analyse de covariance ; effets aléatoires et effets mixtes ; régression logistique ; régression PLS ; modèle linéaire généralisé ; principe de la validation croisée et indicateurs de qualité (AIC, BIC, etc.)
Pré-requis obligatoires
Notions et contenus :
Théorie de la mesure et intégration (licence mathématiques L3) ; calcul des probabilités (licence mathématiques L3) ; algèbre linéaire en dimension finie (licence mathématiques L3) ; module de statistiques du premier semestre ; langages R et Python.
Compétences et capacités :
Maîtriser les compétences enseignées dans le module de statistiques du semestre 1 : statistique descriptive, modélisation, estimation ; maîtriser les bases de l’algèbre linéaire et du calcul matriciel, notamment : projection orthogonale de Rn ; avoir une connaissance minimale des langages R et Python.
Informations complémentaires
Section Moodle du M1 DS
Compétences visées
― Être capable de construire un modèle permettant d’expliquer une variable quantitative par une combinaison linéaire de régresseurs quantitatifs. Savoir estimer les paramètres de ce modèle par la méthode des moindres carrés et leur associer des tests de significativité sous les hypothèses adéquates.
― Savoir construire un modèle d’ANOVA à un facteur et deux facteurs, avec ou sans interactions. Être capable d’estimer les paramètres de la modélisation. Savoir construire les tests de significativité associés à de tels modèles sous les hypothèses adéquates (comparaison multiple, homoscédasticité, correction de Bonferroni, influence des facteurs, des interactions, etc.).
― Savoir généraliser le point précédent à l’ANCOVA. Savoir construire les tests de significativité associés à de tels modèles sous les hypothèses adéquates (principalement l’homogénéité des pentes et des constantes).
― Comprendre le principe des effets aléatoires et effets mixtes introduits dans les modèles de régression. Savoir les mettre en évidence.
― Savoir manipuler la régression logistique afin de faire le lien avec le module de classification.
― Connaître l’existence de régressions moins usuelles, comme la régression sur composantes principales, la régression PLS ou encore les modèles linéaires généralisés, et savoir globalement les techniques d’estimation qui leur sont associées.
― Illustrer toutes les régressions étudiées avec R et/ou Python sur des jeux de données réelles.
― Savoir valider des modèles à l’aide des principaux indicateurs (AIC, BIC, etc.). Maîtriser la stratégie de la validation croisée.
Bibliographie
― JM. Azaïs, JM. Bardet, Modèle linéaire par l’exemple. Dunod, 2e édition, (2012).
― P.A. Cornillon, E. Matzner-Løber, Régression avec R. Springer Editions, 2010
― G. Saporta, Probabilités, Analyse des données et Statistique. Technip, 3ème édition révisée (2011).