L3 - Statistiques Inférentielles

Notes de cours:
Ressources sur lesquelles se base le cours:
- Jean-Yves Ouvrard, Probabilités. Tome II. Master-Agrégation, Cassini (2009), 978-2842250867
- Michel Lejeune, Statistique, La théorie et ses applications, Springer Verlag France (2010), 978-2817801568
- Dominique Fourdrinier, Statistique inférentielle : Cours et exercices corrigés, Dunod (2002), 978-2100044450
- Benoît Cadre et Céline Vial, Statistique mathématique, Ellipses (2012), 978-2-7298-7323-3
M1 STDV - Analyse des données

Notes de cours:
Jeux de données d'illustration utilisés en cours, TD et TP:
A une exception près, je donne juste le lien vers les données brut car dans la majorité des cas je ne suis pas certain de la légalité de distribuer les données nettoyées. Je donne aussi la méthode du cours qui a été illustrée par chacun de ces jeux de données.
Données de datadryad:
- Lien | Article | Données de comportement des dauphins au large du port de Galveston en fonction des bateaux présents. [AFC]
- Lien | Article | Profil métabolique de l'urine de chiens sains et de chiens atteint d'hépatite chronique. [ACP]
- Lien | Article | Données d'observation de fossiles dans divers sites de fouille en Chine. [Clustering hierarchique]
- Lien | Article | Données de lieux d'étude de pollinisateurs au sud du Royaume Uni. [Clustering hierarchique]
- Lien | Article | Données de biodiversité dans une forêt Canadienne. [k-means]
- Lien | Séquence ADN de papillons Bicyclus. [ACM]
Données de Kaggle:
- Lien | Images de visage de Yale pour la classification. [ACP / k-means]
- Lien | Articles de la BBC pour la classification. [ACP / k-means]
- Lien | Données de qualité d'air par ville. [ACP]
- Lien | Dépenses en R&D en Europe. [ACP / Clustering hierarchique]
- Lien | Sondage sur des sujets variés de slovaques entre 15 et 30 ans. [ACM / Clustering hierarchique]
- Lien | Causes de décès dans les grandes villes des USA. [ACP]
- Lien | Sondage sur les problèmes d'anxiété de joueurs de jeux vidéo. [ACM]
Données de divers sites opendata français:
- Lien | Données démographiques des communes de Grand Poitiers. [ACP]
- Lien | Répartition des voyageurs SNCF par catégorie socio-professionnelle. [ACP]
- Lien | Résultat du brevet des collèges par établissement. [ACP]
- Lien | Nombre de voyageurs montants dans les trains Transilien. [AFC]
Données fournies par François Husson:
- Lien | Données de température dans les capitales européennes. [ACP]
- Lien | Données de causes de décès en France. [AFC]
- Lien | Performances au Décathlon. [ACP]
Autres données:
- Lien | Données de la saison 2021-2022 de la ligue 1. [ACP]
- Téléchargement | Nutriscore des jus de fruits vendus par les grandes chaînes de distribution. Jeu de données créé à partir de la base de données https://fr.openfoodfacts.org/. [AFC]
- Lien | Base de données MNIST. [ACP / k-means]
Ressources sur lesquelles se base le cours:
- Gilbert Saporta, Probabilités, analyse des données et Statistique, Editions Technip (2006), 978-2710809807
- François Husson; Jérôme Pagès et Sébastien Lê, Analyse de données avec R, Presses universitaires de Rennes (2009), 978-2-7535-4869-5
- Brigitte Escofier et Jérôme Pagès, Analyses factorielles simples et multiples, Dunod (2008), 978-2100859573
- Alan Julian Izenman, Modern multivariate statistical techniques, Springer Publishing Company (2008), 978-0387781884
- Gilles Celeux; Edwin Diday; Gérard Govaert; Yves Lechevallier et Henri Ralambondrainy, Classification automatique des données, Dunod Informatique (1989), 2-04-018798-7
M1 STDV - Modèles linéaires et généralisés

Notes de cours:
Jeux de données d'illustration utilisés en cours, TD et TP:
Données de datadryad:
- Lien | Article | Données de mesures de grenouilles et crapauds.
- Lien | Article | Données de libellules affectées par un parasite.
- Lien | Article | Données de poissons observés dans des cours d'eaux finlandais.
- Lien | Article | Comportement d'Escargot de mer selon la température et la marée.
- Lien | Article | Liens entre la pauvreté et les symptômes d'asthme.
- Lien | Article | Données morphométriques pour sexage de Soras.
- Lien | Article | Quantité de nourriture ingérée par des oiseaux migratoires avant qu’ils entament leur migration.
- Lien | Article | Effet d’une thérapie sonore de masquage sur des acouphènes.
- Lien | Article | Données de mesures de fémurs d'oiseaux incapables de voler.
- Lien | Article | Décès lors d'accouplement d’araignées Tetragnatha selon leurs caractéristiques physiques.
- Lien | Article | Nombre de dépôts de grains pollens par un bourdon lors d'un déplacement.
- Lien | Article | Nombre d’acariens dans des poulaillers en Ain et en Drome.
Données de Kaggle:
- Lien | Données de températures dans les départements Français.
- Lien | Prédiction du taux de graisse corporelle.
- Lien | Différences de préférence de films entre l'audience et le critiques de cinéma.
- Lien | Prix des maisons à Ames (USA, Iowa).
Autres données:
- Lien | Taux de réussite au brevet par établissement.
- Lien | Données de mesures de poissons du lac Längelmävesi.
- Téléchargement | Données personnelles de parties d'échec.
- Lien | Régularité des TER par année et par région.
- Lien | Propriétés mécaniques de divers alliages d'acier.
- Article (Données dans la table 2 et 3) | Groupe sanguin et sévérité du cancer du pancréas.
Ressources sur lesquelles se base le cours:
- Bingham, N.H. et John M. Fry, J.M., Regression: Linear Models in Statistics, Springer London (2010), 978-1-84882-968-8
- Azaïs, J-M. & Bardet, J-M., Le modèle linéaire par l'exemple : régression, analyse de la variance et plans d'expérience illustrés avec R et SAS, Dunod Editions (2012), 978-2100582686
- Harrell Jr., F.E., Regression Modeling Strategies with Applications to Linear Models, Logistic and Ordinal Regression, and Survival Analysis, Springer Cham (2015), 978-3-319-19424-0