Traitement de données avec tableur appliqué à l'Economie et la Gestion.
CoursOutils transverses

Une modélisation des données « à la main » utilisant le côté dynamique des graphiques

Les diagrammes faits dans une feuille de calcul sont attachés aux cellules de celles-ci. Si on modifie les contenus des cellules, ils sont mis à jour en temps réel. Cela permet d'ajuster « à la main » un modèle paramétrique à des données, si ce modèle est représentable graphiquement.

Les modèles statistiques les plus courants sont ceux dont la loi de distribution est 1) unidimensionnelle : concernant une variable unique, 2) paramétrique : définie par une formule dépendant de la valeur de la variable et de quelques valeurs appelées paramètres qui sont fixées arbitrairement ou estimées d'après les données. Ces lois peuvent être continues, c'est-à-dire prendre toute valeur d'un intervalle (ou d'une réunion d'intervalles) de R, ou discrètes et prendre leurs valeurs sur un ensemble fini ou dénombrable de nombres, le plus souvent entiers.

Parmi ces lois, les plus utilisées sont :

  • la loi uniforme continue définie sur un intervalle I=[a, b] donné, ou discrète définie sur un ensemble fini E de valeurs données. Dans le premier cas, la probabilité que la valeur de la variable soit dans un intervalle quelconque inclus dans I ne dépend que de la longueur de l'intervalle et pas de ses bornes, et dans le second cas la probabilité qu'elle soit dans un sous-ensemble de E ne dépend que du nombre d'éléments de ce sous-ensemble, pas de ses éléments.

  • la loi normale N(m,s) où les deux paramètres sont m, l'espérance (moyenne théorique) et s, l'écart-type. Cette loi est continue et permet d'établir, comme son nom l'indique (on l'appelle aussi loi de Laplace-Gauss), des « normes » : par exemple, son utilisation permet de prédire le nombre d'individus d'une population entre deux tailles données connaissant la taille moyenne de la population et son écart-type.

  • la loi de Poisson P(λ), son seul paramètre λ est à la fois l'espérance et l'écart-type. C'est la loi des événements rares, son utilisation permet par exemple de prédire le nombre de naissance d'enfants atteints d'une maladie rare. C'est une loi discrète, qui peut prendre toute valeur entière positive ou nulle, les grandes valeurs étant de probabilité quasiment nulle.

  • la loi binomiale B(n,p) qui donne la probabilité des divers nombres de succès pour n tirages quand p est la probabilité de succès pour un tirage. C'est également une loi discrète qui prend ses valeurs entières dans l'intervalle [0,n].

Le but de l'exercice TD qui suit est d'ajuster au mieux des lois de probabilités sur des données en faisant varier leurs paramètres. Pour les lois continues, on essaiera de rendre la distance de Kolmogorov entre les courbes (fréquences cumulées des données et les fonctions de répartition théoriques) la plus petite possible, et pour les lois discrètes, la distance du Chi2 entre l'histogramme et les fonctions de densité.

Exercice TD : Ajustement graphique de lois de probabilités à des données (page suivante)Plus de variables quantitatives et qualitatives (page Précédente)
Accueil Pôle de Recherche et d'Enseignement Supérieur de l'Université de Lorraine Réalisé avec SCENARI