Le tableau de distribution normal, expliqué

La formule de distribution normale est basée sur deux paramètres simples - moyenne et écart type - qui quantifient les caractéristiques d'un ensemble de données donné. Alors que la moyenne indique la valeur «centrale» ou moyenne de l'ensemble de données, l'écart type indique «l'étalement» ou la variation des points de données autour de cette valeur moyenne.

Considérez les 2 jeux de données suivants:

Jeu de données 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}

Jeu de données 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pour Dataset1, moyenne = 10 et écart type (stddev) = 0

Pour Dataset2, moyenne = 10 et écart-type (stddev) = 2, 83

Tracons ces valeurs pour DataSet1:

De même pour DataSet2:

La ligne horizontale rouge dans les deux graphiques ci-dessus indique la valeur «moyenne» ou moyenne de chaque ensemble de données (10 dans les deux cas). Les flèches roses dans le deuxième graphique indiquent la propagation ou la variation des valeurs de données par rapport à la valeur moyenne. Ceci est représenté par une valeur d'écart type de 2, 83 dans le cas de DataSet2. Étant donné que DataSet1 a toutes les mêmes valeurs (comme 10 chacune) et aucune variation, la valeur stddev est zéro, et donc aucune flèche rose n'est applicable.

La valeur stddev a quelques caractéristiques importantes et utiles qui sont extrêmement utiles dans l'analyse des données. Pour une distribution normale, les valeurs des données sont réparties symétriquement de chaque côté de la moyenne. Pour tout ensemble de données normalement distribué, traçage du graphique avec stddev sur l'axe horizontal et no. des valeurs de données sur l'axe vertical, le graphique suivant est obtenu.

Propriétés d'une distribution normale

La courbe normale est symétrique par rapport à la moyenne; la moyenne est au milieu et divise l'aire en deux moitiés; l'aire totale sous la courbe est égale à 1 pour la moyenne = 0 et stdev = 1; la distribution est complètement décrite par sa moyenne et stddev

Comme le montre le graphique ci-dessus, stddev représente les éléments suivants:

68, 3% des valeurs des données sont à moins de 1 écart-type de la moyenne (-1 à +1) 95, 4% des valeurs des données sont à moins de 2 écarts-types de la moyenne (-2 à +2) 99, 7% des valeurs des données sont à moins de 3 écarts-types de la moyenne (-3 à +3)

L'aire sous la courbe en forme de cloche, lorsqu'elle est mesurée, indique la probabilité souhaitée d'une plage donnée:

inférieure à X: - par exemple probabilité de valeurs de données inférieures à 70 supérieure à X - par exemple probabilité de valeurs de données supérieure à 95 entre X ₁ et X ₂ - par exemple probabilité de valeurs de données entre 65 et 85

où X est une valeur d'intérêt (exemples ci-dessous).

Le tracé et le calcul de la zone ne sont pas toujours pratiques, car différents ensembles de données auront des valeurs moyennes et stddev différentes. Pour faciliter une méthode standard uniforme pour des calculs faciles et l'applicabilité à des problèmes du monde réel, la conversion standard en valeurs Z a été introduite, qui fait partie du tableau de distribution normale.

Z = (X - moyenne) / stddev, où X est la variable aléatoire.

Fondamentalement, cette conversion force la moyenne et stddev à être normalisées respectivement à 0 et 1, ce qui permet d'utiliser un ensemble standard défini de valeurs Z (à partir du tableau de distribution normale) pour des calculs faciles. Un aperçu du tableau de valeurs z standard contenant les valeurs de probabilité est le suivant:

z	0, 00	0, 01	0, 02	0, 03	0, 04	0, 05	0, 06
0, 0	0, 00000	0, 00399	0, 00798	0, 01197	0, 01595	0, 01994	…
0, 1	0, 0398	0, 04380	0, 04776	0, 05172	0, 05567	0, 05966	…
0, 2	0, 0793	0, 08317	0, 08706	0, 09095	0, 09483	0, 09871	…
0, 3	0.11791	0, 12172	0, 12552	0, 12930	0, 13307	0.13683	…
0, 4	0.15542	0, 15910	0, 16276	0, 16640	0, 17003	0, 17364	…
0, 5	0, 19146	0, 19497	0, 19847	0.20194	0, 20540	0, 20884	…
0, 6	0, 22575	0, 22907	0, 23237	0, 23565	0, 23891	0, 24215	…
0, 7	0, 25804	0, 26115	0, 26424	0, 26730	0, 27035	0, 27337	…
…	…	…	…	…	…	…	…

Pour trouver la probabilité liée à la valeur z de 0, 239865, arrondissez-la d'abord à 2 décimales (soit 0, 24). Vérifiez ensuite les 2 premiers chiffres significatifs (0, 2) dans les lignes et le chiffre le moins significatif (0, 04 restant) dans la colonne. Cela conduira à une valeur de 0, 09483.

Le tableau de distribution normal complet, avec une précision allant jusqu'à 5 décimales pour les valeurs de probabilité (y compris celles pour les valeurs négatives), peut être trouvé ici.

Voyons quelques exemples concrets. La taille des individus dans un grand groupe suit un modèle de distribution normal. Supposons que nous avons un ensemble de 100 individus dont les hauteurs sont enregistrées et la moyenne et stddev sont calculées à 66 et 6 pouces respectivement.

Voici quelques exemples de questions auxquelles il est facile de répondre à l'aide du tableau des valeurs z:

Quelle est la probabilité qu'une personne du groupe mesure 70 pouces ou moins?

La question est de trouver la valeur cumulée de P (X <= 70), c'est-à-dire dans l'ensemble de données de 100, combien de valeurs seront comprises entre 0 et 70.

Convertissons d'abord la valeur X de 70 en la valeur Z équivalente.

Z = (X - moyenne) / stddev = (70-66) / 6 = 4/6 = 0, 66667 = 0, 67 (arrondi à 2 décimales)

Nous devons maintenant trouver P (Z <= 0, 67) = 0. 24857 (à partir du tableau z ci-dessus)

c'est-à-dire qu'il y a une probabilité de 24, 857% qu'un individu dans le groupe soit inférieur ou égal à 70 pouces.

Mais attendez - ce qui précède est incomplet. Rappelez-vous, nous recherchons la probabilité de toutes les hauteurs possibles jusqu'à 70, c'est-à-dire de 0 à 70. Ce qui précède vous donne simplement la partie de la moyenne à la valeur souhaitée (c'est-à-dire 66 à 70). Nous devons inclure l'autre moitié - de 0 à 66 - pour arriver à la bonne réponse.

Étant donné que 0 à 66 représente la demi-portion (c'est-à-dire une moyenne extrême à moyenne), sa probabilité est simplement de 0, 5.

D'où la probabilité correcte qu'une personne ait 70 pouces ou moins = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%

Graphiquement (en calculant l'aire), ce sont les deux régions sommées représentant la solution:

Quelle est la probabilité qu'une personne mesure 75 pouces ou plus?

c'est-à-dire Trouver un P cumulatif complémentaire (X> = 75).

Z = (X - moyenne) / stddev = (75-66) / 6 = 9/6 = 1, 5

P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%

Quelle est la probabilité qu'une personne se situe entre 52 pouces et 67 pouces?

Trouvez P (52 <= X <= 67).

P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)

= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (0, 40905) =

Ce tableau de distribution normal (et les valeurs z) trouve couramment une utilité pour tout calcul de probabilité sur les mouvements de prix attendus en bourse pour les actions et les indices. Ils sont utilisés dans le trading basé sur les gammes, identifiant la tendance haussière ou baissière, les niveaux de support ou de résistance, et d'autres indicateurs techniques basés sur des concepts de distribution normale de moyenne et d'écart type.

Comparer les comptes d'investissement × Les offres qui apparaissent dans ce tableau proviennent de partenariats dont Investopedia reçoit une rémunération. Nom du fournisseur Description

Articles Liés

Commerce éducation de base

Test d'hypothèse en finance: concept et exemples

Gestion des risques

Optimisez votre portefeuille à l'aide d'une distribution normale

Analyse technique Éducation de base

La régression linéaire du temps et du prix

Gestion des risques

Les utilisations et les limites de la volatilité

Analyse financière

Comment calculer la valeur à risque (VaR) dans Excel

Outils d'analyse fondamentale

Comprendre les mesures de volatilité

Liens partenaires

Termes connexes

Définition de l'intervalle de confiance L'intervalle de confiance, dans les statistiques, fait référence à la probabilité qu'un paramètre de population se situe entre deux valeurs définies. plus Gestion des risques en finance Dans le monde financier, la gestion des risques est le processus d'identification, d'analyse et d'acceptation ou d'atténuation de l'incertitude dans les décisions d'investissement. La gestion des risques intervient à chaque fois qu'un investisseur ou un gestionnaire de fonds analyse et tente de quantifier le potentiel de pertes d'un investissement. plus Comprendre la courbe du Trésor au comptant La courbe du Trésor au comptant est définie comme une courbe de rendement construite à l'aide des taux au comptant du Trésor plutôt que des rendements. La courbe des bons du Trésor au comptant peut être utilisée comme référence pour évaluer les obligations. plus Définition de l'indice de Gini L'indice de Gini est une mesure statistique de la distribution souvent utilisée comme indicateur de l'inégalité économique. plus Modèle de tarification des immobilisations (CAPM) Le modèle de tarification des immobilisations est un modèle qui décrit la relation entre le risque et le rendement attendu. plus Comprendre la moyenne harmonique La moyenne harmonique est une moyenne qui est utilisée en finance pour faire la moyenne de multiples comme le rapport cours-bénéfice. plus

Table des matières: