Qu'est-ce que l'échantillonnage systématique?
L'échantillonnage systématique est un type de méthode d'échantillonnage probabiliste dans lequel les membres de l'échantillon d'une plus grande population sont sélectionnés selon un point de départ aléatoire mais avec un intervalle fixe et périodique. Cet intervalle, appelé intervalle d'échantillonnage, est calculé en divisant la taille de la population par la taille d'échantillon souhaitée.
Bien que la population de l'échantillon soit sélectionnée à l'avance, l'échantillonnage systématique est toujours considéré comme aléatoire si l'intervalle périodique est déterminé au préalable et le point de départ est aléatoire.
Il existe plusieurs méthodes d'échantillonnage d'une population pour l'inférence statistique; l'échantillonnage systématique est une forme d'échantillonnage aléatoire.
Échantillonnage systématique
Fonctionnement de l'échantillonnage systématique
Comme un simple échantillonnage aléatoire d'une population peut être inefficace et prendre du temps, les statisticiens se tournent vers d'autres méthodes, comme l'échantillonnage systématique. Le choix d'une taille d'échantillon par une approche systématique peut être fait rapidement. Une fois qu'un point de départ fixe a été identifié, un intervalle constant est sélectionné pour faciliter la sélection des participants.
L'échantillonnage systématique est préférable à un échantillonnage aléatoire simple lorsqu'il existe un faible risque de manipulation des données. Si un tel risque est élevé lorsqu'un chercheur peut manipuler la longueur de l'intervalle pour obtenir les résultats souhaités, une technique d'échantillonnage aléatoire simple serait plus appropriée.
L'échantillonnage systématique est populaire auprès des chercheurs et des analystes en raison de sa simplicité. Les chercheurs supposent généralement que les résultats sont représentatifs de la plupart des populations normales, à moins qu'une caractéristique aléatoire n'existe de manière disproportionnée avec chaque "nième" échantillon de données (ce qui est peu probable). En d'autres termes, une population doit présenter un degré naturel d'aléatoire le long de la métrique choisie. Si la population a un type de schéma standardisé, le risque de choisir accidentellement des cas très courants est plus apparent.
Dans l'échantillonnage systématique, comme pour les autres méthodes d'échantillonnage, une population cible doit être sélectionnée avant de sélectionner les participants. Une population peut être identifiée sur la base d'un nombre quelconque de caractéristiques souhaitées qui conviennent au but de l'étude en cours. Certains critères de sélection peuvent inclure l'âge, le sexe, la race, le lieu, le niveau d'éducation et / ou la profession.
- L'échantillonnage systématique est un type de méthode d'échantillonnage probabiliste dans lequel les membres de l'échantillon d'une plus grande population sont sélectionnés selon un point de départ aléatoire mais avec un intervalle fixe et périodique (l'intervalle d'échantillonnage).En raison de sa simplicité, l'échantillonnage systématique est populaire auprès des chercheurs. D'autres avantages de cette méthodologie incluent l'élimination du phénomène de sélection groupée et une faible probabilité de contamination des données. Les inconvénients incluent une surreprésentation ou une sous-représentation de modèles particuliers et un plus grand risque de manipulation des données.
Exemples d'échantillonnage systématique
Comme exemple hypothétique d'échantillonnage systématique, supposons que dans une population de 10 000 personnes, un statisticien sélectionne une personne sur 100 pour l'échantillonnage. Les intervalles d'échantillonnage peuvent également être systématiques, comme le choix d'un nouvel échantillon à prélever toutes les 12 heures.
Comme autre exemple, si vous souhaitez sélectionner un groupe aléatoire de 1 000 personnes sur une population de 50 000 à l'aide d'un échantillonnage systématique, tous les participants potentiels doivent être placés dans une liste et un point de départ sera sélectionné. Une fois la liste établie, chaque 50e personne sur la liste (commençant le décompte au point de départ sélectionné) serait choisie comme participant, car 50 000/1 000 = 50.
Par exemple, si le point de départ sélectionné était 20, la 70e personne sur la liste serait choisie suivie de la 120e, et ainsi de suite. Une fois la fin de la liste atteinte et si des participants supplémentaires sont nécessaires, le décompte boucle au début de la liste pour terminer le décompte.
Échantillonnage systématique contre échantillonnage en grappes
L'échantillonnage systématique et l'échantillonnage en grappes diffèrent dans la façon dont ils tirent les points d'échantillonnage de la population incluse dans l'échantillon. L'échantillonnage en grappes divise la population en grappes, tandis que l'échantillonnage systématique utilise des intervalles fixes à partir de la plus grande population pour créer l'échantillon.
L'échantillonnage systématique sélectionne un point de départ aléatoire dans la population, puis un échantillon est prélevé à intervalles fixes réguliers de la population en fonction de sa taille. L'échantillonnage en grappes divise la population en grappes, puis prend un échantillon aléatoire simple de chaque grappe.
L'échantillonnage en grappes est considéré comme moins précis que les autres méthodes d'échantillonnage. Cependant, cela peut réduire les coûts d'obtention d'un échantillon. L'échantillonnage en grappes est une procédure d'échantillonnage en deux étapes. Il peut être utilisé lorsqu'il est difficile de remplir une liste de l'ensemble de la population. Par exemple, il pourrait être difficile de construire l'ensemble de la population des clients d'une épicerie à interviewer.
Cependant, une personne pourrait créer un sous-ensemble aléatoire de magasins, ce qui constitue la première étape du processus. La deuxième étape consiste à interroger un échantillon aléatoire des clients de ces magasins. Il s'agit d'un processus manuel simple qui peut vous faire gagner du temps et de l'argent.
Limites de l'échantillonnage systématique
L'un des risques que les statisticiens doivent prendre en compte lors de l'échantillonnage systématique est celui de l'organisation de la liste utilisée avec l'intervalle d'échantillonnage. Si la population placée sur la liste est organisée selon un modèle cyclique qui correspond à l'intervalle d'échantillonnage, l'échantillon sélectionné peut être biaisé.
Par exemple, le service des ressources humaines d'une entreprise souhaite sélectionner un échantillon d'employés et leur demander ce qu'ils pensent des politiques de l'entreprise. Les employés sont regroupés en équipes de 20, chaque équipe étant dirigée par un responsable. Si la liste utilisée pour sélectionner la taille de l'échantillon est organisée avec des équipes regroupées, le statisticien risque de choisir uniquement des gestionnaires (ou pas de gestionnaires du tout) en fonction de l'intervalle d'échantillonnage.
