Schematy losowania i dobór próby | Metodologia | GUS - Portal Informacyjny

Schematy losowania i dobór próby

Schematy losowania i dobór próby

Strategia i schemat losowania próby

W przypadku badań reprezentacyjnych fazą przygotowawczą związaną z wyborem próby jest określenie strategii  badania reprezentacyjnego, czyli planu próbkowania, co jest równoważne z przyjęciem określonego schematu losowania, oraz metod estymacji, czyli uogólniania wyników.

Wybór strategii wiąże się z rozważeniem estymatorów możliwych do utworzenia. Ważnymi aspektami, które trzeba brać pod uwagę przy tworzeniu strategii, są obciążenie (błąd systematyczny) i wariancja (błąd losowy), które składają się na średni błąd kwadratowy estymatora. Błąd systematyczny pojawia się, gdy występują:

  • błędy pokrycia – np. pewne jednostki są stale pomijane w operacie,
  • nielosowe braki odpowiedzi – np. młodzi ludzie są trudniejsi do zastania w domu,
  • błędy pomiaru – np. respondenci mają tendencję do zaniżania swoich wydatków.

Dąży się do tego, aby estymator był dokładny oraz precyzyjny, czyli aby zarówno błąd systematyczny jak i błąd losowy były małe.

Schematy losowania (jednostopniowe, dwustopniowe)

W celu usprawnienia organizacji badania i ułatwienia pracy ankieterom w przypadku wywiadów metodą bezpośrednią (CAPI lub PAPI) stosowany jest dwustopniowy schemat losowania próby. Najpierw losuje się większe jednostki — tzw. jednostki pierwszego stopnia (JPS), np. rejony statystyczne lub obwody spisowe. Każda z nich zawiera wiele mniejszych jednostek, takich jak mieszkania. Następnie, w drugim etapie, z każdej wylosowanej jednostki pierwszego stopnia losuje się określoną liczbę mieszkań (czyli jednostek drugiego stopnia, JDS), w których przeprowadza się wywiady. Taki wariant schematu losowania próby jest stosowany ze względów ekonomicznych, powoduje jednak pogorszenie precyzji wyników badania w stosunku do schematu losowania jednostopniowego.

Uwzględnienie aspektu czasowego w losowaniu próby (badania przekrojowe, panelowe, rotacyjne itp.)

Wybierając schemat losowania próby i metodę estymacji uwzględnia się parametr czasu, tzn. powtarzanie badań według jakiegoś schematu czasowego. W badaniach opartych na wielokrotnych pomiarach można przyjąć różne strategie doboru próby. Dwa skrajne podejścia obejmują: (1) każdorazowe losowanie nowej, niezależnej próby z populacji oraz (2) wykorzystanie tej samej próby respondentów we wszystkich pomiarach. Pomiędzy tymi dwoma podejściami mieszczą się różne wzorce badań, których wybór jest dokonywany w zależności od  przyjętych celów badania.

Określenie wielkości próby i warstwowanie

Po ustaleniu schematu losowania i estymatorów określamy wielkość próby. Musimy brać pod uwagę dwa aspekty: koszty badania i precyzję oraz ich wzajemne warunkowanie. Generalnie wraz z wielkością próby poprawia się precyzja, ale też rosną koszty badania.

Po określeniu rozmiaru próby przechodzimy najczęściej do warstwowania populacji. Stosowanie warstwowania jest szeroko rozpowszechnione. W metodzie tej tworzy się warstwy populacji,  które możemy traktować jako odrębne populacje, oddzielnie określając dla nich schematy losowania i niezależnie dobierając próby. Na początku warstwowania określamy, według jakich cech będziemy je przeprowadzać, co uzależnione jest od celów warstwowania. Możliwe cele są następujące:

  • zwiększenie precyzji,
  • stworzenie oszacowań dla oddzielnych warstw czy subpopulacji składających się z więcej niż jednej warstwy,
  • łatwiejsze zaplanowanie pracy w terenie,
  • wykorzystanie różnych operatów dla różnych części populacji.

Istotą warstwowania jest wyodrębnienie w zróżnicowanej zbiorowości możliwie jednorodnych grup jednostek, dzięki czemu każda z tych grup będzie miała odpowiednią reprezentację w próbie. Ma to szczególne znaczenie zwłaszcza w populacjach silnie niejednorodnych. Poszczególne warstwy powinny być jak najbardziej zróżnicowane między sobą i homogeniczne (jednorodne) wewnątrz. Warstwowania dokonujemy tak, aby otrzymane warstwy były rozłączne i pokrywające całą populację, tzn. aby każda jednostka populacji należała do jednej i tylko jednej warstwy. Jedną z najważniejszych kwestii przy stosowaniu schematu losowania warstwowego jest tzw. alokacja próby, czyli określenie liczby elementów próby losowanych w poszczególnych warstwach. Wyróżnia się m.in. alokację proporcjonalną, alokację Neymana (optymalną), alokację równomierną.

Pojęcia te i inne stosowane w statystyce publicznej zdefiniowane są w Słowniku pojęć dostępnym pod adresem:

https://stat.gov.pl/metainformacje/slownik-pojec/pojecia-stosowane-w-statystyce-publicznej.