Przetwarzanie danych i metody imputacji | Metodologia | GUS - Portal Informacyjny

Przetwarzanie danych i metody imputacji

Przetwarzanie danych i metody imputacji

Edycja i walidacja danych

Etap przetwarzania i analizy zgromadzonych danych obejmuje edycję danych, imputację, estymację, integrację oraz analizę. Edytowanie danych to, najprościej mówiąc, sprawdzanie danych w celu wykrycia błędów. Po pierwsze, sprawdza się kompletność – czy dla wszystkich obserwacji uzyskaliśmy odpowiedzi na wszystkie zadane pytania. Następnie można wykonać walidację danych, czyli określenie czy udzielone odpowiedzi są możliwe/dopuszczalne. Następnie sprawdza się czy istnieją dopuszczalne relacje między danymi poprzez kontrolę proporcji między zmiennymi oraz poprawności arytmetycznych wyliczeń takich jak np. sumowania zmiennych do sumy całkowitej.

Metody imputacji brakujących danych

Braki danych mogą być dwojakie – mogą dotyczyć braku odpowiedzi ze strony badanej jednostki – braki jednostkowe lub braku odpowiedzi na poszczególne pytania – braki pozycyjne. W pierwszym przypadku stosuje się metody ważenia danych, w drugim zaś stosuje się metody imputacji danych. Imputacja to uzupełnianie brakujących danych. Jest wiele metod imputacji, np. imputacja średnia.

Stosując imputację, należy mieć na uwadze fakt, że przypisywane wartości stanowią jedynie sztucznie wprowadzone substytuty odpowiedzi.