Symulacja sondażu

W 2016 odbywa się wiele wyborów, które wywołują spore zainteresowanie na całym świecie. W czerwcu odbyło się referendum w Wielkiej Brytanii, które dotyczyło dalszego członkostwa Zjednoczonego Królestwa w Unii Europejskiej, a już 8 listopada w Stanach Zjednoczonych odbędą się wybory prezydenckie. Natomiast mieszkańców Litwy czekają październikowe wybory do litewskiego Sejmu.

Mariusz Palewicz
Symulacja sondażu

Fot. Ewelina Mokrzecka

Naturalną rzeczą jest, że w okresie przedwyborczym wzrasta zainteresowanie sondażami wyborczymi. Na podstawie wyników, uzyskanych w sondażach, robione są różne prognozy przedwyborcze. Z tego powodu postanowiłem wykonać małą symulację sondażu na dwa miesiące przed wyborami parlamentarnymi w fikcyjnym demokratycznym państwie X, dlatego też, zbieżność z rzeczywistością jest przypadkowa.

Najpierw podstawowa informacja o państwie X: w kraju mieszka 1 milion obywateli mających prawo głosu, kraj jest podzielony na 10 okręgów administracyjnych: A, B, C, D, E, F, G, H, I, J.

Na dwa miesiące przed wyborami uczęstniczyć w nich ma zamiar 74,06% obywateli mających prawo głosu, z nich 14.99% jeszcze nie wie na kogo zagłosuje, 24,89% odda głos na partię „Alfa”, 15,89% ma zamiar zagłosować na partię „Beta”, 14,24% – „Gama”, 5,35% – „Delta”, 12,14% – „Epsilon”, 3,61% – „Dzeta”, 4,22% – „Eta”, 1,45% – „Teta”, 3,21% – „Jota”.

W poniższych tabelkach jest ukazana podstawowa informacja każdego z 10 okręgów administracyjnych.

4,5% obywateli, jeżeli będą zapytane, nie odpowiedzą na sondaż. Istnieją też osoby, które dadzą nieprawdziwą odpowiedź, na przykład osoba ma zamiar głosować na partię „Alfa”, jednak w sondażu odpowie, że nie wezmie udziału w wyborach. (Szczegółowe dane w załączniku nr 1).

Posiadamy już całą informację, więc możemy przystąpić do symulacji, która będzie polegać na tym, że komputer losowo wybierze wyborców, którzy wezmą udział w sondażu.

Sondaż nr 1. Komputer losowo wybiera 1300 mieszkańców państwa X, którzy posiadają prawo głosu. Każdy obywatel ma równe szanse, aby być wybranym do wzięcia udziału w sondażu wyborczym. Wyniki: 61 osoba nie odpowiedziała na sondaż. Pozostałe wyniki prezentują się w następujący sposób: Frekwencja: 75,3% (74,06%), Alfa – 26,26% (24,89%), Beta – 15,54% (15,89%), Gama – 15,54% (14,24%), Delta – 4,72% (5,35%), Epsilon – 10,61% (12,14%), Dzeta – 3,43% (3,61%), Eta – 4,18% (4,22%), Teta – 1,5% (1,45%), Jota – 3,11% (3,21%), Nie wie – 15,11% (14,99%). Tutaj wyniki w nawiasach są „prawdziwymi” wynikami, a procenty przed nawiasami – wyniki uzyskane w sondażu. Reasumując, różnica wyników „prawdziwych” i uzyskanych w sondażu nie wychodzi z przedziału ±2 punktów procentowych. Jedną z ciekawostek tej symulacji jest wskazywany równy wynik partii „Beta” oraz „Gama”, natomiast w rzeczywistości wyniki tych partii dzieli 1,55 punktów procentowych.

Sondaż nr 2. W tym wypadku zmniejszmy próbkę 10-krotnie, czyli komputer losowo wybiera 130 obywateli państwa X. Wyniki: 5 osób nie odpowiedziało na sondaż. Pozostałe wyniki: Frekwencja: 72% (74,06%), Alfa – 30% (24,89%), Beta – 18,89% (15,89%), Gama – 13,33% (14,24%), Delta – 8,89% (5,35%), Epsilon – 12,22% (12,14%), Dzeta – 1,11% (3,61%), Eta – 0% (4,22%), Teta – 2,22% (1,45%), Jota – 4,44% (3,21%), Nie wie – 8,89% (14,99%). Reasumując, wyniki sondażu są bardzo niedokładne, na podstawie tego sondażu na partię „Alfa” ma głosować o 5 punktów procentowych więcej, niż w rzeczywistości, a partia „Eta”, opierając się na wynikach tego sondażu, nie uzyskałaby żadnego głosu, chociaż w rzeczywistości moze liczyć na 4,22 proc. poparcie.

Sondaż nr 3. Komputer losowo wybierze 1300 obywateli państwa X, z których 50% – mieszka w okręgu A, 25% – B, 15% – I, 10% – J. Wyniki: 71 osoba nie odpowiedziała na sondaż. Pozostałę wyniki: Frekwencja: 78,93% (74,06%), Alfa – 26,08% (24,89%), Beta – 14,74% (15,89%), Gama – 14,85% (14,24%), Delta – 4,54% (5,35%), Epsilon – 11,75% (12,14%), Dzeta – 1,75% (3,61%), Eta – 4,95% (4,22%), Teta – 1,34% (1,45%), Jota – 2,78% (3,21%), Nie wie – 17,22% (14,99%). Można stwierdzić, że otrzymane wyniki są bardziej dokłądne względem rezultatów z sondażu nr 2. Jednak, w odróżnieniu od wyników z sondażu nr 1, tutaj występują różnice większe, niż 2 punkty procentowe. Na podstawie tego sondażu, prognozowana frekwencja jest prawie o 5 punktów procentowych większa od „rzeczywistej”. Według sondażu nr 3 na partię „Dzeta” ma zamiar głosować tylko 1,75%  obywateli, natomiast prawdziwe poparcie na 2 miesiące przed wyborami wynosi 3,61%. Także sondaż ukazuje, że partia „Gama” cieszy się większą popularnością od „Bety”, a „Eta” od „Delty”, w rzeczywistości jest inaczej.

Przeprowadzone symulacje ukazały, że reprezentatywna próbka da dokładniejsze wyniki, to znaczy, gdy mamy 1 milion obywateli, sondaż z udziałem tysiąca obywateli będzie miał bardziej przybliżone wyniki do prawdziwych, niż sondaż z udziałem sta mieszkańców posiadających prawo głosu. Ważna jest też losowość próbki, czyli każdy obywatel, niezależnie od miejsca zamieszkania, musi posiadać równe szanse do wzięcia udziału w sondażu.


Mariusz Palewicz – student IV roku Wydziału Matematyki i Informatyki Uniwersytetu Wileńskiego

PODCASTY I GALERIE