Bloggfærslur mánaðarins, maí 2007

Hálfsoðin tölfræði segir fátt markvert

Eins og bent hefur verið á áður, segja niðurstöður skoðanakannanna mun minna ef vikmörk eru ekki tekin með í reikninginn. Svo mikið minna að niðurstöðurnar eru eiginlega hálfsoðnar. Ég benti líka á þetta um daginn hér. Af hverju eru engin vikmörk birt? Vikmörk er nauðsynleg til að geta yfir höfuð sagt nokkuð um hvort fylgi hefur breyst.

Það er kannski rétt að benda á að vikmörk eru ekki eingöngu nauðsynleg til að túlka skoðanakannanir, þau eru nauðsynleg til að túlka allar kannanir sem byggja á úrtaki sem er valið af handahófi.


mbl.is Fylgi Framsóknarflokks dalar á ný
Tilkynna um óviðeigandi tengingu við frétt

Flökt milli kannanna

Fyrr í dag birtist könnun sem Gallup gerði, en samkvæmt henni voru fylgistölurnar fyrir kosningarnar á laugardaginn svona[1]:

Framsóknarflokkur: 14,6%
Sjálfstæðisflokkur: 35,9%
Samfylking: 25%
Vinstrihreyfingin-grænt framboð: 14,5%
Frjálslyndi flokkurinn: 6,6%
Íslandshreyfingin 3,3%

Þessi síðari könnun, sem Félagsvísindastofnun Háskóla Íslands gerði, sýnir aðrar niðurstöður:

Framsóknarflokkur: 8,6%
Sjálfstæðisflokkur: 38,1%
Vinstri grænir: 16,2%
Samfylkingin: 29,1%
Frjálslyndi flokkurinn: 5,2%
Íslandshreyfingin: 2,7%

Eins og margir hafa tekið eftir munar nokkuð miklu á fylgi Framsóknarflokksins í þessari eldri könnun, miðað við þessa nýju. Sama á við ef eldri könnunin er borin saman við könnun frá því í gær (þar var Framsóknarflokkurinn með 9,8%). Einnig má sjá að flökt er á fylgi Samfylkingarinnar og Sjálfstæðisflokks.

Þetta flökt sem sést hér á sér stað af, trúlega, einföldum ástæðum.

1. Skoðanakannanir byggja á því að spurðir eru nokkur hundruð manns; 600 til 2000 manns, misjafnt milli kannana.  Þegar þeir sem eru spurðir eru valdir, er notuð líkindafræðileg aðferð við að velja þá (hver og einn á sama möguleika á að lenda í úrtakinu). Við að nota þessa aðferð kemur til villa sem felst í orsökum sem liggja í stærðfræðinni að baki (ég vísa á stærðfræðinga og tölfræðirit til nánari útskýringa). Villan lýsir sér þannig, að ef tekin eru mörg úrtök (margar kannanir gerðar) fæst ekki sama niðurstaða - jafnvel þó ekkert breytist í fylgi á milli úrtaka. Tökum dæmi: Flokkur mælist með fylgið 80% í einni könnun, 82% í annarri og 78% í næstu. Til að vinna upp á móti þessu, eru notuð vikmörk sem líklega yfir rétt fylgi: Í okkar dæmi, segjum 4% vikmörk. Þá væri niðurstaða kannannana: 76% til 84% fylgi, 78% til 86% fylgi, 74% til 82% fylgi (allstaðar ná vikmörkin yfir raunverulegt fylgi, sem er 79%). Það að skoða niðurstöður könnunarinnar með tilliti til vikmarka er best þegar svarhlutfall er 100%. 

2. Flökt getur líka komið til þegar svarhlutfall er orðið fremur lágt, um 50 til 60%. Hugsanlega er um að ræða að ekki sé jafnt dreift á milli fólks hvort það svari í skoðanakönnunum. Þetta þarf ekki að vera svo.

3. Breyting hefur átt sér stað á fylgi flokkanna. 

Þetta voru bara þrjár skýringar sem mér datt í hug. Þær eru ábyggilega fleiri. Sem sagt, fylgi flokka getur virst flökta í skoðanakönnunum án þess að nokkuð hafi breyst (skoðanir fólks, hlutfall þeirra sem skrökva, og svo framvegis). En trúlega er margt í bland að gerast, atriði 1. 2. og 3. saman, ásamt fleiru.

Það sem ég ekki skil, er hvers vegna fjölmiðlar birta ekki vikmörkin og nota þau í túlkun. Segja til dæmis, að flokkur X hafi 73% til 78% fylgi. Eins og þessar kannanir eru settar upp er sagt að flokkurinn hefði 75% fylgi. Raunverulegt fylgi væri kannski 77%. Það gefur auga leið að það er mun nákvæmara, betra og skynsamlegra að nota vikmörkin í túlkuninni!


mbl.is Ríkisstjórnin fallin samkvæmt nýrri skoðanakönnun
Tilkynna um óviðeigandi tengingu við frétt

Innskráning

Ath. Vinsamlegast kveikið á Javascript til að hefja innskráningu.

Hafðu samband