Statistika – kako vam laže in kako te laži prepoznati?

Deli:

Statistika je tako prepričljiva, da na njihovi podlagi ljudje, države in organizacije sprejemajo pomembne odločitve. Marsikdaj so stvari drugačne, kot je prikazano, a situaciji hitro verjamemo, ker se z njo strinjajo naši Facebook prijatelji, namesto da bi razmišljali z lastno glavo. Ko vidimo statistike, jim brez zadržkov prikimamo, čeprav nam je kdo mogoče predstavil debelo laž.

Nemalokrat ulovim sebe in druge v trenutkih naivnosti. Marsikdaj so to moji starši, ki vidijo na spletu oglas za napravo, s katero se naučiš tujega jezika v treh dneh in bi radi takoj veselo investirali. Premalo se zavedamo, kako je lahko naivnost nevarna in kako pomembno je, da imamo orodja, s katero si jo lahko zmanjšamo. To sploh velja danes, v dobi medijev, ki manipulirajo z našim strahom in izzivajo naša čustva.

Da pa boste vi sprejemali boljše odločitve, komu in čemu verjeti, bom danes z vami delil nauke iz knjige Kako lagati s statistiko avtorja Darella HuffaNe pozabite: sveta si ne moremo razlagati brez številk, prav tako pa ne samo z njimi.

Predstavljajte si, da imate vrečko fižola, nekaj belega in nekaj rdečega. Edini način, da natančno ugotovite, koliko je katerih, je, da jih sesujete na mizo in preštejete. To bi vam, žal, če bi bilo fižola veliko, lahko vzelo kar precej časa. Zato lahko potegnete iz vrečke za pest fižola, preštejete, koliko je katerih, in sklepate, da velja enako razmerje za celotno vrečko. S tem bi uspešno opravili proces vzorčenja, ki ga statistika pogosto izrablja.

Zavedati se moramo, da ni vsak vzorec enako dober. Manj fižola, kot potegnemo iz vrečke, manj točno lahko sklepamo, koliko je katerega. Dober vzorec je reprezentativen, kar pomeni, da je dovolj velik, naključen in ustrezno predstavlja celoto. Žal je takšen vzorec velikokrat težko in drago pridobiti, zato se statistika posluži manjših, ki niso ustrezno reprezentativni. Če bi iz vrečke fižola vzeli le tri zrna in bi bila vsa rdeča, bi lahko napačno sklepali, da je v vrečki ves fižol rdeč.

Česa se torej paziti v praksi? Predvsem primerov, kot je ’67 % Slovencev je za/proti…’, saj nimate nobene predstave, katerih Slovencev in koliko jih je bilo v raziskavi udeleženih.

Statistika ne pozna le enega povprečja

statistika

Ko pomislimo na povprečje, vsi prvo pomislimo na aritmetično sredino – sešteješ vse podatke in jih deliš s številom podatkov. Hitro pozabimo, da to ni edina srednja vrednost, ki jo poznamo. Poznamo še nekaj drugih, a izpostavil bom še modus in mediano. Modus je podatek, ki se v nizu podatkov največkrat ponovimediana pa je vrednost, ki se nahaja na sredini, ko podatke razdelimo od največjega do najmanjšega. Zakaj razlagam to srednješolsko matematiko? Da izpostavim problem naslednji problem: ko nekdo govori o povprečju, ti ne koristi dosti, če ne veš, za katero povprečje gre.

Aritmetična sredina, modus in mediana so lahko pri nekaterih skupkih podatkov podobno veliki, pri nekaterih pa so lahko popolnoma različni. Pri povprečni višini žensk so si na primer blizu, pri povprečni plači žensk pa zelo različni. Beseda ‘povprečje’ je zato zaradi svoje večpomenskosti bolj brez pomena, saj ne moremo biti prepričani, kaj predstavlja.

Ko vam bo nepremičninski agent povedal, da je v neki soseski povprečna letna plača 150.000 €, ne kupite hiše prehitro.

Male cifre

Prej sem omenil, da je vzorec dober le, če je dovolj velik. Če nekdo eksperimentira z majhnimi vzorci, lahko zelo preprosto z njimi manipulira. Ko zagledate v trgovini zobno pasto z napisom: ‘7 od 10 ljudem pomaga pri krvavenju dlesni.’, je za tem rezultatom precej hinavski postopek. Proizvajalec zobne paste namreč za raziskavo uporabi le 10 ljudi. Možni so trije različni izidi: krvavenje dlesni se izboljša, poslabša ali pa se ne spremeni. Podjetje nato pasto testira na različnih testnih skupinah, dokler ne pride do rezultata, ki vam ga nato oglašuje na nakupovalnih policah.

Paziti morate tudi, ko se srečujete z besedama ‘dostopno’ in ‘na voljo’. Če je na primer na nekem območju električna energija dostopna 70 % gospodinjstvom, to še ne pomeni, da jo dejansko imajo. Beseda ‘večina’ pa lahko pomeni karkoli med 51 in 99 %.

Internet je dostopen večini svetovnega prebivalstva, je tako zelo smešna trditev.

Statistike v grafih in razlikah

Razlika je prava razlika le, če je sprememba opazna. Če ste rojeni en mesec pred svojim sošolcem, ste seveda starejši od njega, a v pogovorih boste vedno trdili, da sta stara enako. Takšne male razlike oglaševalci s pridom izkoristijo. Če bi na primer testiramo različne znamke cigaret, bi ugotovili, da imajo vse vsebujejo približno enako količino škodljivih snovi. Čeprav so si po tej količini zelo skupaj, bo imela še vedno ena znamka najmanjšo vrednost. Na zavojčkih cigaret te znamke bi zelo hitro opazili napis, kot je: ‘Najmanj škodljive cigarete!’.

Marsikdo želi svoje trditve podpreti z grafi, a tem ne smemo prehitro zaupati. Grafom včasih manjkajo podatki. Da nekdo nekaj poudari, pa lahko spremeni razmerje med osema.

statistika

Graf: prodaja avtomobilov glede na znamko

Zgornji graf na prvi pogled izgleda, kot da Ford proda kar dvakrat več avtomobilov kot Toyota, a če pogledamo malo bližje ugotovimo, da temu ni tako. Graf namreč ni prikazan od 0-100 %, ampak od 95-100 %. V resnici statistika na grafu kaže, da Ford proda le okoli 2 % več avtomobilov kot Toyota.

Pazite se na pol povezanih slik

Statistično se v jasnem vremenu zgodi več nesreč kot v megli. Na prvi pogled se to zdi presenetljivo, a če malo pomislite, boste prišli do ‘ja-ne-ga-srat’ zaključka. Jasnega vremena je namreč dosti več kot megle. Če želite ljudem nekaj dokazati, demonstrirajte nekaj drugega in se pretvarjajte, da gre za isto stvar. Tako ustvarite povezavo med stvarmi, ki se zdijo podobne, a niso, in ustvarite na pol povezano sliko. Dodaten primer: Leta 1935 je v letalskih nesrečah umrlo več ljudi kot leta 1910. So bila leta 1935 letala bolj nevarna? Seveda ne, preprosto je dosti več ljudi potovalo z letali.

Zavajati je mogoče tudi s preciznostjo. Statistika je asociirana s števili, zato se bo nekdo, ki bi rad nekaj dokazal, na vse pretege potrudil, da zveni karseda strokovno. Če nekomu povemo, da smo za novo bundo odšteli 253,59 € nam bodo dosti prej verjeli, kot če rečemo, da je bila 250 €. Ljudje bolj najbolj verjamejo lihim številkam z decimalkami, saj zvenijo spretno preračunana.

Tudi odstotki lahko varajo. Če se delavcu cena cementa poviša za 10 %, cena lesa za 9 % in cena opek za 12 %, so njegovi skupni stroški za 31 % višji. Kljub temu, da odstotkov ne moremo kar tako seštevati, žal veliko ljudi nasede na takšne finte. V resnici so delavčevi skupni stroški višji le za približno 10 %.

Post hoc logična napaka

statistika

Nekoč je hotel neki proti kadilec dokazati, da imajo kadilci v srednji šoli nižje ocene. Raziskava je imela dober vzorec in statistika je uspešno pokazala, da je trditev resnična. To je bilo zelo spodbudno za proti kadilce, a žal ne smemo pozabiti upoštevati post hoc logične napake. Post hoc logična napaka pravi, da naj bi bil en dogodek vzrok za kasnejši dogodek preprosto zato, ker se je zgodil prej. Težava je v tem, da čeprav sta dva dogodka morda zaporedna, preprosto ne moremo domnevati, da eno ne bi prišlo brez drugega. Kajenje bi torej lahko bil vzrok za nizke ocene dijakov, a ravno tako bi lahko bile nizke ocene vzrok za kajenje.

Naravno je, da ljudje iščemo vzročno-posledične povezave. Žal predvidevanje, da če B sledi A, potem je A povzročil B, ne drži vedno. Obstaja povezava med bogataši in lastništvom delnic, a ne vemo, če so bogati, ker kupujejo delnice, ali če kupujejo delnice, ker so bogati. Ko je več možnih razlag, ljudje izberejo tisto, ki jim najbolj koristi. Marsikdaj pa spremenljivki sploh nista povezani in je povezava izmišljena.

Se ga napijete, ker ste srečni, ali ste srečni, ker se ga napijete?

Manipulativna statistika – kako se ji izogniti?

Da vas statistika ne prevara, je pomembno, da si postavljate prava vprašanja:

  1. Kako to ve?

 Statistika vedno želi nekaj dokazati, zato je pomembno, da vemo, kdo raziskavo izvaja, in če je mogoče pri tem pristranski. Če raziskavo izvaja neko podjetje za lastne namene, je to takoj sumljivo, saj bo verjetno želelo, da raziskava pokaže v prid podjetja.

  1. Kdo to pravi?

Preverimo, če je vzorec v raziskavi dovolj velik za zanesljivo razlago. Ne zaupajte tistim, ki iz vrečke 100 zrn fižola za raziskavo vzamejo le 10 zrn.

  1. Kaj manjka?

Ko beremo in ugotovimo, da manjka nek pomemben podatek, nam mora biti takoj jasno, da tukaj nekaj smrdi. Včasih kdo govori o spremembah, a sploh ne omeni, kaj jih je povzročilo.

  1. Ali je kdo spremenil temo?

Primer: Več primerov bolezni je zelo drugačen podatek kot več poročanih primerov bolezni.

  1. Ali je smiselno?

Najbolj pomembno je seveda, da uporabljate ZKP – zdravo kmečko pamet.

Glavne točke

Statistika pomembno oblikuje naš pogled na svet. Na njeni podlagi se odločamo kaj jesti, katera zdravila jemati, kako se obnaša gospodarstvo in za koga naj volimo. Te številke so žal nemalokrat zavajajoče, zato imejte v mislih opisana orodja in se ubranite naivnosti.

  • Ko opazite raziskavo,  skušajte ugotoviti, če je bil uporabljen dovolj velik vzorec.
  • Ko nekdo omeni povprečje, se zavedajte, da je to lahko aritmetična sredina, modus ali mediana.
  • Sumite o oglasih kot so ‘8 od 10 ljudi…’, in besedah ‘dostopno’ ter ‘večina’.
  • Razlika je prava razlika le, če zares nekaj spremeni.
  • Pozorno preglejte grafe in trditve, ki naj bi jih podpirali.
  • Pazite se na pol povezanih slik.
  • Predvidevanje, da če B sledi A, potem je A povzročil B, ne drži vedno.
  • Postavite si ključna vprašanja in uporabljajte ZKP – zdravo kmečko pamet.

Druge objave

Vas zanima kako učinkoviteje brati? Preberite tukaj!

Deli:

Leave a Comment

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja