Kikívánkozott belőlem

Gyorstalpaló a statisztikák helyes értelmezéséhez

2020. április 08. - Kikívánkozott belőlem

Egy hónappal ezelőtti bejegyzésem kommentelői közül sokan megpróbálták elmagyarázni, miért is logikus/hatékony a neme alapján eldönteni valakiről, hogy van-e matektehetsége, s hogy ennek semmi köze az előítéletekhez, hanem nekem kéne megtanulnom elfogadni, hogy nőként mihez van tehetségem. Az a konkrét infó a blogbejegyzésben, hogy nyertem egy matekversenyt (persze életem során többet is, de a posztban csak arról az egyről volt szó), abszolút nem volt zavaró tényező a számukra.

Elgondolkodtam, hogy vajon mi okozta kommentelőim logikai hibáját, s arra jutottam, hogy nem egy, hanem három jól szétválasztható ok lehet a háttérben:

  1. a statisztikák jelentésének félreértelmezése
  2. a tudomány és a hírközlés is a társadalmi csoportok különbözőségeire koncentrál
  3. pszichológiai okok

Így egy három posztos sorozatban ezeket szeretném részletesebben megvizsgálni, abban a reményben, hogy hátha olvasóim innentől ritkábban fogják ezeket a logikai hibákat elkövetni – vagy ha mégis elkövetik, akkor egy egyszerű linkkel el tudom intézni a választ... Mint a címből is kiderült, a mai bejegyzés az első ponttal, a statisztikák jelentésének félreértelmezésével fog foglalkozni. Vágjunk bele!

Statisztikai adatok jelentésének félreértelmezése

Az egyik leggyakrabban felhozott érv amellett, hogy nőként nem lehetek olyan jó matekból, mint egy férfi az az, hogy a férfiak tudományosan bizonyítottan jobbak matekból genetikai szinten. Ez a feltételezés tudományosan bizonyítottan nem igaz.

Erre logikusnak tűnik az a válasz, hogy lehet, hogy tudományosan nem igaz, de tapasztalati úton lehet látni, hogy a férfiak valami miatt mégiscsak jobbak matekból, hiszen a matematikusok között több a férfi, mint a nő. Ezt a megfigyelést nem vitatom, csakhogy a kérdés ekkor az, hogy mi ennek az oka? Azt láttuk, hogy a bemenet ugyanaz, azaz nincs különbség a nemek között a tehetségben. Az azonban, hogy valakiből matematikus váljon, egy hosszú folyamat, aminek a sikerességét sok külső tényező is befolyásolja. Egy ilyen tényezőt a bejegyzésem alatt is láthattunk: sokan látatlanul, csak annyit tudva rólam, hogy nyertem egy matekversenyt s nőből vagyok, azt tanácsolják, hogy inkább ne matekkal foglalkozzak, hanem olyan dologgal, amihez értek. Ugyanis úgy gondolják, hogy a nemem pontosabban előrejelzi, hogy mihez értek, érthetek, mint az, hogy miből nyertem tanulmányi versenyt (kb 1500 diák közül lettem az első). 

Tehát az, hogy kevesebb női matematikus van, nem azt bizonyítja, hogy a nőknek kevesebb tehetségük lenne, hanem azt, hogy a matematikussá válás folyamata külső tényezők miatt nemtől függ.

A "statisztikailag szignifikáns" félreértelmezése

De vajon ha igaz lenne az, hogy van némi statisztikailag jelentős különbség a férfiak és nők matektehetsége között, az vajon azt jelentené-e, hogy egy nő nem lehet jobb matekból mint egy férfi? A válasz röviden: nem. Hosszan pedig lásd alább, a végén egy összefoglaló táblázattal.

Példaként legyen a hírekben olvasott mondatunk: az A csoport statisztikailag szignifikánsan* (=jelentősen) magasabb, mint a B csoport. Mit jelent ez? Vannak, akik ezt úgy értelmezik, hogy az A csoport statisztikailag szignifikánsan (=jelentősen) magasabb, mint a B csoport. Csakhogy az a szó, hogy "statisztikailag" megváltoztatja a mondat jelentését.

Az "A csoport statisztikailag szignifikánsan magasabb, mint a B csoport." jelentése: megbízhatóan kimutatható magasságbeli különbség az A és a B csoport között. Például ilyen lehet, hogy az egyik ember-csoport átlaga fél cm-rel magasabb a másik csoportnál. Tehát attól még, hogy az eltérés mértéke nem jelentős, lehet megbízhatóan kimutatható.

Az "A csoport statisztikailag szignifikánsan magasabb, mint a B csoport." jelentése: jelentős a magasságbeli különbség az A és B csoport között. Itt persze mindenki eldöntheti, hogy mi a jelentős, szerintem 30 cm már az, tehát ha az egyik ember-csoport-átlaga 30 cm-rel magasabb a másik csoporténál. Pl legyenek a B csoportban 120-180 cm magas emberek, az A csoportban pedig 150-210 cm magas emberek (a csoportokon belül egyenletesen elosztva). 

S sokan még egy lépéssel továbbmennek, s a következőképpen értelmezik a kiindulási mondatot: "Aki az A csoporthoz tartozik, az jelentősen magasabb, mint aki a B csoporthoz tartozik.", ennek a mondatnak a jelentése: az A csoport minden egyes tagja jelentősen magasabb, mint a B csoport bármely tagja. Erre egy példa: A csoport: 195-210 cm magas emberek, B csoport: 150-165 cm magas emberek

Ez utóbbiból logikusan le lehet vonni azt a következtetést, hogy amennyiben tudom valakiről, hogy az A csoportba tartozik, akkor meg tudom mondani, hogy az illető az adott tulajdonsággal rendelkezik egy B csoportba tartozóhoz képest, jelen esetben: jelentősen, legalább 30 cm-rel magasabb. A gond ott van, hogy sokan ezt a következtetést már az első mondatot olvasva is levonják, aminek azonban semmi köze ehhez, hiszen a különbség lehet elhanyagolható, ám megbízhatóan kimutatható, illetve hiába van nagy különbség a csoportok átlaga között, attól még lehet nagy átfedés a tagjaik között (lásd a 150-180 cm-es embereket a második példámban).

A fentebbiek táblázatos formában:

Mit tudunk megállapítani az adott mondatok alapján?
Jelentős a különbség a csoportok között? A különbség igaz a tagok szintjén is?
Az A csoport statisztikailag szignifikánsan magasabb, mint a csoport. Nem tudjuk. Nem tudjuk.
Az A csoport szignifikánsan magasabb, mint a B csoport. Igen. Nem tudjuk.
Az A csoport minden egyes tagja jelentősen magasabb, mint a B csoport bármely tagja. Igen. Igen.

 

Azaz a három mondat nagyon más tartalommal bír.

Mit tegyünk, hogy jól értsük a statisztikákat?

Egyszerű: kezeljük őket a helyükön, s amikor olvassuk őket, emlékeztessük magunkat arra, hogy a statisztikai adatok pontosan azt jelentik, amit, s nem többet (pl: kevés női matematikus ≠ nők rosszak matekból), illetve statisztikailag szignifikáns nem jelenti azt, hogy szignifikáns, s pláne nem jelent semmi biztosat egy adott emberre nézve.

Azaz, ha egy adott emberről szeretnénk valamit megtudni, akkor az egyetlen járható út az illető megismerése. Ez persze idő és erőforrásigényes, de más, hatékonyabb út, bár első ránézésre úgy tűnhet, hogy van, nincs.

 

 

* Itt előjön, hogy már ennek a kifejezésnek a definíciója sem egyértelmű. Így annak is külön irodalma van, hogy mi a "statisztikailag szignifikáns", s hogyan lehet ennek a definíciójával játszani, illetve milyen hibákat (többek között elkerülhető halálokat) okoz, amikor szakértők, döntéshozók értelmezik félre a jelentését. Itt egy angol nyelvű képregény itt pedig egy könyv az érdeklődőknek.

A bejegyzés trackback címe:

https://kikivankozottbelolem.blog.hu/api/trackback/id/tr1715513756

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.