Příští rok začne Mensa používat zcela nové IQ testy pro dospělé, děti mají nové od roku 2019. Hlavním autorem obou je brněnský psycholog Vladimír Marček. Jak vlastně nové testy vznikají a proč jsou ty staré už nevyhovující?
Zdroj: Magazín Eduzín 27. 1. 2023
Proč vlastně Mensa potřebuje nové
testy?
Testy zastarávají. Když si vezmete
pravítko o délce sto centimetrů a přiložíte k nějaké věci, dostanete jasné
číslo. U hodnoty IQ to bohužel nejde. Test inteligence vždy zjišťuje lidský
výkon nebo určité vlastnosti vzhledem k určité populaci. Předem tedy nevíte, co
je hodně a co málo. Jediné, co máte, jsou hodnoty intelektového výkonu v
populaci – její průměr a rozptyl hodnot kolem něj. Abyste to zjistila, musíte
otestovat třeba tisíc lidí, a až přijde ten tisící první, už ho dokážete
zařadit do percentilu. To také znamená, že když se mění populace, mění se
technicky vzato také IQ daného člověka. Test, který používala Mensa, byl už
starý a je běžná praxe jej aktualizovat nebo minimálně znovu nanormovat na
současnou populaci.
Vy jste testy „jen“ normovali nebo
jsou i úkoly zcela nové?
My jsme jak u testu pro děti, tak i
pro dospělé, vytvářeli úplně nové úkoly i normy. A zhruba za 10 let bychom jej
měli znovu nanormovat. Tím spíš, pokud nás zajímají poslední milimetry křivky.
Právě tam se totiž nepřesnosti nejvíce projevují. U nadaných jedinců.
Znamená to, že musíte vytvářet těžší
testy, protože jsme generaci od generace inteligentnější?
Existuje takzvaný Flynnův efekt,
který vlastně říká, že pokud byste současný test dala před 55 lety své babičce,
tedy v době, když jí bylo tolik, kolik nám teď, vyšlo by jí zhruba o dvacet
bodů méně než nám teď. To ale neznamená, že je slaboduchá. Neví se přesně proč,
ale v civilizovaných zemích postupně jakoby opticky stoupá hodnota IQ. Neumíme
přesně říct, čím to je. Víme však, že čím je země civilizovanější, tím je
stoupání pomalejší. V průměru se jedná zhruba o 3,5 bodu na 10 let a v každé
zemi je to trochu jinak. Nejvíce patrný je v současné době u afrických zemí,
naopak v některých vyspělých státech se to obrací a hodnoty lehce klesají.
Ví se, jak se v tomto ohledu
například projevil rok 1989? I když možná větším milníkem bude rozšíření
internetu?
Takovou studii jsem neviděl. Ale
existuje řada teorií. Podle jedné z nich byl zlom, když se přestaly používat
olověné přípravky, další mluví o změnách v souvislosti s lepší výživou, další s
kulturou, rozvojem digitalizace. Může to být ale také tím, že se zlepšuje
kvalita školství. Každopádně ať už je důvod jakýkoliv, Flynnův efekt způsobuje,
že se testy stávají časem nepřesnými.
Nejsou ale nepřesné samy o sobě
vzhledem k tomu, že vám mohou pokaždé vyjít trochu jinak?
To je další velká věc, která
jakékoliv zobecňování výsledků komplikuje. V IQ testu je těžké získat větší
počet bodů náhodou, protože vybíráte třeba z osmi odpovědí. Ale je mnoho
faktorů, kvůli kterým vám výsledek vyjde nerealisticky nízký. Můžete být
nevyspalá, vystresovaná, ale třeba i zamilovaná a nějaký test je vám v tu
chvíli jedno. Zkrátka existuje sto důvodů, proč nemusíte podat optimální výkon.
Navíc žádný psychologický test na světě nemá dokonalou spolehlivost, což
znamená, že i v ideálních podmínkách naměří pokaždé u toho samého člověka
trochu jiný výsledek. A pak je tu ještě jedna věc, co se týče nepřesnosti testů.
IQ je vlastně vždy jenom odhad.
V jakém smyslu?
Protože nemůžete změřit celou
populaci. Vy jste změřila jeden tisíc lidí. Když pak přijde tisící první,
dokážete ho zařadit mezi jiné dva. A každý z těch dvou dotyčných tak vlastně v
přepočtu na českou populaci reprezentuje deset tisíc lidí. Takže logicky
je hodnota toho konkrétního člověka v testu plus minus deset tisíc lidí, což
představuje třeba plus minus 5 bodů, i kdyby tam nebyly žádné další nepřesnosti
– což ale, jak jsme zmínili, jsou.
Možná jsme s tím měli začít, ale dá
se tedy vůbec IQ určit?
Když půjdeme do detailu, tak je to
stejné, jako bychom se ptali, co je fyzická kondice. Vy víte, co to je, ale
pokud ji chcete vyjádřit jedním číslem, co to bude? Jak ho získáte? Výkonem ve
sprintu? Při vzpírání? Plavání? Maratonu? Takže se vytvoří test, takový
pomyslný desetiboj, a z toho vyjde určité číslo. Tyto naše screeningové testy
ve školách, které dělá Mensa, jsou skupinové a trvají dvacet, nově tedy dvakrát
dvacet minut – pro každou ze dvou „disciplín”. Snaží se zachytit co největší
úsek inteligence, který obvykle koreluje s ostatními. Přesto je dobré ho brát
jen jako vodítko a zajít si k psychologovi, který bude po několika hodinách
individuálních testů a vyšetření schopen vytvořit intelektový profil. Když test
dobře měří, co má měřit, tedy inteligenci, odborně říkáme, že má dobrou
validitu.
Když se vrátíme k samotné tvorbě
testu. Jak získáváte onen reprezentativní vzorek tisíce lidí, který je vlastně
základem pro normování?
To je velmi těžké a je to jedna z
věcí, proč jsou testy tak náročné a drahé na tvorbu. U testů pro děti jsme
navíc netestovali jen tisíc, ale patnáct set dětí, abychom získali lepší
citlivost rozlišování. Pomohly nám ale školy po celé České republice, které nám
umožnily otestovat celé ročníky. U dětí to tak bylo o něco jednodušší.
A jak to bude u dospělých?
To už je horší. Potřebujeme
různorodou reprezentativní skupinu. Pro naše účely nehraje roli například
pohlaví nebo introverze/extraverze, ale rozlišujeme věk, různé stupně vzdělání,
velikost sídla a další, jak jsou rozvrstveny v ČR dle Českého statistického
úřadu. Může se to zdát jednoduché, podobně se provádí průzkumy veřejného
mínění, ale zkušební testy nemůže zadávat každý, dotyčný musí být vyškolený,
musí zachovávat správný postup a také dbát na utajení. Protože v okamžiku, kdy
test unikne na veřejnost, ztrácí význam. Pokud ho znáte předem, nebude mít
vypovídající hodnotu. Takže testovaní například nesmějí mít u sebe žádné
elektronické přístroje, nedá se to dělat na počítači a tak dále.
V jaké jste nyní fázi? Mohou se
čtenáři třeba přihlásit jako testovací osoby?
Momentálně máme po několika beta
verzích a zkušebních testováních vytvořenou finální podobu testu a začínáme
normování. Potřebujeme co nejreprezentativnější a největší vzorek, takže každý
zájemce je vítán. Více informací a registraci naleznete na adrese
mensa.click/u4.
Jak moc se liší nové úlohy od těch
starých?
Dost. Už jen tím, že nově není jen
jedna sada, ale jsou dva subtesty. K měření inteligence u dětí se používají
nejčastěji matice, kde testovaný vidí určitý sled obrázků, ke kterým má doplnit
nějaký chybějící. K tomu má na výběr několik, obvykle osm možností. Druhý je
pak taková matematika bez čísel, kde děti vyvažují misky vah. Každý z nich trvá
zhruba dvacet minut. U dospělých budeme mít také dva subtesty, první budou opět
matice a druhý číselné řady. Občas nám lidé říkají, že se matematiky bojí, že
jim nikdy nešla… ale o matematiku zde opravdu nejde. Spíš o kombinatoriku
jednotlivých číslic, kdy se zamýšlíte nad tím, co s čím a jak souvisí. Jediné,
co musíte umět, jsou základní operace s číslicemi na úrovni třeba 3. – 4. třídy
základní školy.
Když srovnáte první verzi testu a tu
finální… Jak moc se u dětí liší?
Tu první byste v té finální vůbec
nepoznala. My jsme ale předem počítali s tím, že se polovina položek úplně
vyhodí, druhá se ještě doplní, část se reorganizuje a stále se to bude
pročesávat, pročesávat, pročesávat.
V čem konkrétně?
Například na začátku vytvoříte test
s dvaceti položkami a ověřujete, jestli je děti mohou do časového limitu
stihnout. Pak přichází na řadu obtížnost. Protože test vzniká pro účely Mensy,
chcete, aby dobře rozlišil úroveň kolem 130 bodů. Takže zase musíte skloubit
obtížnost a časový limit. Pak musíte položky roztřídit a seřadit podle
obtížnosti. A to jde opět jen tak, že verzi předložíte určitému počtu lidí. Pak
například zjistíte, že děti, které jej vyplnily téměř bezchybně, často pohořely
na určité položce. Což ukazuje, že je pro ně ten daný bod matoucí. Tak se musí
přepracovat, protože vy nechcete testovat pozornost, ale inteligenci. Ven musí
všechny možné nejasnosti. Nesourodost položek se zjišťuje i různými
statistickými metodami, ale výsledky musí vždy interpretovat člověk – software
neví, co měří, jen ukáže, že tam něco nesedí.
Testujete tedy postupně na různých
skupinách?
Ano, první kola byla vždy zhruba na
padesáti šedesáti dětech a postupně jsme jejich počet zvyšovali. Oněch patnáct
set, to byla ta poslední, velká skupina. Předtím jsme test vyvíjeli a průběžně
testovali na celkem několika stovkách dětí.
Mluvili jsme o Flynnově efektu, zkoušeli
jste v praxi, jestli se u dětí budou lišit výsledky starého a nového
testu?
To nás také zajímalo a očekávali
jsme, že rozdíly budou. Proto jsme udělali experiment, v níž skupina třiceti
dětí dělala jak ten starý test, tak i ten nový. A rozdíl byl několik bodů ve
prospěch toho starého. Okolo středu byly výsledky téměř shodné, ale čím jsme
šli výše, tím byly rozdíly vyšší. Čili těm, kterým starý test naměřil například
130, získali v novém 125 nebo i méně. Je vidět, že se populace za těch dvacet let
trochu posunula a test to odráží, nicméně konkrétní čísla je třeba brát s
rezervou.
Do jakých hodnot vaše testy
spolehlivě měří?
To je trochu kámen úrazu všech
testů. Záleží totiž na tom, kolik lidí se otestovalo na úvod. Žádný test vám
přesně neurčí hodnoty nad 150. Když si to vezmete matematicky, tak víte, že IQ
nad 100 má jeden ze dvou lidí, IQ
Tvorba takového testu je ohromná
zodpovědnost…
Ano, zodpovědnost cítím velikou. A
nejen z testu samotného, mnohem víc možná z jeho interpretace. I proto po jeho
absolvování v Mense nezískáte jen číslo, ale i komentář na A4. V něm jsem
stokrát vážil každé slovo, abych dostatečně zdůraznil, že se jedná o orientační
hodnotu, o percentil populace, že existuje tisíc a jedna okolnost, kdy vám test
naměří nižší hodnotu než je ta reálná, a že to vůbec nic nemusí znamenat. Že
vyšší či nižší IQ nedělá člověka šťastným či nešťastným. Takže ano,
zodpovědnost je to opravdu velká.
To trochu zní, jako by to ani nebylo
důležité…
Myslím si, že dříve hodnotu IQ
značně přeceňovali odborníci a dnes ji přeceňuje veřejnost. Odborníci už vědí,
že o úspěchu či neúspěchu v práci i životě rozhoduje celá řada faktorů. U laiků
se však setkávám s tím, že vysoké IQ je pro ně něco, co je hodné následování.
Často si myslíme, že to dává člověku jakousi větší pravdu nebo autoritu. Ale
přitom když si vezmete dva lidi, kteří mají stejně vysoké IQ, často mají opačné
názory, pohledy na politiku, na společenská témata, na cokoliv. Vysoké IQ tak pro
mě automaticky moc neznamená. Pokud máme společnou oblast zájmu nebo si sedneme
osobnostně, znamená to, že si asi dobře pokecáme, ale samotná inteligence? Je
to samozřejmě výborná věc, fascinuje mě, ale myslím, že ji trochu přeceňujeme.
________________________
Vladimír Marček je
brněnský psycholog a psychoterapeut. Zaměřuje se na práci s nadanými dětmi, pro
organizaci Mensa vytváří nové IQ testy pro děti i dospělé, pravidelně také
jezdí jako psycholog na tábory pro nadané děti, které Mensa organizuje.
0 komentářů:
Okomentovat