Arnošt Veselý: Cíle a využití celostátního testování žáků v povinném vzdělání

středa 31. srpna 2011 ·

Podle vyjádření vedení Ministerstva školství, mládeže a tělovýchovy by mělo být v roce 2013 naostro spuštěno státem organizované plošné testování žáků 5. a 9. tříd. Tento záměr přinesl bouřlivou diskusi o možnostech a mezích takového opatření a o jeho možných negativních důsledcích.


Zdroj: časopis Řízení školy (2011/11, s. 21–25), publikováno EDUin 22. 8. 2011

 

„Jak ukazují výzkumy, ředitelé, rodiče i široká veřejnost jsou v názoru na užitečnost plošného testování značně rozpolcení (viz např. dotazníkové šetření názorů ředitelů na centrální testování – Řízení školy č. 12/2010). Názory oscilují od obrovských očekávání (např. že plošné testování podstatně zvýší kvalitu vzdělávání) až po jednoznačné odmítání jakékoli formy testování. Cílem tohoto článku je vrátit se ke dvěma základním otázkám, bez jejichž zodpovězení není žádná racionální debata o testování možná:
1) Čeho se má centrálním testováním dosáhnout?
2) Jak s výsledky testování naložit, aby těchto cílů bylo dosaženo?

První otázka se týká cílů testování, druhá pak jeho využití. Teprve dojde-li se k základní shodě v odpovědích na tyto otázky, může se smysluplně diskutovat o konkrétní podobě testování (např. o formě, obsahu a načasování testů).“

„…Cíle testování mají zásadní důsledky pro zvolení optimální formy testování. Roli zde hraje nejen to, nakolik daná forma testování odpovídá danému účelu, ale také nakolik je ekonomicky efektivní a administrativně proveditelná. Je potřeba si uvědomit, že testování není vůbec levné a jednoduché na organizaci a že prostředky do něj investované mohou být využity jiným způsobem.

Provázanost cílů s jejich formou ukážu na příkladu dvou možných cílů (aniž bych tyto cíle samotné nějak hodnotil). Pokud jde především o monitorování výsledků celého vzdělávacího systému a jejich vývoj v čase, jeví se zpravidla jako nejvhodnější a ekonomicky nejefektivnější zvolit reprezentativní výběrové šetření namísto plošného šetření všech škol. Takové šetření, při dobrém metodologickém zvládnutí, je s to poskytnout prakticky totožné informace o trendech ve znalostech žáků jako centrální testování, a to s ušetřením velkého množství času jak žáků, tak učitelů a ředitelů škol. Pokud je naopak cílem vytvářet „žebříčky“ škol anebo jakkoli školy hodnotit na základě výsledků žáků v centrálních testech, je nezbytné vytvořit velmi precizní způsob měření, který bude s to nějakým způsobem korigovat odlišnost žáků v jednotlivých školách. Jednou z možností je např. zjišťování socioekonomického zázemí žáků, anebo měření výsledků jednotlivých žáků před nástupem do školy, respektive na jejím počátku (tedy zjišťování tzv. přidané hodnoty).“

„…Co je ovšem ještě důležitější, využívání jednoho testu pro několik účelů najednou není většinou možné, protože různé podoby testování poskytují jinou formu informace. Z tohoto důvodu musí vypadat jinak testování např. pro diagnostiku žáků se speciálními potřebami, jinak pro monitorování systému v čase a ještě jinak pro diferenciaci žáků. Pokušení využívat výsledky testů k jiným účelům, než bylo původně stanoveno, je přitom velmi vysoké. Zde se opět můžeme poučit z příkladu státních maturit: přestože oficiálním cílem maturit nikdy nebylo srovnávat školy a vytvářet žebříčky, přesto k takovému srovnání došlo (byť zatím jen těch s „nejlepšími“ výsledky), přičemž školy s nejlepšími výsledky u maturitní zkoušky byly prohlášeny za nejkvalitnější. Jde přitom o typický příklad špatného využití informací, původně vzniklých za jiným účelem. Bez dalších informací o povaze žáků, kteří na škole studují (zejména o jejich znalostech, když do školy vstupovali) totiž není vůbec možné se o srovnání kvality škol byť jen pokusit (to, že i tak je takové srovnání velmi problematické, ponechávám nyní stranou). Ať již tedy zastáváme jakýkoli postoj k testování, měli bychom se ze státních maturit poučit v tom, že cíle testování je třeba explicitně a konzistentně formulovat a pak se jich při realizaci striktně držet…“


Závěry

„…V poslední době jsme často svědky zjednodušené diskuse o tom, zda „testovat či netestovat“. To je ovšem špatně položená otázka, na kterou nelze odpovědět, pokud není jasně řečeno, k čemu bude testování využito a jak bude konkrétně probíhat. Přitom platí, že každý cíl vyžaduje specifickou formu testování a že je zpravidla velmi neefektivní (někdy dokonce až nebezpečné), pokud chceme, aby testování bylo „sluhou více pánů“. Cílem tohoto článku není říci, jaké cíle a využití testování jsou správné. To je otázkou politického rozhodnutí s přihlédnutím k výzkumným poznatkům o efektech různých forem testování. Mým cílem bylo ukázat, jak bychom měli o tomto opatření uvažovat a diskutovat.

Bohužel pro diskuse o testování je zatím stále typické, že jsou příliš obecné („poskytneme zpětnou vazbu školám“) anebo naopak příliš konkrétní (jaký konkrétní obsah vzdělávání a kdy by se měl testovat). V diskusích se zcela opomíjí otázky jako: Může centrální testování nějak pomoci ředitelům škol? Jakou novou informaci pro ně poskytne nad rámec dnes již běžně prováděných externích testů? Jak mohou být výsledky centrálních testů využity pro interní hodnocení škol a jejich zlepšování? Je mimo jiné také na ředitelích škol, učitelích a dalších pracovnících ve školství, aby se vyjádřili k tomu, kterou formu centrálního testování (pokud nějakou) považují za užitečnou a jak konkrétně by jim pomohla v jejich práci.

V diskusích o cílích a využití testování bychom se měli inspirovat také zahraničními zkušenostmi. Ačkoli to není předmětem tohoto článku a vyžádalo by si to podrobnější rozbor, připomeňme, že očekávání vkládaná do „high-stakes“ testování se v zahraničí nenaplnila. Bezprostřední propojení testování s rozhodováním zpravidla vedlo k mnoha nezamýšleným důsledkům – redukci obsahu vzdělávání na „testovatelné“ položky, nepřiměřenému stresu žáků, a dokonce přímo k podvádění při testování. Silná negativní reakce odborníků na zavedení „high-stakes“ testování vedla ke změně postojů MŠMT o využití výsledků testování. Jestliže ještě před rokem měly být školy s dobrými výsledky finančně oceněny, dnes se již prý žádné sestavování žebříčků nechystá.

Každopádně pokud by skutečně došlo k rozhodnutí, přes všechny možné negativní důsledky, že centrální testování má mít podobu „high-stakes“, je nezbytné toto stanovit předem a provést testování absolutně profesionálně a metodologicky rigorózně. Připomínám, že každé testování je zatíženo poměrně velkou chybou měření, danou mimo jiné tím, že během relativně krátkého času je potřeba otestovat velké penzum znalostí a dovedností. To neznamená, že testování pro účely monitoringu systému je jednoduché – samozřejmě i to musí být provedeno maximálně rigorózně.

Nicméně riziko špatného zobecnění na celý systém je při dobrém výběrovém vzorku mnohem menší než při zobecnění na jednotlivou školu. Cíle, využití a forma testování tak musejí být v souladu. Nelze připravit testování s cílem monitoringu a následně ho využít pro hodnocení kvality škol. To by mělo závažné důsledky nejen pro žáky a školy, ale nakonec i pro celý vzdělávací systém v České republice. Jak jsme viděli v případě státních maturit, pokušení užívat data k úplně jiným cílům, než ke kterým byla sebrána, je opravdu vysoké. Proto je třeba maximálně přesně předem vymezit cíle a využití testování a pokud možno toto ukotvit i v legislativě.“


Celý text článku si můžete přečíst ZDE.

0 komentářů: