Extremgruppen (EG)
3.1 HERLEITUNG UND EINORDNUNG DER ZUSÄTZLICHEN BERECHNUNGEN
Ausgangsdaten für die folgenden Berechnungen sind die ursprünglichen Ergebnisse des "Forschungsbericht: Erprobung und Evaluation des Hörtraining: Audiva in dritten Grundschulklassen, Landau 2008". Bei den Auswertungen dieser Studie hatte sich, wie bereits erwähnt, herausgestellt, dass sich in der Treatmentgruppe viele Kinder mit unproblematischen Leistungen befanden, bei denen das AUDIVA Training keine Verbesserung bewirken konnte, da es von der Konzeption her erst ab geringeren bzw. problematischen (Teil-) Leistungen überhaupt einen Effekt zeigen kann und was durch die Testungen dokumentierbar wäre. Dementsprechend ergaben sich bei den statistischen Auswertungen über alle Kinder nur geringe Effekte des AUDIVA Trainings. Die Bildung einer Extremgruppe und die Durchführung weiterer Berechnungen mit dieser Gruppe schien daher angezeigt. Der Extremgruppe wurden all diejenigen Kinder der ursprünglichen Treatmentgruppe (Gruppe 1 und 2: ursprüngliche Messzeitpunkte 1 und 2) zugeordnet, deren Bewertungen im Fragebogen für Lehrer/innen bzw. deren Testleistungen in einem Bereich lagen, der als nicht ausreichend oder sogar problematisch gelten kann. Da bereits bei einer Einzelperson die Leistungen in Teilbereichen (Subtests) stark schwanken können, wurde die Extremgruppe nicht anhand der Gesamtleistung, sondern jeweils pro Teilbereich gebildet, um so spezifische Veränderungen besser darstellen zu können. Daher liegen pro Subtest leicht unterschiedliche Extremgruppen vor.
Für die Treatmentgruppe war die Bildung der jeweiligen Extremgruppe problemlos möglich. Für ein korrektes Vorgehen hätte diese Extremgruppe nun mit einer entsprechend zusammengesetzten Kontrollgruppe verglichen werden müssen. Die Anzahl der Kinder mit problematischen Leistungen bzw. Bewertungen für die einzelnen (Sub-)Tests bzw. Fragebogenskalen war in der vorhandenen Kontrollgruppe allerdings so gering, dass sinnvolle Berechnungen nicht durchgeführt werden konnten. Die Extremgruppe der Treatmentgruppe wurde daher mit der ursprünglichen Kontrollgruppe verglichen, da ein solcher Vergleich dem völligen Verzicht auf eine Kontrollgruppe vorzuziehen ist. Auch wenn die beiden Gruppen verschiedene Populationen widerspiegeln, kann davon ausgegangen werden, dass sich eine zeitliche Weiterentwicklung der Leistungen der Kinder sowie Testübungseffekte durch einen (signifikanten) Anstieg der Werte in der Kontrollgruppe zeigen müssten. Sollte dies der Fall sein, könnte eine vergleichbare signifikante Verbesserung in der Extremgruppe nicht auf einen Effekt des AUDIVA Trainings zurückgeführt werden, sondern genauso gut Resultat anderer Einflüsse oder Entwicklungen sein. Sollten sich in der Kontrollgruppe keine signifikanten Leistungsverbesserungen finden, in der Extremgruppe hingegen schon, kann dies als Hinweis auf einen Effekt des AUDIVA Trainings gewertet werden.
Das üblicherweise für den direkten statistischen Vergleich des Verlaufs zweier Gruppen über die Zeit hinweg anzuwendende Verfahren, die zweifaktorielle Varianzanalyse (mit Messwiederholung), konnte bei den vorliegenden Daten nicht angewendet werden, da die Grundvoraussetzungen für parametrische Verfahren (Normalverteilung, Varianzhomogenität, z.T. auch Häufigkeit und Intervallskalenniveau) nicht erfüllt waren. Eine nonparametrische Variante steht für diese Art von Vergleich nicht zur Verfügung. Daher wurde in der Extrem- und Kontrollgruppe für alle vorgestellten Berechnungen von Unterschieden zwischen den beiden Messzeitpunkten auf einen einfachen nonparametrischen Mittelwertsvergleich (Wilcoxon-Test) zurückgegriffen, und die Verläufe der beiden Gruppen werden einander im Folgenden deskriptiv gegenüber gestellt.
Von den Berechnungen wurden die Ergebnisse einiger Kinder im Aufmerksamkeitstester und Hörscreener (4-6, je nach Test und Messzeitpunkt) ausgeschlossen, da diese bei den Tests entweder die Anweisungen nicht richtig umsetzen konnten oder nicht mitarbeiten wollten, was dazu führte, dass sie entweder immer oder nie eine Taste drückten, unabhängig von den vorgegebenen Reizen bzw. Aufgaben.
Zusätzlich muss angemerkt werden, dass bei einem großen Teil der Kinder von Seiten der Eltern eine Angabe des Geburtsdatums aus Datenschutzgründen nicht gewünscht wurde, so dass zum Alter keine genauen Zahlen vorliegen. Da aber alle Testungen in der dritten bzw. in einigen Fällen in der zweiten Klasse durchgeführt wurden, kann eine Altersspanne von 7-9 Jahren für die teilnehmenden Kinder angenommen werden.
3.2 TESTGÜTEKRITERIEN
Bei allen eingesetzten Tests (Aufmerksamkeitstest, Hörscreener, Audiva Test-CD) ist wegen der gleich bleibenden objektiven Testung mit technischen Geräten, stets gleicher Einführung und Anweisungen sowie der maschinellen Ergebnisregistrierung beim Aufmerksamkeitstester und Hörscreener und dem vorgegebenen Auswertungsbogen bei der Audiva-Test-CD eine hohe Durchführungsobjektivität gegeben. Aufgrund der schriftlichen Form des Fragebogens für Lehrer/innen und der schriftlich beigefügten Erläuterung und Bearbeitungshinweise kann auch bei diesem Instrument von einer guten Durchführungsobjektivität ausgegangen werden. Aus den vordefinierten Antwortformaten des Fragebogens für Lehrer/innen und der bei den objektiven Tests immer nach festen Regeln vorgenommenen Umrechnung der Zahlen sowie der Anwendung wissenschaftlicher statistischer Verfahren bei der Auswertung aller Daten resultiert eine ebenfalls als hoch zu bewertende Auswertungs- und Interpretationsobjektivität.
Die Tests und der Fragebogen wurden unter Einbezug bisheriger Erfahrungen aus der Praxis und gleichzeitig eng theoriegeleitet konstruiert, um eine ausreichende Inhalts- bzw. Konstruktvalidität herzustellen. Aus organisatorischen Gründen war im Rahmen der Studie eine externe Validierung (Kriteriumsvalidität) nicht möglich.
Da die einzelnen Items des Aufmerksamkeitstests und des Hörscreeners stets von gleicher Art sind, ist die Reliabilität dieser Tests, berechnet als Cronbachs Alpha, hoch (siehe Punkt 4.1 und 4.2). Bei den Subtests der Audiva Test-CD liegt die Reliabilität der Subskalen im niedrigen bis mittleren Bereich (Punkt 4.3). Die Reliabilität der Summenskalen des Fragebogens für Lehrer/innen kann für alle Skalen als gut bezeichnet werden (siehe Punkt 4.4).
3.3 AUSGESCHLOSSENE TESTS BZW. FRAGEN
In der folgenden Auswertung wurde, im Gegensatz zur „Landau-Studie“ der Fragebogen für Eltern aus den in Punkt 2.2.1 genannten Gründen nicht mit einbezogen. Bei den Aufgaben der Audiva Test-CD wurde das Nachsprechen von Nonsenssilben (Mottier) herausgenommen, da die Durchführenden das Abbruchkriterium unterschiedlich gehandhabt hatten, was die Ergebnisse möglicherweise verfälscht haben könnte. Das Nacherzählen der Geschichte wurde wegen unterschiedlicher Handhabung der Fehlernotierung aus denselben Gründen in der Auswertung nicht berücksichtigt.


