Neues zur PS-Explore-Tabellierungsprozedur AgTab
Die Tabellierungsprozedur AgTab in PS-Explore gehört wahrscheinlich zu den am häufigsten benutzten Verfahren des Programmsystems. AgTab macht zwar nichts, was man irgendwie als statistisch aufregend oder spannend bezeichnen könnte, aber es liefert eben ohne Aufwand die wichtigsten basisstatistischen Auswertungen: Häufigkeiten, Mittelwerte und Streuungen für eine Stichprobe oder mehrere Untergruppen hiervon.
Der Aufruf der AgTab-Verfahren im PS-Explore-Hauptbildschirm (Autopilot) erfolgt über die in nachstehender Abbildung rot markierten Schaltknöpfe:

Im Kontext der vorzustellenden Neuerungen interessieren hier nur die über das erste und das dritte der markierten Symbole zugängigen Möglichkeiten. Bei Klick auf das erste Symbol erhalten wir folgendes Formular angezeigt:

Neu hinzugekommen sind nun folgende statistischen Kennwerte:
Entsprechend dem getrimmten Mittelwert kann man ein entsprechendes Maß für die Streuung einer Datenreihe angeben, die getrimmte Varianz bzw. Standardabweichung.
Hierbei lässt man einfach einen bestimmten Prozentsatz α von extremen Werten der Datenreihe bei der Berechnung der Varianz weg. Allerdings wird dann ein Korrekturfaktor für die Varianz benötigt (Huber, Peter J. (1981), Robust Statistics, John Wiley and Sons, New York). Der Anpassungsfaktor, mit dem die berechnete Varianz zu multiplizieren ist, lautet für 5% 4/3, für 10% 1,7 und für 25% 3,85. Allgemein lässt sich dies in der Formel ausdrücken:

wobei F(x) die Dichte und Q1-α das (1-α)-Quantil der Standard-Normalverteilung N(0,1) ist.
Beim 1/6-getrimmten Mittel werden jeweils rund 16,67% der Werte auf beiden Seiten der Häufigkeitsverteilung entfernt, bevor die Berechnung der Statistik erfolgt. Entsprechend verfährt man bei der Varianz und Standardabweichung. Hier das Beispiel einer Tabelle mit getrimmtem Mittelwert und Standardabweichung wie sie im Ergebnisbereich von PS-Explore ausgegeben wird:

Wählt man vor Start des Verfahrens zusätzlich zu getrimmtem Mittelwert und/oder getrimmter Standardabweichung auch die Option „Stichprobengröße“, dann wird neben der ursprünglichen Stichprobengröße auch die Anzahl der nach Trimmung verbleibenden Werte ausgegeben.
Dort, wo man die Trimmung (Kappung) von Datenreihen benutzt, werden im allgemeinen Ausreißer in den Datenreihen vermutet, deren Einfluss man aus der berechneten Kenngröße isolieren will. Da lag es nahe, gleich auch entsprechende Ausreißerinformationen in den AgTab-Tabellen unterzubringen. PS-Explore hat eine sehr umfangreiche eigene Prozedur für die Ausreißeranalyse:

Es ist jedoch sicherlich recht praktisch, die Information über das Vorhandensein von Ausreißern ggf. auch in einer AgTab-Tabelle zu haben:

Wählt man die Option „Ausreißerinformationen“, so werden 3 zusätzliche Spalten in die Tabelle aufgenommen:

Die Ausreißer werden hierbei bestimmt nach der hinlänglich bekannten „Boxplot-Regel“ von J.W. Tukey. (Tukey, J.W. (1977), Exploratory Data Analysis, Addison-Wesley, Reading, Mass.)
Genau genommen ist die Verwendung von getrimmten Kennwerten, insbesondere die der getrimmten Standardabweichung, gebunden an die Annahme der Normalverteilung der Beobachtungswerte (Ausreißer abgerechnet). Somit war es nahe liegend auch einen Kennwert für die Bewertung der Schiefe einer Verteilung in die AgTab-Prozedur aufzunehmen:

Berechnet wird hier die Schiefe A nach Yules, die nebenbei auch relativ ausreißerresistent ist:

mit Q3 und Q1
als oberem und unterem Quartil und
als arithmetischem Mittel:

Da der Schiefewert für sich genommen nicht unbedingt „sprechend“ ist, wird hier gleich auch die Signifikanz auf dem 5%-Niveau berechnet und in der Tabelle durch einen Stern hinter den Zahlenwert indiziert, so dass kritische Verteilungskonstellationen gleich identifiziert werden können.
Insgesamt sind die neuen Möglichkeiten von AgTab recht reizvoll und vor allem im Kontext der Tabellierung sehr praktisch, wenngleich sie auch von anderen Prozeduren in PS-Explore angeboten werden. Die statistischen und tabellarischen Möglichkeiten von AgTab werden etwa auch von der Sortier- und Aggregationsroutine angeboten:

Hier sind auch einige über AgTab hinausgehende Verfahren gegeben. Allerdings hat AgTab als eine der ältesten Prozeduren in PS-Explore eine lange Anwendertradition. Ein klarer Vorteil von AgTab ist sicherlich auch, dass diese Prozedur in Makros aufgerufen und in vielfältiger Form und zahlreichen Optionen benutzt werden kann.
Da beim Aufruf von AgTab die entsprechenden Makrobefehle in der Makroliste automatisch mitprotokolliert werden, wird an dieser Stelle darauf verzichtet, die Erweiterungen bei den Makrobefehlen zu beschreiben. Ohnehin sind diese für den „Normalanwender“ nicht von Belang.
Die AgTab-Prozedur kann ebenfalls zur Generierung von Kreuztabellen benutzt werden. Auch hier sind die beschriebenen zusätzlichen Kennwerte verfügbar:
