Neue PS-Explore-Funktionen für die Sortierung und Verdichtung
von Daten
Seit jeher bietet PS-Explore
diverse Sortier- und Verdichtungsfunktionen an. Mit dem nun freige-gebenen
neuen Verfahren ist eine erhebliche Erweiterung der Sortiermöglichkeiten verfügbar.
Es gibt nun keine Begrenzung der Anzahl der Sortiermerkmale
(Arbeitsblattspalten) mehr. Ebenso können beliebig viele Merkmale zur
Verdichtung von Daten eines Arbeitsblattes benutzt werden. Unter Verdichtung
wird hierbei die Berechnung von statistischen Kennwerten für durch die
Sortierkriterien vorgegebenen Untergruppen eines Datensatzes verstanden.
Der Aufruf des Verfahrens geschieht über die
Tastenkombination UMSCH+ALT+S oder wahlweise über das Pop-Up-Menü
(rechte Maustaste) des Arbeitsblattes:

Ebenso ist ein Aufruf aus der Hauptmenüleiste von PS-Explore über „Analyse/Report“/ Diverses /“Daten
sortieren und aggregieren“ möglich:

Oder über „Analyse/Report“/Datenanalyse/Tabellen/“Daten
sortieren und aggregieren“

Nach dem Aufruf erscheint das Fenster für die Auswahl der
Sortiermerkmale (Arbeitsblattspalten):

Die Auswahl erfolgt i.d.R. durch
Anklicken der jeweiligen Kästchen vor dem Merkmalsnamen in der links stehenden
Variablenliste. Dabei wird das jeweils aktivierte Merkmal rechts in der Liste
der Sortiermerkmale angezeigt. Wichtig ist, zu berücksichtigen, dass eine
Sortierung nicht kommutativ ist, es also auf die
Reihenfolge der Auswahl der Merkmale ankommt, wie letztlich sortiert wird.
Man kann auch nach Auswahl der Merkmale für die Sortierliste
noch die Reihenfolge der Merkmale ändern. Dies geschieht per windowsüblichem Drag-and-Drop, d.h. man fährt mit dem Mauszeiger auf den
Merkmalsnamen rechts in der Liste, drückt die linke Maustaste und schiebt das
Merkmal bzw. die Zeile mit dem Namen in der Liste an die gewünschte neue
Stelle.
Beide Fensterteile verfügen übrigens auch über ein Pop-Up-Menü mittels dessen man eine bereits getroffene
Auswahl komplett aufheben oder umkehren kann, bzw. alle Merkmale auf einen
Schlag markiert.
Im rechten Fenster befinden sich ebenfalls Kästchen vor den
Namen des Sortiermerkmals. Ein Häkchen bedeutet dabei, dass die Sortierung für
das betreffende Merkmal nicht aufsteigend, sondern absteigend erfolgen soll:

Die eigentliche Sortierung erfolgt nach der Auswahl der
Merkmale und der Sortierrichtung, indem man auf die mit „Sortieren“
beschriftete Schaltfläche links unten im Fenster klickt. Die Sortierung geschieht
dann unmittelbar im Arbeitsblatt selbst. Anschließend ist die Schaltfläche „Aggregieren“ aktiviert und kann angewählt werden:

Bei Anklicken der Aggregieren-Schaltfläche
erscheint in der unteren Hälfte des Sortierfensters ein neues Teilfenster. Hier
findet man ein Arbeitsblatt mit den aus dem Sortiervorgang resultierenden
Klassen und Kombinationen dieser Klassen über die verschiedenen Merkmale:

Oberhalb dieses Arbeitsblattes sieht man eine Leiste mit
Schaltknöpfen (Buttons) mittels derer man nun bestimmen kann, welche
statistischen Kennwerte berechnet werden sollen. Ferner gibt es verschiedene
Buttons, die es erlauben, das Ausgabemedium für die zu berechnende Tabelle
festzulegen und das Layout der Tabelle zu verändern.
Zunächst muss natürlich angegeben werden, über welches
Merkmal oder welche Merkmale des Arbeitsblattes man Kennwerte berechnen will.
Dies geschieht mittels der in nachstehender Abbildung gekennzeichneten Listbox
der quantitativen Merkmale des Arbeitsblattes. Hier im Beispiel wurde die
Variable „Anz.WE.im.Haus“ ausgewählt:

Nach Auswahl eines Merkmals sind die Buttons für die
statistischen Kennwerte aktiviert:

Zur Zeit können hier folgende Kennwerte berechnet werden:
1)
Summen,
2)
Häufigkeiten
(Anzahl)
3)
arithmetisches
Mittel
4)
Anzahl
der „Fehlwerte“
5)
Die
Konfidenzintervalle (95%, 99%)
6)
Standardabweichung,
Variationskoeffizient, Varianz, Standardfehler
7)
Minimum,
Maximum und Spannweite,
8)
5%-,
10%- und 15%-getrimmter Mittelwert, Biweight-Mittelwert,
9)
5%-,
10%- und 15%-getrimmte Standardabweichung,
10) unteres, oberes Quartil
und Median,
11) Schiefe und Kurtosis
sowie deren Standardfehler und Signifikanz.
Verschiedene Layoutoptionen sind ebenfalls verfügbar. So
lassen sich zur Gewinnung von etwas mehr Übersichtlichkeit redundante
Informationen ausblenden, sprich die Zeilenbezeichnungen können „ausgedünnt“
werden:

Standardmäßig werden nur die Klassenkombinationen
ausgegeben, die empirisch auch vorkommen. Mit der Option „leere Klassen“ in
Tabelle einfügen, kann man theoretisch mögliche jedoch real nicht vorkommende
Klassenkombinationen der Vollständigkeit wegen einblenden. Diese Option ist natürlich
nur aktivierbar, wenn die Sortiermerkmale gänzlich Klassenvariablen sind:

Die Ausgabe einer Tabelle mit statistischen Kennwerte
erfolgt unmittelbar im Arbeitsblatt des Sortierfensters. Darüber hinaus ist es
möglich die Tabelle über die entsprechenden Buttons links in der Bildleiste des
Arbeitsblattes direkt auf dem Drucker auszugeben oder sie in die Registerkarte
Ergebnisse/Reports von PS-Explore zu transferieren.
Ebenfalls möglich ist die Übergabe in die Zwischenablage von Windows:

Man kann Statistiken für verschiedene numerische Merkmale
des Arbeitsblattes berechnen, indem man in der Listbox der Merkmale
nacheinander die gewünschten Variablen auswählt und dann die entsprechenden
Statistikbuttons anklickt. Will man einzelne Berechnungen später dann doch
nicht in die endgültige Tabelle übernehmen, so können die jeweiligen Spalten
markiert und über den Löschbutton entfernt werden, ebenfalls möglich ist es,
die Spalten mit den berechneten Kennwerten zu verschieben. Man geht hierzu mit
dem Mauszeiger auf den Titel der gewünschten Tabellenspalte, drückt die linke
Maustaste und bewegt die Spalte in die Zielposition:

Ebenfalls möglich ist es Zeilen aus einer Tabelle zu löschen
oder diese zu verschieben. Allerdings wird hiernach die weitere Berechnung von
Kennwerten blockiert. Es ist daher sinnvoll alle Editierfunktionen der Tabelle
erst zu nutzen, wenn man alle gewünschten Berechnungen ausgeführt hat:

Die bislang in die hier beschriebene PS-Explore-Prozedur
einprogrammierten Statistiken entsprechen dem allgemein gebräuchlichen. Weitere
Kennwerte werden nach Benutzerwunsch realisiert.
Für Ende Mai/Anfang Juni ist die Implementierung eines
entsprechenden Makrobefehls für die neue Sortier- und Aggregationsfunktion
in Vorbereitung.