Neue PS-Explore-Funktionen für die Sortierung und Verdichtung von Daten

 

Seit jeher bietet PS-Explore diverse Sortier- und Verdichtungsfunktionen an. Mit dem nun freige-gebenen neuen Verfahren ist eine erhebliche Erweiterung der Sortiermöglichkeiten verfügbar. Es gibt nun keine Begrenzung der Anzahl der Sortiermerkmale (Arbeitsblattspalten) mehr. Ebenso können beliebig viele Merkmale zur Verdichtung von Daten eines Arbeitsblattes benutzt werden. Unter Verdichtung wird hierbei die Berechnung von statistischen Kennwerten für durch die Sortierkriterien vorgegebenen Untergruppen eines Datensatzes verstanden.

 

Der Aufruf des Verfahrens geschieht über die Tastenkombination UMSCH+ALT+S oder wahlweise über das Pop-Up-Menü (rechte Maustaste) des Arbeitsblattes:

 

 

Ebenso ist ein Aufruf aus der Hauptmenüleiste von PS-Explore über „Analyse/Report“/ Diverses /“Daten sortieren und aggregieren“ möglich:

 

 

 

Oder über „Analyse/Report“/Datenanalyse/Tabellen/“Daten sortieren und aggregieren

 

 

 

Nach dem Aufruf erscheint das Fenster für die Auswahl der Sortiermerkmale (Arbeitsblattspalten):

 

 

Die Auswahl erfolgt i.d.R. durch Anklicken der jeweiligen Kästchen vor dem Merkmalsnamen in der links stehenden Variablenliste. Dabei wird das jeweils aktivierte Merkmal rechts in der Liste der Sortiermerkmale angezeigt. Wichtig ist, zu berücksichtigen, dass eine Sortierung nicht kommutativ ist, es also auf die Reihenfolge der Auswahl der Merkmale ankommt, wie letztlich sortiert wird.

 

Man kann auch nach Auswahl der Merkmale für die Sortierliste noch die Reihenfolge der Merkmale ändern. Dies geschieht per windowsüblichem Drag-and-Drop, d.h. man fährt mit dem Mauszeiger auf den Merkmalsnamen rechts in der Liste, drückt die linke Maustaste und schiebt das Merkmal bzw. die Zeile mit dem Namen in der Liste an die gewünschte neue Stelle.

 

Beide Fensterteile verfügen übrigens auch über ein Pop-Up-Menü mittels dessen man eine bereits getroffene Auswahl komplett aufheben oder umkehren kann, bzw. alle Merkmale auf einen Schlag markiert.

 

Im rechten Fenster befinden sich ebenfalls Kästchen vor den Namen des Sortiermerkmals. Ein Häkchen bedeutet dabei, dass die Sortierung für das betreffende Merkmal nicht aufsteigend, sondern absteigend erfolgen soll:

 

 

 

Die eigentliche Sortierung erfolgt nach der Auswahl der Merkmale und der Sortierrichtung, indem man auf die mit „Sortieren“ beschriftete Schaltfläche links unten im Fenster klickt. Die Sortierung geschieht dann unmittelbar im Arbeitsblatt selbst. Anschließend ist die Schaltfläche „Aggregieren“ aktiviert und kann angewählt werden:

 

 

 

Bei Anklicken der Aggregieren-Schaltfläche erscheint in der unteren Hälfte des Sortierfensters ein neues Teilfenster. Hier findet man ein Arbeitsblatt mit den aus dem Sortiervorgang resultierenden Klassen und Kombinationen dieser Klassen über die verschiedenen Merkmale:

 

 

Oberhalb dieses Arbeitsblattes sieht man eine Leiste mit Schaltknöpfen (Buttons) mittels derer man nun bestimmen kann, welche statistischen Kennwerte berechnet werden sollen. Ferner gibt es verschiedene Buttons, die es erlauben, das Ausgabemedium für die zu berechnende Tabelle festzulegen und das Layout der Tabelle zu verändern.

 

Zunächst muss natürlich angegeben werden, über welches Merkmal oder welche Merkmale des Arbeitsblattes man Kennwerte berechnen will. Dies geschieht mittels der in nachstehender Abbildung gekennzeichneten Listbox der quantitativen Merkmale des Arbeitsblattes. Hier im Beispiel wurde die Variable „Anz.WE.im.Haus“ ausgewählt:

 

 

Nach Auswahl eines Merkmals sind die Buttons für die statistischen Kennwerte aktiviert:

 

 

 

Zur Zeit können hier folgende Kennwerte berechnet werden:

 

1)     Summen,

2)     Häufigkeiten (Anzahl)

3)     arithmetisches Mittel

4)     Anzahl der „Fehlwerte“

5)     Die Konfidenzintervalle (95%, 99%)

6)     Standardabweichung, Variationskoeffizient, Varianz, Standardfehler

7)     Minimum, Maximum und Spannweite,

8)     5%-, 10%- und 15%-getrimmter Mittelwert, Biweight-Mittelwert,

9)     5%-, 10%- und 15%-getrimmte Standardabweichung,

10)  unteres, oberes Quartil und Median,

11)  Schiefe und Kurtosis sowie deren Standardfehler und Signifikanz.

 

 

Verschiedene Layoutoptionen sind ebenfalls verfügbar. So lassen sich zur Gewinnung von etwas mehr Übersichtlichkeit redundante Informationen ausblenden, sprich die Zeilenbezeichnungen können „ausgedünnt“ werden:

 

 

Standardmäßig werden nur die Klassenkombinationen ausgegeben, die empirisch auch vorkommen. Mit der Option „leere Klassen“ in Tabelle einfügen, kann man theoretisch mögliche jedoch real nicht vorkommende Klassenkombinationen der Vollständigkeit wegen einblenden. Diese Option ist natürlich nur aktivierbar, wenn die Sortiermerkmale gänzlich Klassenvariablen sind:

 

 

 

Die Ausgabe einer Tabelle mit statistischen Kennwerte erfolgt unmittelbar im Arbeitsblatt des Sortierfensters. Darüber hinaus ist es möglich die Tabelle über die entsprechenden Buttons links in der Bildleiste des Arbeitsblattes direkt auf dem Drucker auszugeben oder sie in die Registerkarte Ergebnisse/Reports von PS-Explore zu transferieren. Ebenfalls möglich ist die Übergabe in die Zwischenablage von Windows:

 

 

 

 

Man kann Statistiken für verschiedene numerische Merkmale des Arbeitsblattes berechnen, indem man in der Listbox der Merkmale nacheinander die gewünschten Variablen auswählt und dann die entsprechenden Statistikbuttons anklickt. Will man einzelne Berechnungen später dann doch nicht in die endgültige Tabelle übernehmen, so können die jeweiligen Spalten markiert und über den Löschbutton entfernt werden, ebenfalls möglich ist es, die Spalten mit den berechneten Kennwerten zu verschieben. Man geht hierzu mit dem Mauszeiger auf den Titel der gewünschten Tabellenspalte, drückt die linke Maustaste und bewegt die Spalte in die Zielposition:

 

 

 

Ebenfalls möglich ist es Zeilen aus einer Tabelle zu löschen oder diese zu verschieben. Allerdings wird hiernach die weitere Berechnung von Kennwerten blockiert. Es ist daher sinnvoll alle Editierfunktionen der Tabelle erst zu nutzen, wenn man alle gewünschten Berechnungen ausgeführt hat:

 

 

 

Die bislang in die hier beschriebene PS-Explore-Prozedur einprogrammierten Statistiken entsprechen dem allgemein gebräuchlichen. Weitere Kennwerte werden nach Benutzerwunsch realisiert.

 

Für Ende Mai/Anfang Juni ist die Implementierung eines entsprechenden Makrobefehls für die neue Sortier- und Aggregationsfunktion in Vorbereitung.