Excel-Dateien
excel2SAS
Unter Umständen verbringen Statistiker/innen Stunden damit, Excel-Tabellen nach SAS zu transferieren. Diese Zeit lässt sich wesentlich besser auf die Auswertung verwenden. Deshalb bitte beachten:
Allgemein
Einfache Struktur der Tabelle wählen, um Export in SAS zu gewährleisten.
Farbgebungen sowie Auswertungen (wie z.B. Mittelwerte, Mediane, Häufigkeiten) sind nicht exportierbar.
Anonymisierung der Daten durch die Vergabe von Nummern anstelle von Namen.
Löschung nicht genutzter Zellen durch den Befehl "Zellen löschen" mittels rechter Maustaste.
Daten-Struktur
Pro Zeile: ein Patient/in, auch bei Mehrfachmessungen.
Pro Spalte: eine Variable.
1. Zeile: Variablenname nach der SAS-Konvention (s.u.), damit Variablen nachher für Excel-Ersteller/in wieder erkennbar sind.
Verfahren bei mehreren Gruppen: Eine einzige Tabelle anlegen mit einer Spalte, in der die Gruppenzugehörigkeit steht (NICHT: pro Gruppe eine Tabelle).
Variablennamen
Maximal 12 Zeichen.
Beginn mit einem Buchstaben, zusätzlich Ziffern oder Unterstriche (_) möglich.
Vermeidung von Leerzeichen.
Namensgebung in der Art, dass Verwandtschaft zum Inhalt der Variable klar ist.
Nummerierungen
Bei Mehrfachmessungen: Benennung in der Art MESS1-MESS10.
Vermeidung von "Kapitelüberschriften" (wie z.B. Aufnahme, Entlassung, ") unter denen dann die gleichen Variablennamen vergeben werden.
Keine doppelte Vergabe von Variablennamen.
Variablen
Einheitliche Formatierung und einheitliche Einträge in den Spalten (z.B.: nur Zahlen, nur Datumsangaben (formatiert in der Form 03.04.97 oder 03.04.1997) oder nur Text.
Datenschutz bei Geburtsdaten: Das Datum stets auf den 15. des Monats setzen (also nicht 03.04.97, sondern 15.04.97).
Vermeidung von Kommentaren zwischen den Werten (wie z.B. beim Todesdatum die Todesursache). Stattdessen eine eigene Spalte (als letzte Spalte) für Kommentare/Besonderheiten anlegen.
Nur ein Wert pro Feld, Vermeidung einer Doppelbelegung von Feldern, wie dies bei Excel möglich ist. Beim Transfer nach SAS würden bei Doppelbelegungen zusätzliche Beobachtungen entstehen.
Vermeidung von Sonderzeichen (auch in Text-Spalten nur sparsam und nur, wenn unvermeidbar). Insbesondere: Kein Semikolon (wird beim Einlesen als Trennzeichen gebraucht)!
Spalten komplett ausfüllen (soweit die Daten vorhanden sind). In frei gebliebene Felder kein "nein" eintragen. Man kann "nein" sonst nicht von fehlenden Werten ("Daten nicht erhoben") unterscheiden.
Markierung fehlender Zahlen-Werte mit einem Punkt (.).
Löschung von Spalten, die sich durch Berechnungen aus anderen Spalten ergeben.
Bei Berechnungen in Excel-Berechnungen: Ergebnisse als Werte eintragen und nicht als Formeln, die bei jedem Öffnen der Tabelle neu durchgeführt werden.
Codes
Aufbau einer Extra-Seite der Excel-Tabelle mit folgendem Inhalt:
1. Spalte: Variablenname nach SAS-Konvention
2. Spalte: Erklärung (label)
3. Spalte: Codes Ja/Nein-Fragen mit 0/1 codieren (1=ja, 0=nein)
Beispiel 1: Gewichtstudie
Beispiel 2: Geburten


Beispieltabellen als pdf files
