Für schnelle Fragen email dataprinceton. edu. Keine appts Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone offen ist, keine Termine, die für die Verwendung der Laborcomputer für Ihre eigene Analyse erforderlich sind. Erstellen und Ändern von Variablen Bevor Sie dies lesen, stellen Sie sicher, dass Sie genau verstehen, was Stata-Variablen sind und wie sie funktionieren. Unsere Seite auf Daten, Datasets und Variablen ist ein guter Ausgangspunkt. Variable Erstellungsbefehle Die grundlegenden Befehle zum Erstellen neuer Variablen und zum Ändern von alten in Stata werden generiert (abgekürzt Gen), egen und ersetzen. Der Befehl gen variablename etwas schafft eine neue Variable namens Variablename und setzt sie gleich etwas. Etwas kann eine einfache Zahl, ein String, ein mathematischer Ausdruck oder eine Funktion von anderen Variablen sein. Für Informationen darüber, was Gen-Funktionen tun, schauen Sie Funktionen in Statas Online-Hilfe. Für Informationen über egen-Funktionen, lookup egen. Der Befehl replace wird verwendet, um Änderungen an vorhandenen Variablen vorzunehmen: Ersetzen Sie Arbeiten mit allen Gen-Funktionen, aber nicht mit egen-Funktionen. Allerdings können Sie ersetzen, um Variablen zu ändern, die von egen erstellt wurden, sowie jene, die von gen erstellt wurden. Sie möchten normalerweise für zweite und spätere Schritte in mehrstufigen Variablen-Kreationen ersetzen, so wie wir es hier benutzt haben. Es ist eine schlechte Praxis, über vorhandene Variablen zu schreiben, denn wenn man einen Fehler macht, gibt es keine Möglichkeit, die Originaldaten zurück zu bekommen. Zum Beispiel, auch wenn Sie sich entschieden haben, dass Sie sich nur um das Getriebe-Verhältnis gekümmert haben, um die nächste Ganzzahl abgerundet zu haben, ersetzen Sie die Getriebegeschwindigkeit (Getriebe, 1). Es ist immer besser, eine neue Variable zu erstellen. Der if-Qualifier Der if-Qualifier wird verwendet, um einen Satz von Beobachtungen mit Variablen zu isolieren, die bestimmte Kriterien erfüllen. Werte auf Variablen in einem Datensatz werden mit Werten auf anderen Variablen oder mit Zahlen oder Strings mit logischen Vergleichsoperatoren verglichen. Dies wird sehr oft verwendet, um Dummy-Variablen zu erstellen, 0-1 Indikatoren verwendet, um anzuzeigen, ob etwas wahr oder false. Im mit Stata und Im versuchen, den durchschnittlichen Preis von Firmen Rivalen in einem Markt zu berechnen. Ich habe Daten, die aussieht: Und ich versuche, den durchschnittlichen Preis der einzelnen Konkurrenten zu berechnen, also möchte ich ein neues Feld generieren, das die Durchschnittswerte der anderen Firmen in einem Markt ist. Es würde so aussehen: Um den Durchschnitt nach Gruppe zu machen, könnte ich den egen-Befehl benutzen: Aber das würde den Firmenpreis nicht im Durchschnitt ausschließen, und nach meinem besten Wissen würde ich mit den if-Qualifikationen nur die beobachteten Beobachtungen ändern Auf, nicht die Gruppen, die es gemittelt hat. Gibt es einen einfachen Weg, dies zu tun, oder muss ich Loops erstellen und generieren jeden Durchschnitt manuell gefragt Mar 6 12 um 4:16 Dies ist ein alter Thread noch von Interesse, so Materialien und Techniken übersehen, das erste Mal noch gelten. Die allgemeinere Technik ist, mit Summen zu arbeiten. Am einfachsten, insgesamt von insgesamt insgesamt - dieser wert. In einem egen-Framework, das aussehen wird Die total () - Funktion von egen ignoriert fehlende Werte in seinem Argument. Wenn es fehlende Werte gibt, wollen wir sie nicht in die Zählung aufnehmen, aber wir können fehlende () verwenden, die 1 ergibt, wenn nicht fehlt und 0 wenn fehlt. Egen s count () ist eine andere Möglichkeit, dies zu tun. Code gegeben früher gibt die falsche Antwort, wenn Missings vorhanden sind, wie sie in der Zählung N enthalten sind. Auch wenn ein Wert fehlt, ist der Durchschnitt der anderen Werte immer noch sinnvoll. Wenn kein Wert fehlt, vereinfacht sich die letzte Zeile oben. Bisher sieht das vielleicht nicht mehr aus als eine kleine Variante auf vorherigem Code, aber es reicht leicht auf Gewichte aus. Vermutlich wollen wir einen gewichteten Durchschnitt anderer Preise mit etwas Gewicht. Wir können die Tatsache ausnutzen, dass total () auf Ausdrücke arbeitet, was komplizierter sein kann als nur Variablennamen. In der Tat hat der Code oben schon das getan, aber es wird oft übersehen. Wie vorher, wenn Preis oder Gewicht jemals fehlt, benötigen Sie komplizierteren Code, oder nur um sicherzustellen, dass Sie solche Beobachtungen aus den Berechnungen ausschließen. Siehe auch die Stata FAQ Wie erstelle ich Variablen, die für jede einzelne Eigenschaft der anderen Mitglieder einer Gruppe für eine umfassendere Diskussion zusammenfassen. (Wenn die Zahlen groß werden, arbeiten mit doppelten s.)
No comments:
Post a Comment