Standardabweichung

Zettt · 12.04.10

Hallo ihr Statistikfreaks,

Ich moechte gerade einen Graphen erstellen. Mit Standardweichung oder so. Also zumindest moechte ich aufzeigen wie weit es nach unten und oben vom Durchschnitt abweicht.
"Es" das sind die Besucherzahlen unseres Podcasts Mac OS X Screencasts.

Warum?
Ich moechte ein Review ueber OmniGraphSketcher machen und als Beispiel moechte ich gerne zeigen, wie sich unsere Besucherzahlen so entwickelt haben und das eben gegenueberstellen.

Jetzt lese ich den Wikipedia Artikel zur Standardabweichung und denk mir nur oO . Damit ist nicht gemeint, dass ich das nicht grundsaetzlich verstehen wuerde, aber wo kommen da jetzt welche meiner Zahlen hin?
Ich habe bis Besucherzahlen monatlich, diese kann ich per Numbers, natuerlich, mitteln. Und wie geht's jetzt weiter?

Danke fuer Hilfe.

Guy.brush · 12.04.10

Ok, ich versuch mal mein Stochastik-Wissen wieder rauszukramen.

Beispiel mit Besucherzahlen:

April: 35
Mai: 10
Juni: 20
Juli: 5
August: 30

Ich nehme mal an, dass alle Besucherzahlen gleichwahrscheinlich auftreten. Also ist die Wahrscheinlichkeit p einfach 1/Anzahl der Monate.

Der Erwartungswert ist dann:
E(X) = p * Summe der Besucherzahlen

In diesem Fall ist p = 1/5, also:
E(X) = 1/5 * (35+10+20+5+30) = 20.

Das ist nichts weiter als dein Mittelwert.

Die Varianz berechnet sich dann so:
Var = E(X^2) - E(X)^2

Das ist quasi die [[Summe aller (Besucherzahlen^2)] mal p] minus den oben (berechneten Mittelwert^2).

In diesem Fall:
Var = 1/5 * ((35)^2 + (10)^2 + (20)^2 + (5)^2 + (30)^2) - (20)^2 =
= 1/5 * (1225 + 100 + 400 + 25 + 900) - 400 = 130

Die Standardabweichung ist nun die Wurzel aus der Varianz, also 11,4018.

Ich bin mir selbst nicht mehr so 100%ig sicher, das ist bei mir auch schon ne Weile her, aber ich würds so berechnen.

Zettt · 12.04.10

Super! Also wenn die Rechnung so an sich stimmt, kann ich damit was anfangen, weil mit E konnte ich auf der Wikipedia Seite irgendwie nicht soviel anfangen.
Kann die Rechnung noch jemand verfizieren?

Phalanx1984 · 12.04.10

~~also die Rechnung stimmt soweit.~~ Ähm nö, ich rechne das grad nochmal nach… Was willst du denn mit den "Fehlerbalken" aussagen? wen du ±Stdandardabw. angibst heißt dass, dass statistisch gesehen ~68% der Besucherzahlen in diesem Intervall liegen. Ist das eine Information mit der du was anfangen kannst?

ansonsten mach dich mal schlau über relativen Fehler und Signifikanz.

Edit: Laut Formelsammlung gilt:
Arithmetisches Mittel ¯x = 1/n*Summe(xi)
Für das Beispiel: 1/5*(35+10+20+5+30) = 20

Empirische Varianz sx^2 = 1/(n-1)*Summe(xi - ¯x)^2
Für das Beispiel: 1/(5-1)*((35-20)^2+(10-20)^2+(20-20)^2+(5-20)^2+(30-20)^2)
= 1/4 * (225+100+0+225+100) = 162,5

Empirische Standardabweichung sx = Wurzel(sx^2)
Für das Beispiel: Wurzel(162,5) = 12,75

In excel gibts die Formeln =var() und =stabw() vielleicht gibts sowas auch in Numbers…

Guy.brush · 12.04.10

Das liegt vermutlich daran, dass du die empirische Varianz genommen hast und ich die "normale" Varianz. Der Unterschied liegt nur in dem 1/(n-1), denn 1/5 * (225+100+0+100+225) = 130, wie es bei mir rauskam.
Wozu die gut ist, kann ich euch nicht sagen, ich hab bis jetzt immer die normale genommen. Evtl. kannst du das genauer erklären, Phalanx1984 ?

Phalanx1984 · 12.04.10

naja das ist so, dass die "normale" Varianz im diskreten Fall als V(X) ≡ σ² := Σ(xi - μ)² * f(xi) definiert ist, worin das Mittel μ der Erwartugswert E(X) der Zufallsvariablen X ist und eben dieser "wirkliche" oder "wahre" Wert ist in jedem realen Fall unbekannt. Das arithmetische Mittel ¯x konvergiert gegen μ für große n aber da man nicht unendlich oft messen kann wird ¯x niemals gleich μ sein.

Was das sagen will ist, σ² ist ein theoretischer parameter des Systems der experimentell zwar angenährt werden kann aber nicht bestimmt werden kann und die Annährung an σ² ist nunmal die empirische Varianz sx².

Grundsätzlich kann man das daran erkennen ob es griechische Buchstaben für die Theoretischen bzw. wirklichen Größen oder lateinische Buchstaben für die empirischen Größen sind, die eben nur für n ⟼ ∞ gleich sind…

P.S.: wer sich wrkich dafür interessiert, der kann sich hier eine komplette Vorlesung "Introduction to Statistics" der UC Berkeley geben

Guy.brush · 12.04.10

Na gut, einverstanden.

Aber meine Rechnung stimmt trotzdem, hab eben nur die "normale" Varianz ausgerechnet.

Ja, in Numbers gibt es das, heißt VAR() bzw. STDEV().

Phalanx1984 · 12.04.10

schon aber für n=5 kannst du nicht davon ausgehen dass ¯x = μ ist. Ich würde sagen ab n = 50 oder 100 könnten wir uns über die Anwendung der Formel nochmal unterhalten

Das wird jetzt zwar ziemlich OT aber es gibt Formeln, mit denen man die minimale Stichprobengröße errechnen kann um ein bliebiges (selbstgewähltes) Intervall anzugeben, in das der wahre Wert mit einer definierten (selbstgewählten) Wahrscheinlichkeit fällt. Wählt man die Wahrscheinlichkeit entsprechend groß und das Intervall entsprechend klein, wird n halt wieder sehr groß…

Zettt · 12.04.10

Jungs, gaaaanz cool bleiben. Bitte ganz einfach halten. OK?
Ich teste das heute oder morgen mal aus und gib dann Feedback.

Phalanx1984 · 12.04.10

Ja das hat sich dann irgendwie zu einer halben Statistikvorlesung verselbständigt

Was hast du denn genau für Daten und wovon möchtest du die Standardabweichung berechnen?
In dem beispiel zu den Errorbars auf http://www.omnigroup.com/products/omnigraphsketcher/ machen sie das mit Quantilen bzw Quartilen… Achja wenn du Beispielaufgaben zu einem gegebenen Datensatz brauchst kannst mir ne PN schreiben

Btw.: Das Programm scheint interessant zu sein und teuer ist es auch nicht. Ich mag Programme, in denen ich an meinen Kurven rumzupfen kann bis sie mir gefallen…

wenn du das Review hast poste es doch hier.

Zettt · 13.04.10

Phalanx1984 schrieb:
Ja das hat sich dann irgendwie zu einer halben Statistikvorlesung verselbständigt

Ich hab's gemerkt. ^^ Spricht ja auch nichts dagegen. Ich habe das auch gerne gelesen. Nur schoss die Diskussion eben weeeeit ueber das hinaus, was ich so eigentlich machen wollte.
Mein Problem wird wohl eher werden, dass OmniGraphSektcher eben eher fuer Statistikmenschen gedacht wurde und ich davon eben ein wenig weeeeit entfernt bin.
Das einzige was mir eben eingefallen war, ist diese Visits Geschichte. Also ich zeige in einem Workflow wie toll man OmniGraphSektcher dazu benutzen kann seine Webstatistiken auszuwerten. Weiss nicht mal ob das die uebersinnvollete Anwendung fuer OmniGraphSektcher ist.

Phalanx1984 schrieb:
Btw.: Das Programm scheint interessant zu sein und teuer ist es auch nicht. Ich mag Programme, in denen ich an meinen Kurven rumzupfen kann bis sie mir gefallen… wenn du das Review hast poste es doch hier.

Wirklich? Bisher habe ich immer nur gegenteiliges gehoert. Fuer mich selbst war es bis vor gestern eines der nutzlosesten Programme schlechthin, weil es eben ... ja nutzlos ist. Ich habe mich die ganze Zeit gefragt "Was kann ich mit diesem Tool machen, das ich mit Numbers oder OOo nicht machen kann?"
Jetzt nachdem ich ein paar Graphen damit erstellt habe, erkenne ich natuerlich den Mehrwert. Aber so richtig durchstarten tu ich wahrscheinlich noch nicht. o_O

Phalanx1984 · 13.04.10

Der Nutzen liegt meiner sicht nach in der direkten Manipulierbarkeit der Graphen, zur Auswertung von Daten ist es mMn eher ungeeignet, weil man da ja auch Formeln anwenden muss und Zellen verrechnen etc. von daher ist eine Pure Auswertung mit Numbers oder Excel sicher besser. Aber wenn ich die Grafik dann irgendwo präsentieren will, hab ich z.B. bei Excel nicht so viel Einflussmöglichkeiten, bzw nur sehr umständlich.

D.h. ich werte alle Daten mit der Tabellenkalkulation aus, wie gewohnt und dann nehme ich die Daten, die ich präsentieren will und male solange in der Grafik rum bis es mir gefält… Ich denke das ist bei weitem noch nicht vergelichbar, aber kennst du Origin? das benutz man in der Wissenschaft um seine Graphen für Veröffenltichungen zu pimpen, zur Auswertung nehmen die auch alle Excel aber die Diagramme sehen halt shice aus in Excel…

Zettt · 13.04.10

Ich glaube, dass ist der erste Screencast vor dem ich irgendwie "Schiss" habe.
Rein fachlich, glaube ich, kann ich das nicht rueberbringen wie ich das gerne woellte. o_O

Zettt · 19.05.10

Wie versprochen melde ich hier den Screencast nach Veroeffentlichung.
http://www.macosxscreencasts.com/review/omnigraphsektcher-review-gewinnspiel/

Suche

Suche

Standardabweichung

Zettt

Doppelter Melonenapfel

Guy.brush

Weißer Winterkalvill

Zettt

Doppelter Melonenapfel

Phalanx1984

Oberösterreichischer Brünerling

Guy.brush

Weißer Winterkalvill

Phalanx1984

Oberösterreichischer Brünerling

Guy.brush

Weißer Winterkalvill

Phalanx1984

Oberösterreichischer Brünerling

Zettt

Doppelter Melonenapfel

Phalanx1984

Oberösterreichischer Brünerling

Zettt

Doppelter Melonenapfel

Phalanx1984

Oberösterreichischer Brünerling

Zettt

Doppelter Melonenapfel

Zettt

Doppelter Melonenapfel

Wir schützen Ihre Privatsphäre

Informationen auf einem Gerät speichern und/oder abrufen

Personalisierte Anzeigen und Inhalte, Anzeigen- und Inhaltsmessungen, Erkenntnisse über Zielgruppen und Produktentwicklungen (Optionale Cookies)

Datenübermittlung an Partner in anderen Staaten (Drittanbieter-Cookies)