• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Drei sehr unterschiedliche Fotos warten bei unserem Februar-Thema - Quadrat zum Quadrat - darauf, von Euch bewertet zu werden. Los, auf geht’s! Hier geht es lang zur Abstimmung --> Klick

Standardabweichung

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Hallo ihr Statistikfreaks,

Ich moechte gerade einen Graphen erstellen. Mit Standardweichung oder so. Also zumindest moechte ich aufzeigen wie weit es nach unten und oben vom Durchschnitt abweicht.
"Es" das sind die Besucherzahlen unseres Podcasts Mac OS X Screencasts.

Warum?
Ich moechte ein Review ueber OmniGraphSketcher machen und als Beispiel moechte ich gerne zeigen, wie sich unsere Besucherzahlen so entwickelt haben und das eben gegenueberstellen.

Jetzt lese ich den Wikipedia Artikel zur Standardabweichung und denk mir nur oO . Damit ist nicht gemeint, dass ich das nicht grundsaetzlich verstehen wuerde, aber wo kommen da jetzt welche meiner Zahlen hin?
Ich habe bis Besucherzahlen monatlich, diese kann ich per Numbers, natuerlich, mitteln. Und wie geht's jetzt weiter?

Danke fuer Hilfe.
 

Guy.brush

Weißer Winterkalvill
Registriert
15.12.08
Beiträge
3.545
Ok, ich versuch mal mein Stochastik-Wissen wieder rauszukramen.

Beispiel mit Besucherzahlen:

April: 35
Mai: 10
Juni: 20
Juli: 5
August: 30

Ich nehme mal an, dass alle Besucherzahlen gleichwahrscheinlich auftreten. Also ist die Wahrscheinlichkeit p einfach 1/Anzahl der Monate.

Der Erwartungswert ist dann:
E(X) = p * Summe der Besucherzahlen

In diesem Fall ist p = 1/5, also:
E(X) = 1/5 * (35+10+20+5+30) = 20.

Das ist nichts weiter als dein Mittelwert.

Die Varianz berechnet sich dann so:
Var = E(X^2) - E(X)^2

Das ist quasi die [[Summe aller (Besucherzahlen^2)] mal p] minus den oben (berechneten Mittelwert^2).

In diesem Fall:
Var = 1/5 * ((35)^2 + (10)^2 + (20)^2 + (5)^2 + (30)^2) - (20)^2 =
= 1/5 * (1225 + 100 + 400 + 25 + 900) - 400 = 130

Die Standardabweichung ist nun die Wurzel aus der Varianz, also 11,4018.

Ich bin mir selbst nicht mehr so 100%ig sicher, das ist bei mir auch schon ne Weile her, aber ich würds so berechnen. :)
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Super! Also wenn die Rechnung so an sich stimmt, kann ich damit was anfangen, weil mit E konnte ich auf der Wikipedia Seite irgendwie nicht soviel anfangen.
Kann die Rechnung noch jemand verfizieren?
 

Phalanx1984

Oberösterreichischer Brünerling
Registriert
12.01.08
Beiträge
720
also die Rechnung stimmt soweit. Ähm nö, ich rechne das grad nochmal nach… Was willst du denn mit den "Fehlerbalken" aussagen? wen du ±Stdandardabw. angibst heißt dass, dass statistisch gesehen ~68% der Besucherzahlen in diesem Intervall liegen. Ist das eine Information mit der du was anfangen kannst?

ansonsten mach dich mal schlau über relativen Fehler und Signifikanz.

Edit: Laut Formelsammlung gilt:
Arithmetisches Mittel ¯x = 1/n*Summe(xi)
Für das Beispiel: 1/5*(35+10+20+5+30) = 20

Empirische Varianz
sx^2 = 1/(n-1)*Summe(xi - ¯x)^2
Für das Beispiel: 1/(5-1)*((35-20)^2+(10-20)^2+(20-20)^2+(5-20)^2+(30-20)^2)
= 1/4 * (225+100+0+225+100) = 162,5


Empirische Standardabweichung sx = Wurzel(sx^2)
Für das Beispiel: Wurzel(162,5) = 12,75


In excel gibts die Formeln =var() und =stabw() vielleicht gibts sowas auch in Numbers…
 
Zuletzt bearbeitet:

Guy.brush

Weißer Winterkalvill
Registriert
15.12.08
Beiträge
3.545
Das liegt vermutlich daran, dass du die empirische Varianz genommen hast und ich die "normale" Varianz. Der Unterschied liegt nur in dem 1/(n-1), denn 1/5 * (225+100+0+100+225) = 130, wie es bei mir rauskam.
Wozu die gut ist, kann ich euch nicht sagen, ich hab bis jetzt immer die normale genommen. Evtl. kannst du das genauer erklären, Phalanx1984 ?
 

Phalanx1984

Oberösterreichischer Brünerling
Registriert
12.01.08
Beiträge
720
naja das ist so, dass die "normale" Varianz im diskreten Fall als V(X) ≡ σ² := Σ(xi - μ)² * f(xi) definiert ist, worin das Mittel μ der Erwartugswert E(X) der Zufallsvariablen X ist und eben dieser "wirkliche" oder "wahre" Wert ist in jedem realen Fall unbekannt. Das arithmetische Mittel ¯x konvergiert gegen μ für große n aber da man nicht unendlich oft messen kann wird ¯x niemals gleich μ sein.

Was das sagen will ist, σ² ist ein theoretischer parameter des Systems der experimentell zwar angenährt werden kann aber nicht bestimmt werden kann und die Annährung an σ² ist nunmal die empirische Varianz sx².

Grundsätzlich kann man das daran erkennen ob es griechische Buchstaben für die Theoretischen bzw. wirklichen Größen oder lateinische Buchstaben für die empirischen Größen sind, die eben nur für n ⟼ ∞ gleich sind…

P.S.: wer sich wrkich dafür interessiert, der kann sich hier eine komplette Vorlesung "Introduction to Statistics" der UC Berkeley geben :)
 
Zuletzt bearbeitet:

Guy.brush

Weißer Winterkalvill
Registriert
15.12.08
Beiträge
3.545
Na gut, einverstanden. :)
Aber meine Rechnung stimmt trotzdem, hab eben nur die "normale" Varianz ausgerechnet.

Ja, in Numbers gibt es das, heißt VAR() bzw. STDEV().
 
Zuletzt bearbeitet:

Phalanx1984

Oberösterreichischer Brünerling
Registriert
12.01.08
Beiträge
720
schon aber für n=5 kannst du nicht davon ausgehen dass ¯x = μ ist. Ich würde sagen ab n = 50 oder 100 könnten wir uns über die Anwendung der Formel nochmal unterhalten ;)

Das wird jetzt zwar ziemlich OT aber es gibt Formeln, mit denen man die minimale Stichprobengröße errechnen kann um ein bliebiges (selbstgewähltes) Intervall anzugeben, in das der wahre Wert mit einer definierten (selbstgewählten) Wahrscheinlichkeit fällt. Wählt man die Wahrscheinlichkeit entsprechend groß und das Intervall entsprechend klein, wird n halt wieder sehr groß…
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Jungs, gaaaanz cool bleiben. Bitte ganz einfach halten. OK?
Ich teste das heute oder morgen mal aus und gib dann Feedback.
 

Phalanx1984

Oberösterreichischer Brünerling
Registriert
12.01.08
Beiträge
720
Ja das hat sich dann irgendwie zu einer halben Statistikvorlesung verselbständigt :)

Was hast du denn genau für Daten und wovon möchtest du die Standardabweichung berechnen?
In dem beispiel zu den Errorbars auf http://www.omnigroup.com/products/omnigraphsketcher/ machen sie das mit Quantilen bzw Quartilen… Achja wenn du Beispielaufgaben zu einem gegebenen Datensatz brauchst kannst mir ne PN schreiben ;)

Btw.: Das Programm scheint interessant zu sein und teuer ist es auch nicht. Ich mag Programme, in denen ich an meinen Kurven rumzupfen kann bis sie mir gefallen… :D wenn du das Review hast poste es doch hier.
 
Zuletzt bearbeitet:

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Ja das hat sich dann irgendwie zu einer halben Statistikvorlesung verselbständigt :)

Ich hab's gemerkt. ^^ Spricht ja auch nichts dagegen. Ich habe das auch gerne gelesen. Nur schoss die Diskussion eben weeeeit ueber das hinaus, was ich so eigentlich machen wollte.
Mein Problem wird wohl eher werden, dass OmniGraphSektcher eben eher fuer Statistikmenschen gedacht wurde und ich davon eben ein wenig weeeeit entfernt bin.
Das einzige was mir eben eingefallen war, ist diese Visits Geschichte. Also ich zeige in einem Workflow wie toll man OmniGraphSektcher dazu benutzen kann seine Webstatistiken auszuwerten. Weiss nicht mal ob das die uebersinnvollete Anwendung fuer OmniGraphSektcher ist.

Btw.: Das Programm scheint interessant zu sein und teuer ist es auch nicht. Ich mag Programme, in denen ich an meinen Kurven rumzupfen kann bis sie mir gefallen… :D wenn du das Review hast poste es doch hier.

Wirklich? Bisher habe ich immer nur gegenteiliges gehoert. Fuer mich selbst war es bis vor gestern eines der nutzlosesten Programme schlechthin, weil es eben ... ja nutzlos ist. Ich habe mich die ganze Zeit gefragt "Was kann ich mit diesem Tool machen, das ich mit Numbers oder OOo nicht machen kann?"
Jetzt nachdem ich ein paar Graphen damit erstellt habe, erkenne ich natuerlich den Mehrwert. Aber so richtig durchstarten tu ich wahrscheinlich noch nicht. o_O
 

Phalanx1984

Oberösterreichischer Brünerling
Registriert
12.01.08
Beiträge
720
Der Nutzen liegt meiner sicht nach in der direkten Manipulierbarkeit der Graphen, zur Auswertung von Daten ist es mMn eher ungeeignet, weil man da ja auch Formeln anwenden muss und Zellen verrechnen etc. von daher ist eine Pure Auswertung mit Numbers oder Excel sicher besser. Aber wenn ich die Grafik dann irgendwo präsentieren will, hab ich z.B. bei Excel nicht so viel Einflussmöglichkeiten, bzw nur sehr umständlich.

D.h. ich werte alle Daten mit der Tabellenkalkulation aus, wie gewohnt und dann nehme ich die Daten, die ich präsentieren will und male solange in der Grafik rum bis es mir gefält… Ich denke das ist bei weitem noch nicht vergelichbar, aber kennst du Origin? das benutz man in der Wissenschaft um seine Graphen für Veröffenltichungen zu pimpen, zur Auswertung nehmen die auch alle Excel aber die Diagramme sehen halt shice aus in Excel…
 

Zettt

Doppelter Melonenapfel
Registriert
16.10.05
Beiträge
3.374
Ich glaube, dass ist der erste Screencast vor dem ich irgendwie "Schiss" habe.
Rein fachlich, glaube ich, kann ich das nicht rueberbringen wie ich das gerne woellte. o_O