Sunday 14 May 2017

Ein Beispiel Zeichen Test In Stata Forex

Interpretation statistischer Ergebnisse Ergebnisse, in denen Daten normal verteilt sind und Varianz ist bekannt oder unbekannt 13 Wenn eine Varianz einer Population (2) bekannt ist, ist der z-Test die bevorzugte Alternative, eine Hypothese des Populationsmittels () zu testen. Um die Teststatistik zu berechnen, ist Standardfehler gleich Populationsstandardabweichung / Quadratwurzel der Stichprobengröße. Beispielsweise ist bei einer Populationsvarianz von 64 und einer Stichprobengröße von 25 der Standardfehler gleich (64) 1/2 / (25) 1/2. Oder 1,6. 13 Beispiel: Teststatistik 13 Angenommen, im selben Fall haben wir einen Hypothesentest konstruiert, dass die mittlere jährliche Rendite gleich 12 ist, dh wir haben einen zweiseitigen Test, bei dem die Nullhypothese ist, dass die Population 12 bedeutet Ist die Alternative, dass sie nicht gleich 12 ist. Unter Verwendung eines kritischen Wertes von 0,05 (0,025 für jeden Schwanz) ist unsere Regel, den Nullwert abzulehnen, wenn die Teststatistik entweder unter -1,96 oder über 1,96 liegt (bei p .025, z 1,96) ). Angenommen, die Stichprobe beträgt 10,6. 13 Antwort: Teststatistik (10,6 - 12) / 1,6 -1,4 / 1,6 -0,875. Dieser Wert fällt nicht unter den Ablehnungspunkt, so dass wir die Nullhypothese nicht mit statistischer Sicherheit ablehnen können. 13 Wenn wir Hypothesentests über ein Populationsmittel durchführen, ist es relativ wahrscheinlich, dass die Bevölkerungsabweichung unbekannt sein wird. In diesen Fällen verwenden wir eine Standardabweichung bei der Berechnung des Standardfehlers und die t-Statistik für die Entscheidungsregel (d. h. als Quelle für unser Ablehnungsniveau). Im Vergleich zur z - oder Standardnorm ist eine t-Statistik konservativer (d. h. höhere Ablehnungspunkte für die Ablehnung der Nullhypothese). In Fällen mit großen Probengrößen (mindestens 30) kann die z-Statistik ersetzt werden. 13 Beispiel: Nehmen wir einen Fall, bei dem die Stichprobengröße 16 ist. In diesem Fall ist die t-stat die einzige geeignete Wahl. Für die t-Verteilung werden Freiheitsgrade als (Stichprobengröße - 1), df 15 in diesem Beispiel berechnet. In diesem Fall gehen wir davon aus, dass wir eine Hypothese aufstellen, dass ein Populationsmittel größer als 8 ist, also wird dies ein eintägiger Test (rechter Schwanz): Nullhypothese ist lt 8, und die Alternative ist, dass gt 8. Unsere erforderliche Bedeutung Ist 0,05. Unter Verwendung der Tabelle für Studenten t-Verteilung für df 15 und p 0,05, ist der kritische Wert (Ablehnung Punkt) 1,753. Mit anderen Worten, wenn unsere berechnete Teststatistik größer als 1.753 ist, lehnen wir die Nullhypothese ab. 13 Antwort: Zu Schritt 5 des Hypothesentests wechseln wir eine Stichprobe, bei der der Mittelwert 8,3 und die Standardabweichung 6,1 beträgt. Für dieses Beispiel ist der Standardfehler s / n 1/2 6.1 / (16) 1/2 6.1 / 4 1.53. Die Teststatistik ist (8,3 - 8,0) / 1,53 0,3 / 1,53 oder 0,196. Wenn wir 0,196 zu unserem Ablehnungspunkt von 1,753 vergleichen, können wir die Nullhypothese nicht zurückweisen. 13 In diesem Fall war unser Stichprobenmittelwert von 8,3 tatsächlich größer als 8, jedoch wird der Hypothesentest auf statistische Signifikanz angelegt, nicht einfach ein Stichprobenmittel mit der Hypothese vergleichen. Mit anderen Worten, die Entscheidungen in der Hypothesenprüfung sind auch eine Funktion der Probengröße (die bei 16 ist niedrig), die Standardabweichung, das erforderliche Maß an Signifikanz und die t-Verteilung. Unsere Interpretation in diesem Beispiel ist, dass die 8,3 aus der Stichprobe bedeuten, während nominell höher als 8 ist einfach nicht signifikant höher als 8, zumindest bis zu dem Punkt, wo wir in der Lage, endgültig eine Schlussfolgerung in Bezug auf die Bevölkerung bedeuten, größer als 8 ist 13 Relative Gleichheit der Populationsmittel von zwei normalverteilten Populationen, wobei unabhängige Zufallsstichproben von Variationen gleich oder ungleich angenommen werden Für den Fall, dass die Populationsabweichungen für zwei getrennte Gruppen als gleich angenommen werden können, ist eine Technik zum Bündeln einer Schätzung der Populationsabweichung (S 2) aus den Abtastdaten ist durch die folgende Formel gegeben (nimmt zwei unabhängige Stichproben an): 13 wobei: n 1. N 2 Probengrößen sind und s 1 2 s 2 2 Probenabweichungen sind. 13 Freiheitsgrade n 1 n 2 - 2 13 Zum Testen der Gleichheit zweier Populationsmittel (dh 1 2) berechnet die Teststatistik die Differenz der Probenmittel (X 1 - X 2), geteilt durch den Standardfehler: die Quadratwurzel Von (s 2 / n 1 s 2 / n 2). Beispiel: Populationsmittel Nehmen wir an, dass die gepoolte Schätzung der Varianz (s 2) 40 war und die Stichprobengröße für jede Gruppe 20 war. Standardfehler (40/20 40/20) 1/2 (80/20) 2. Antwort: Wenn Probe Mittel waren 8,6 und 8,9, die t (8,6 - 8,9) / 2 -0,3 / 2 -0,15. Tests von Gleichheit / Ungleichheit sind zweiseitige Tests. Bei df 38 (Summe der Probengrößen - 2) und wenn wir 0,05 Signifikanz (p 0,025) annehmen, beträgt der Ablehnungspegel t lt -2,024 bzw. t gt 2,024. Da unsere berechnete Teststatistik -0.15 war, können wir die Nullhypothese nicht ablehnen, dass diese Populationsmittel gleich sind. 1. Für Hypothesen von gleicher Bevölkerungszahl, bei denen Varianzen nicht gleich angenommen werden können, ist die entsprechende Teststatistik für die Hypothese der t-stat, aber wir können keine Schätzung der Standardabweichung mehr zusammenfassen und der Standardfehler wird das Quadrat Wurzel von (s 1 2 / n 1) (s 2 2 / n 2). Die Nullhypothese bleibt 1 2. Und die Teststatistik wird ähnlich dem vorherigen Beispiel berechnet (d. h. Unterschied in der Abtastvorrichtung / Standardfehler). Berechnen von Freiheitsgraden wird durch diese Formel angenähert 13 Look Out 13 Hinweis: Dont verbringen Zeit merken diese Formel wird es nicht für die Prüfung erforderlich. Focus stattdessen auf die Schritte der Hypothese Tests und Interpretation Ergebnisse. 13 Der Paired-Comparisons-Test Das vorangegangene Beispiel prüfte die Gleichheit oder Ungleichheit von zwei Populationsmitteln, mit einer Schlüsselannahme, dass die beiden Populationen unabhängig voneinander waren. In einem Paar-Vergleichstest haben die beiden Populationen einen gewissen Grad an Korrelation oder Co-Bewegung, und die Berechnung der Teststatistik berücksichtigt diese Korrelation. Nehmen wir einen Fall, bei dem wir zwei Investmentfonds vergleichen, die beide als Large-Cap-Wachstum eingestuft werden, wobei wir testen, ob die Renditen für einen deutlich über dem anderen liegen (statistisch signifikant). Der gepaarte Vergleichstest eignet sich, da wir einen gewissen Grad an Korrelation annehmen, da die Rendite für jede von dem Markt abhängig ist. Um die t-Statistik zu berechnen, finden wir zunächst die Stichproben-Mittelwertdifferenz. (D & sub1; d & sub2; d & sub3; dn), wobei n die Anzahl der gepaarten Beobachtungen ist (in unserem Beispiel die Anzahl der Viertel, für die wir vierteljährlich zurückkehren), und jedes d ist Die Differenz zwischen jeder Beobachtung in der Probe. Als nächstes Probenabweichung. Oder (Summe aller Abweichungen von d) 2 / (n - 1) wird mit der Standardabweichung (s d) der positiven Quadratwurzel der Varianz berechnet. Standardfehler s d / (n) 1/2. Für unser gemeinsames Beispiel, wenn unsere durchschnittlichen Renditen für 10 Jahre (40 Quartale der Daten) sind, eine mittlere Differenz von 2,58 und eine Standardabweichung von 5,32 haben, wird unsere Teststatistik als (2,58) / ((5,32) / (40) 1/2) oder 3,067. Bei 49 Freiheitsgraden mit einem Signifikanzniveau von 0,05 liegt der Ablehnungspunkt bei 2,01. So lehnen wir die Nullhypothese ab und geben an, dass es einen statistisch signifikanten Unterschied in den Renditen zwischen diesen Fonds gibt. Hypothesentests zur Varianz einer normalverteilten Population Hypothesentests zum Wert einer Varianz (2) beginnen mit der Formulierung der Null - und Alternativhypothesen. 13 In Hypothesentests für die Varianz auf einer einzigen normalverteilten Population ist die entsprechende Teststatistik als Chi-Quadrat mit 2 bezeichnet. Anders als die Verteilungen, die wir bisher verwendet haben, ist das Chi-Quadrat asymmetrisch, wie es gebunden ist Die linke um null. (Das muss wahr sein, da die Varianz immer eine positive Zahl ist.) Das Chi-Quadrat ist tatsächlich eine Verteilungsgruppe ähnlich der t-Verteilung mit verschiedenen Freiheitsgraden, die zu einer anderen Chi-Quadrat-Verteilung führt. 13 Wobei: n Stichprobengröße, s 2 Stichprobenabweichung, 0 2 Bevölkerungsabweichung aus der Hypothese Probenabweichung s 2 wird als Summe der Abweichungen zwischen den beobachteten Werten und der Stichprobe mittlere 2 Freiheitsgrade oder n - 1 Beispiel: Hypothesenprüfung W / Chi Squared Statistic Um einen Hypothesentest unter Verwendung der Chi-Quadrat-Statistik zu veranschaulichen, nehmen wir ein Beispiel für einen Fonds, von dem wir glauben, dass er sehr volatil gegenüber dem Markt ist, und wir möchten das Risiko (nach vierteljährlichem Standard) nachweisen Abweichung) ist größer als die Märkte Durchschnitt. Für unseren Test gehen wir davon aus, dass die vierteljährliche Standardabweichung der Märkte 10 ist. Unser Test wird vierteljährliche Renditen in den letzten fünf Jahren untersuchen, also n 20 und Freiheitsgrade 19. Unser Test ist ein überdurchschnittlicher Test mit der Nullhypothese von 2 Lt (10) 2. oder 100 und eine abweichende Hypothese von 2 gt 100. Unter Verwendung von 0,05 Signifikanzniveaus beträgt unser Ablehnungspunkt aus den Chi-Quadrat-Tabellen mit df 19 und p 0,05 im rechten Schwanz 30,144. Wenn also unsere berechnete Teststatistik größer als 30,144 ist, lehnen wir die Nullhypothese auf 5 Signifikanzniveau ab. Antwort: Untersucht man die vierteljährlichen Renditen für diesen Zeitraum, so finden wir unsere Stichprobenabweichung (s 2) ist 135. Mit n 20 und 0 2 100 haben wir alle Daten, die zur Berechnung der Teststatistik erforderlich sind. 2 ((n - 1) s 2) / 0 2 ((20 - 1) 135) / 100 2565/100 oder 25,65. Da 25.65 kleiner als unser kritischer Wert von 30.144 ist, haben wir nicht genügend Beweise, um die Nullhypothese zurückzuweisen. Während dieser Fonds in der Tat recht volatil sein kann, ist seine Volatilität nicht statistisch bedeutungsvoller als der Marktdurchschnitt für den Zeitraum. Hypothesentests bezüglich der Gleichheit der Varianzen von zwei normalverteilten Populationen, bei denen beide Stichproben zufällig und unabhängig sind Für Hypothesentests bezüglich relativer Werte der Varianzen von zwei Populationen - ob 1 2 (Varianz der ersten Population) und 2 2 (Varianz Der zweiten) sind gleich / nicht gleich / größer / kleiner als - wir können Hypothesen auf eine von drei Arten konstruieren. 13 Wenn ein Hypothesentest Abweichungen von zwei Populationen vergleicht und wir davon ausgehen können, dass zufällige Stichproben aus den Populationen unabhängig (unkorreliert) sind, ist der entsprechende Test der F-Test, der das Verhältnis der Probenabweichungen darstellt. Wie beim Chi-Quadrat ist die F-Verteilung eine Familie von asymmetrischen Verteilungen (von links nach links gebunden). Die F-Familie der Verteilungen wird durch zwei Freiheitsgrade definiert: den Zähler (df 1) und den Nenner (df 2). Jeder der Freiheitsgrade wird aus den Stichprobengrößen (jede Stichprobengröße - 1) entnommen. Der aus den Probendaten entnommene F-Test kann entweder s 1 2 / s 2 2 oder s 2 2 / s 1 2 sein, wobei die Konvention verwendet wird, je nachdem, welches Verhältnis die größere Zahl erzeugt. Auf diese Weise muss sich der F-Test nur mit Werten größer 1 befassen, da eines der beiden Verhältnisse immer eine Zahl über 1 sein wird. Beispiel: Hypothesenprüfung mit Verhältnis von Probenvarianten Zwei Investmentfonds. Fonds A hat höhere Performance-Renditen als Fonds B (die wir im Besitz, leider). Unsere Hypothese ist, dass das Risiko zwischen diesen beiden tatsächlich ganz ähnlich ist, was bedeutet, dass der Fonds A überlegene risikoadjustierte Ergebnisse hat. Wir testen die Hypothese für die letzten fünf Jahre der Quartalsdaten (df ist 19 für Zähler und Nenner). Mit 0.05 Signifikanz ist unser kritischer Wert aus den F-Tabellen 2.51. Nehmen wir an, dass die vierteljährlichen Standardabweichungen 8,5 für den Fonds A und 6,3 für den Fonds B sind. Antwort: Unsere F-Statistik ist (8,5) 2 / (6,3) 2 72,25 / 39,69 1,82. Da 1,82 das Ablehnungsniveau von 2,51 nicht erreicht, können wir die Nullhypothese nicht zurückweisen, und wir geben an, dass das Risiko zwischen diesen Fonds nicht signifikant verschieden ist. Konzepte aus der Hypothese-Test-Sektion sind wahrscheinlich nicht durch rigorose Übungen in Anzahl crunching getestet werden, sondern eher die Identifizierung der einzigartigen Attribute einer bestimmten Statistik. Beispielsweise kann eine typische Frage gestellt werden: In der Hypothesenprüfung, welche Teststatistik durch zwei Freiheitsgrade definiert wird, können der Zähler und der Nenner diese Wahl treffen: A. t-test, B. z-test, C. chi - Quadrat oder D. F-Test. Natürlich wäre die Antwort D. Eine andere Frage könnte fragen, welche Verteilung ist nicht symmetrisch, und geben Sie dann diese Wahlmöglichkeiten: A. t, B. z, C. chi-Quadrat, D. normal. Hier wäre die Antwort C. Fokus auf die definierenden Merkmale, da sie die wahrscheinlichste Quelle für Prüfungsfragen sind. Parametrische und nichtparametrische Tests Alle bisher beschriebenen Hypothesentests wurden so oder so entworfen, um den vorhergesagten Wert eines oder mehrerer Parameter zu testen - unbekannte Variablen wie Mittelwert und Varianz, die eine Population charakterisieren und deren beobachtete Werte verteilt sind In einer gewissen vermuteten Weise. In der Tat sind diese spezifischen Annahmen obligatorisch und auch sehr wichtig: Die meisten der am häufigsten angewandten Tests werden mit Daten aufgebaut, die davon ausgehen, dass die zugrundeliegende Bevölkerung normal verteilt ist, was, wenn nicht wahr, die Schlussfolgerungen ungültig macht. Je weniger normal die Bevölkerung (d. h. desto schrägere die Daten), desto weniger sollten diese parametrischen Tests oder Verfahren für den beabsichtigten Zweck verwendet werden. Nichtparametrische Hypothesentests sind für Fälle ausgelegt, in denen entweder (a) weniger oder unterschiedliche Annahmen über die Populationsdaten angebracht sind, oder (b) wenn der Hypothesentest keinen Populationsparameter betrifft. In vielen Fällen sind wir neugierig auf eine Reihe von Daten, aber glauben, dass die erforderlichen Annahmen (z. B. normal verteilte Daten) nicht für dieses Beispiel gelten, oder die Stichprobengröße ist zu klein, um bequem eine solche Annahme zu machen. Eine Anzahl von nichtparametrischen Alternativen wurde entwickelt, um in solchen Fällen verwendet zu werden. Die folgende Tabelle zeigt einige Beispiele, die den üblichen parametrischen Tests entsprechen. 13 Hypothese Die Ergebnisse Ihrer statistischen Analysen helfen Ihnen, das Ergebnis Ihrer Studie zu verstehen, z. B. Ob Variablen eine Wirkung haben, ob Variablen zusammenhängen, ob Unterschiede zwischen Gruppen von Beobachtungen gleich oder verschieden sind usw. Statistiken sind Werkzeuge der Wissenschaft, nicht ein Selbstzweck. Statistiken sollten verwendet werden, um Ihre Ergebnisse zu bestätigen und Ihnen helfen, objektiv zu sagen, wenn Sie erhebliche Ergebnisse haben. Daher, wenn die Berichterstattung über die statistischen Ergebnisse für Ihre Studie relevant, unterwerfen sie die tatsächlichen biologischen Ergebnisse. Reporting Beschreibung (Zusammenfassung) Statistics Means. Berichten Sie immer den Mittelwert (Mittelwert) zusammen mit einem Maß der Variabilität (Standardabweichung (s) oder Standardfehler des Mittelwerts). Zwei allgemeine Möglichkeiten, den Mittelwert und die Variabilität auszudrücken, sind nachstehend gezeigt: Die Gesamtlänge der Braunforelle (n128) betrug im Mai 1994 durchschnittlich 34,4 cm (s 12,4 cm), Proben von Sebago Lake. quot s Standardabweichung (dieses Format wird von Huth bevorzugt (1994) Die Gesamtlänge der Braunforelle (n128) betrug im Mai 1994 durchschnittlich 34,4 plusmn 12,4 cm, Proben von Sebago Lake. quot Dieser Stil erfordert in den Methoden spezifisch, welche Messgrößen der Variabilität mit dem Mittel gemeldet werden Statistiken in graphischer Form dargestellt werden (eine Abbildung), können Sie einfach das Ergebnis im Text ohne Verbalisierung der Summenwerte angeben: Die Gesamtlänge der Bachforelle im Sebago See stieg zwischen Mai und September 1994 um 3,8 cm (Bild 5).quot Frequenzen: Die Frequenzdaten sollten im Text mit geeigneten Maßnahmen wie Prozente, Proportionen oder Verhältnissen zusammengefasst werden. "Während der Fallumschlagszeit konzentrierten sich in den tiefsten Teilen des Sees 47 geschätzte Braunforellen und 24 Bachforellen (Tabelle 3).quot Berichtsergebnisse von Inferential - (Hypothesis) - Tests In diesem Beispiel wird das Schlüsselergebnis blau und das statistische Ergebnis angezeigt. Die den Fund bestärkt, ist rot. Die Gesamtlänge der Bachforellen im Sebago-See stieg im Mai zwischen Mai (34,4 plus 12,4 cm, n128) und September (38,2 plusmn 11,7 cm, n 114) 1994 (zweimaliger t-Test, p lt 0,001) signifikant an : VERMEIDEN, ganze Sätze zu schreiben, die einfach sagen, welchen Test Sie verwendet haben, um ein Ergebnis zu analysieren, gefolgt von einem anderen Ergebnis. Dies verschwendet kostbare Worte (Wirtschaft.) Und unnötig erhöht Ihre Papiere Länge. Zusammenfassung der statistischen Testergebnisse in Zahlen Wenn die in einer Figur gezeigten Ergebnisse mit einem inferentiellen Test getestet wurden, ist es sinnvoll, das Ergebnis des Tests in der Grafik zusammenzufassen, damit Ihr Leser die Bedeutung der Befunde schnell erfassen kann. Es ist unerlässlich, dass Sie Informationen in Ihre Materialien und Methoden oder in der Abbildung Legende enthalten, um zu erklären, wie zu interpretieren, welches System der Codierung Sie verwenden. Mehrere gemeinsame Methoden für die Zusammenfassung der statistischen Ergebnisse sind unten gezeigt. Beispiele: Vergleich von Gruppen (t-Tests, ANOVA, etc.) Der Vergleich der Mittelwerte von 2 oder mehr Gruppen wird üblicherweise in einem Balkendiagramm der Mittel und zugeordneten Fehlerbalken dargestellt. Für zwei Gruppen. Kann der größere Mittelwert 1-4 Sternchen haben, die über dem Fehlerbalken zentriert sind, um den relativen Pegel des p-Wertes anzuzeigen. Im allgemeinen bedeutet das Bezugszeichen plt 0,05, das Quotentmittel plt 0,01, das Quotentmittel plt 0,001 und das Quotierungsmittel plt0,0001. In allen Fällen sollte der p-Wert auch in der Figurenlegende angegeben werden. Das Sternchen kann auch mit tabellarischen Ergebnissen wie unten gezeigt verwendet werden. Beachten Sie, wie der Autor eine Fußnote verwendet hat, um die p-Werte zu definieren, die der Anzahl der Sternchen entsprechen. (Mit freundlicher Genehmigung von Shelley Ball) Für drei oder mehr Gruppen gibt es zwei Systeme, die typischerweise verwendet werden: Linien oder Buchstaben. Das System, das Sie verwenden, hängt davon ab, wie kompliziert es ist, das Ergebnis zusammenzufassen. Das erste Beispiel unten zeigt einen Vergleich von drei Mitteln. Die Linie, die zwei benachbarte Stäbe überspannt, zeigt an, dass sie nicht signifikant unterschiedlich sind (basierend auf einem Vergleichstest mit mehreren Vergleichen), und weil die Linie den Mittelwert von pH 2 nicht einschließt, bedeutet dies, dass der pH 2 - Mittel signifikant von dem pH 5.3 Kontrolle) und der pH 3,5-Gruppe bedeutet. Beachten Sie, dass Informationen zur Interpretation des Codierungssystems (Zeile oder Buchstaben) in der Bildlegende enthalten sind. Wenn Linien nicht leicht gezeichnet werden können, um das Ergebnis zusammenzufassen, ist die häufigste Alternative, Großbuchstaben zu verwenden, die über den Fehlerbalken platziert werden. Briefe, die gemeinsam oder zwischen den Gruppen geteilt werden, würden keinen signifikanten Unterschied anzeigen. Beispiel: Zusammenfassen von Korrelations - und Regressionsanalysen Für Beziehungsdaten (X, Y-Diagramme), bei denen eine Korrelations - oder Regressionsanalyse durchgeführt wurde, ist es üblich, die markanten Teststatistiken (zB r, r-Quadrat) und einen p - Der Körper des Graphen in relativ kleiner Schriftart, um unauffällig zu sein. Wenn eine Regression durchgeführt wird, sollte die am besten passende Linie aufgetragen werden, und die Gleichung der Linie, die auch in dem Körper des Graphen vorgesehen ist. Modified 1-11-2012 Abteilung für Biologie, Bates College. Lewiston, ME 04240P Werte. One-tail oder two-tail FAQ 1318 Last Modified 1-January-2009 Beim Vergleich zweier Gruppen müssen Sie zwischen ein - und zwei-P-P-Werten unterscheiden. Einige Bücher beziehen sich auf einseitige und zweiseitige P-Werte, die das Gleiche bedeuten. Was einseitig bedeutet Es ist am einfachsten, die Unterscheidung im Kontext zu verstehen. So letrsquos vorstellen, dass Sie den Mittelwert aus zwei Gruppen (mit einem ungepaarten t-Test) zu vergleichen. Sowohl Ein-und Zwei-Schwanz-P-Werte basieren auf der gleichen Null-Hypothese, dass zwei Populationen sind wirklich die gleichen und dass eine beobachtete Diskrepanz zwischen Sample-Mittel ist auf den Zufall. Ein zwei-tailed P-Wert beantwortet diese Frage: Unter der Annahme, dass die Nullhypothese wahr ist, was ist die Chance, dass zufällig ausgewählte Proben so weit voneinander entfernt wären, wie (oder weiter), die Sie in diesem Experiment mit einer Gruppe mit dem größeren Mittelwert beobachtet haben Interpretieren Sie einen One-Tail-P-Wert, müssen Sie vorhersagen, welche Gruppe den größeren Mittelwert haben wird, bevor Daten gesammelt werden. Der Ein-P-P-Wert beantwortet diese Frage: Wenn die Nullhypothese wahr ist, was ist die Wahrscheinlichkeit, daß zufällig ausgewählte Abtastwerte so weit voneinander entfernt sind, wie (oder weiter) in diesem Experiment mit der spezifizierten Gruppe mit dem größeren Mittelwert If beobachtet wird Der beobachtete Unterschied ging in die von der experimentellen Hypothese vorhergesagte Richtung, der eintägige P-Wert ist der halbe P-Wert (mit den meisten, aber nicht ganz allen statistischen Tests). Wenn es angebracht ist, einen einseitigen P-Wert zu verwenden, ist ein eintägiger Test geeignet, wenn frühere Daten, physikalische Einschränkungen oder der gesunde Menschenverstand Ihnen mitteilt, dass die Differenz, wenn überhaupt, nur in eine Richtung gehen kann. Sie sollten nur einen P-Wert wählen, wenn beide der folgenden Werte zutreffen. Sie haben vorausgesagt, welche Gruppe den größeren Mittelwert (oder Anteil) haben wird, bevor Sie Daten gesammelt haben. Wenn die andere Gruppe mit dem größeren mittleren ndash geendet hatte, selbst wenn es ein ziemlich größeres ndash ist, würden Sie diesen Unterschied dem Zufall zugeschrieben und den Unterschied 39not statistisch signifikant39 genannt haben. Hier ist ein Beispiel, in dem Sie möglicherweise einen eintägigen P-Wert auswählen: Sie prüfen, ob ein neues Antibiotikum die Nierenfunktion beeinträchtigt, wie durch Serumkreatinin gemessen. Viele Antibiotika vergiften Nierenzellen, was zu einer verminderten glomerulären Filtration und erhöhtem Serumkreatinin führt. Soweit ich weiß, ist kein Antibiotikum bekannt, das Serumkreatinin zu senken, und es ist schwer, einen Mechanismus vorzustellen, durch den ein Antibiotikum die glomeruläre Filtrationsrate erhöhen würde. Vor dem Sammeln von Daten können Sie angeben, dass es zwei Möglichkeiten gibt: Entweder wird das Medikament das mittlere Serumkreatinin der Population nicht verändern oder es erhöht das mittlere Serumkreatinin in der Population. Sie halten es für unmöglich, dass das Medikament wird wirklich erniedrigen mittlere Serum-Kreatinin der Bevölkerung und planen, jede beobachtete Abnahme auf zufällige Stichprobe zuzuschreiben. Dementsprechend ist es sinnvoll, einen eintägigen P-Wert zu berechnen. In diesem Beispiel testet ein zweiseitiger P-Wert die Nullhypothese, dass das Arzneimittel den Kreatininspiegel nicht ändert, ein Ein-Schwanz-P-Wert prüft die Nullhypothese, dass das Arzneimittel den Kreatininspiegel nicht erhöht. Das Problem bei der Auswahl zwischen ein-und zwei-tailed P-Werte ist nicht, ob oder nicht erwarten, dass eine Differenz vorhanden ist. Wenn Sie bereits wissen, ob es einen Unterschied gab, gibt es keinen Grund, die Daten zu sammeln. Vielmehr geht es darum, ob die Richtung einer Differenz (wenn es eine gibt) nur einen Weg gehen kann. Sie sollten nur einen ein-tailed P-Wert verwenden, wenn Sie mit Sicherheit (und vor dem Sammeln von Daten) angeben können, dass in den Gesamtpopulationen entweder kein Unterschied besteht oder es einen Unterschied in einer bestimmten Richtung gibt. Wenn Ihre Daten am Ende zeigt eine Differenz in der ldquowrongrdquo Richtung, sollten Sie bereit sein, diese Differenz zu zufälligen Stichproben, ohne auch nur die Vorstellung, dass die gemessene Differenz könnte ein wahrer Unterschied in der Gesamtbevölkerung widerspiegeln. Wenn ein Unterschied in der ldquowwrgrququo Richtung Sie intrigieren würde (sogar ein wenig), sollten Sie einen zwei-tailed P-Wert zu berechnen. Empfehlung Ich empfehle, nur zwei-tailed P-Werte aus den folgenden Gründen zu verwenden: Die Beziehung zwischen P-Werten und Konfidenzintervallen ist einfacher mit zwei-tailed P-Werten. Zwei-tailed P-Werte sind größer (konservativer). Da viele Experimente nicht vollständig mit allen Annahmen übereinstimmen, auf denen die statistischen Berechnungen basieren, sind viele P-Werte kleiner als sie sein sollten. Die Verwendung des größeren zwei-tailed P-Wertes korrigiert dazu teilweise. Einige Tests vergleichen drei oder mehr Gruppen, was das Konzept der Schwänze unangemessen macht (genauer gesagt, der P-Wert hat mehr als zwei Schwänze). Ein zwei-tailed P-Wert ist konsistent mit P-Werten, die von diesen Tests berichtet werden. Die Auswahl ein-tailed P-Werte können Sie in schwierigen Situationen. Wenn Sie beschlossen, einen ein-tailed P-Wert zu berechnen, was würden Sie tun, wenn Sie einen großen Unterschied in der entgegengesetzten Richtung beobachtet, um die experimentelle Hypothese Um ehrlich zu sein, sollten Sie angeben, dass der P-Wert groß ist und Sie gefunden ldquono signifikanten Unterschied. Rdquo Aber die meisten Leute würden dieses hart finden. Stattdessen wird es versucht, auf einen Zwei-Schwanz-P-Wert umzuschalten oder mit einem Ein-Schwanz-P-Wert zu bleiben, aber die Richtung der Hypothese zu ändern. Sie vermeiden diese Versuchung durch die Wahl von zwei-tailed P-Werte an erster Stelle. Beachten Sie bei der Interpretation der veröffentlichten P-Werte, ob sie für ein oder zwei Schwänze berechnet werden. Wenn der Autor didnrsquot sagen, ist das Ergebnis etwas zweideutig. Umwandlung zwischen Ein - und Zweifach-P-Werten Der Ein-P-Wert ist der halbe P-Wert. Der Zwei-Schwellen-P-Wert ist das Doppelte des Ein-Schwanz-P-Werts.


No comments:

Post a Comment