Hur man analyserar statistisk betydelse: 15 steg

Innehållsförteckning:

Hur man analyserar statistisk betydelse: 15 steg
Hur man analyserar statistisk betydelse: 15 steg

Video: Hur man analyserar statistisk betydelse: 15 steg

Video: Hur man analyserar statistisk betydelse: 15 steg
Video: Statistical Significance and p-Values Explained Intuitively 2024, Maj
Anonim

Hypotesprovning görs med statistisk analys. Statistisk signifikans beräknades med hjälp av p-värdet, vilket indikerar storleken på sannolikheten för forskningsresultaten, förutsatt att vissa påståenden (nollhypotes) är sanna. Om p -värdet är mindre än den förutbestämda signifikansnivån (i allmänhet 0,05) kan forskaren dra slutsatsen att nollhypotesen inte är sann och acceptera den alternativa hypotesen. Med ett enkelt t-test kan du beräkna ett p-värde och bestämma signifikansen mellan två olika uppsättningar data.

Steg

Del 1 av 3: Konfigurera experiment

Bedöm statistisk betydelse Steg 1
Bedöm statistisk betydelse Steg 1

Steg 1. Upprätta en hypotes

Det första steget i analysen av statistisk signifikans är att bestämma den forskningsfråga du vill svara på och formulera din hypotes. En hypotes är ett uttalande om dina experimentella data och förklarar möjliga skillnader i studiepopulationen. För varje experiment måste en nollhypotes och en alternativ hypotes fastställas. I allmänhet kommer du att jämföra två grupper för att se om de är desamma eller olika.

  • Nollhypotesen (H0) säger generellt att det inte finns någon skillnad mellan de två datamängderna. Exempel: gruppen elever som läste materialet innan klassen började fick inte bättre betyg än gruppen som inte läste materialet.
  • Alternativ hypotes (Ha) är ett påstående som motsäger nollhypotesen och ett som du försöker stödja med experimentella data. Exempel: gruppen elever som läste materialet före klassen fick bättre betyg än gruppen som inte läste materialet.
Bedöm statistisk betydelse Steg 2
Bedöm statistisk betydelse Steg 2

Steg 2. Begränsa betydelsen för att avgöra hur unik din data måste vara för att den ska anses vara betydande

Signifikansnivån (alfa) är tröskeln som används för att bestämma signifikansen. Om p -värdet är mindre än eller lika med signifikansnivån anses uppgifterna vara statistiskt signifikanta.

  • Som en allmän regel är signifikansnivån (alfa) satt till 0,05, vilket innebär att sannolikheten för att båda grupperna av data är lika är bara 5%.
  • Genom att använda en högre konfidensnivå (lägre p -värde) innebär att experimentella resultat kommer att betraktas som mer signifikanta.
  • Om du vill öka konfidensnivån för dina data, sänk p-värdet mer till 0,01. Lägre p-värden används vanligtvis vid tillverkning vid upptäckt av produktdefekter. Ett högt förtroende är avgörande för att säkerställa att varje tillverkad del utför sin funktion.
  • För hypotesprovningsexperiment är en signifikansnivå på 0,05 acceptabel.
Bedöm statistisk betydelse Steg 3
Bedöm statistisk betydelse Steg 3

Steg 3. Bestäm dig för att använda ett test med en eller två strumpor

Ett av antagandena som används när du utför ett t-test är att din data är normalt distribuerad. Data som normalt distribueras kommer att bilda en klockkurva med de flesta data i mitten av kurvan. T-testet är ett matematiskt test som används för att se om dina data ligger utanför normalfördelningen, under eller över kurvens "svans".

  • Om du inte är säker på att din data ligger under eller över kontrollgruppen använder du ett tvåsidig test. Detta test kommer att kontrollera betydelsen av båda riktningarna.
  • Om du vet riktningen för trenden med dina data, använd ett ensidigt test. Med det föregående exemplet förväntade du dig att en elevs betyg skulle öka. Därför bör du använda ett ensidig test.
Bedöm statistisk betydelse Steg 4
Bedöm statistisk betydelse Steg 4

Steg 4. Bestäm provstorleken genom teststatistisk effektanalys

Kraften i teststatistik är sannolikheten för att ett visst statistiskt test kan ge rätt resultat, med en viss urvalsstorlek. Testeffektgränsen (eller) är 80%. Analys av styrkan i ett statistiskt test kan vara komplicerat utan preliminära data eftersom du behöver information om det uppskattade medelvärdet för varje datamängd och dess standardavvikelse. Använd den onlinestatistiska kalkylatorkalkylatorn för att bestämma den optimala urvalsstorleken för dina data.

  • Forskare genomför i allmänhet pilotstudier som ett material för statistiska teststyrkeanalyser och som grund för att bestämma den urvalsstorlek som behövs för större och mer omfattande studier.
  • Om du inte har resurser att genomföra en pilotstudie, uppskatta medelvärdet baserat på litteratur och annan forskning som har gjorts. Denna metod kommer att ge information för att bestämma provstorleken.

Del 2 av 3: Beräkning av standardavvikelsen

Bedöm statistisk betydelse Steg 5
Bedöm statistisk betydelse Steg 5

Steg 1. Använd standardavvikelseformeln

Standardavvikelsen (även känd som standardavvikelsen) är ett mått på fördelningen av dina data. Standardavvikelsen ger information om likheten mellan varje datapunkt i ditt urval. Till en början kan standardavvikelseekvationen verka komplicerad, men stegen nedan hjälper dig med din beräkningsprocess. Standardavvikelseformeln är s = ((xi -)2/(N - 1)).

  • s är standardavvikelsen.
  • betyder att du måste lägga till alla provvärden som du har samlat in.
  • xi representerar alla individuella värden för dina datapunkter.
  • är genomsnittet av data för varje grupp.
  • N är antalet prover.
Bedöm statistisk betydelse Steg 6
Bedöm statistisk betydelse Steg 6

Steg 2. Beräkna provmedlet i varje grupp

För att beräkna standardavvikelsen måste du först beräkna samplingsmedelvärdet i varje datamängd. Medelvärdet betecknas med den grekiska bokstaven mu eller. För att göra detta, lägg till alla värden för provdatapunkterna och dividera med antalet samplingar.

  • Till exempel, för att få medelpoänget för gruppen elever som läser materialet före klassen, låt oss titta på provdata. För enkelhetens skull kommer vi att använda 5 datapunkter: 90, 91, 85, 83 och 94.
  • Lägg ihop alla provvärden: 90 + 91 + 85 + 83 + 94 = 443.
  • Dividera med antalet prover, N = 5: 443/5 = 88, 6.
  • Medelpoänget för denna grupp var 88. 6.
Bedöm statistisk betydelse Steg 7
Bedöm statistisk betydelse Steg 7

Steg 3. Subtrahera varje provdatapunktvärde med medelvärdet

Det andra steget är att slutföra delen (xi -) ekvation. Subtrahera varje provdatapunktvärde från det förberäknade medelvärdet. Om du fortsätter det föregående exemplet måste du göra fem subtraktioner.

  • (90- 88, 6), (91- 88, 6), (85- 88, 6), (83- 88, 6) och (94- 88, 6).
  • De erhållna värdena är 1, 4, 2, 4, -3, 6, -5, 6 och 5, 4.
Bedöm statistisk betydelse Steg 8
Bedöm statistisk betydelse Steg 8

Steg 4. Kvadrera varje värde som har erhållits och lägg till dem alla

Kvadrera varje värde du just beräknat. Detta steg tar bort eventuella negativa tal. Om det finns ett negativt värde efter att detta steg har utförts eller tiden efter att alla beräkningar har utförts kan du ha glömt detta steg.

  • Med det föregående exemplet får vi värdena 1, 96, 5, 76, 12, 96, 31, 36 och 29.16.
  • Lägg ihop alla värden: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Bedöm statistisk betydelse Steg 9
Bedöm statistisk betydelse Steg 9

Steg 5. Dela med antalet prover minus 1

Formeln uttrycker N - 1 som en justering eftersom du inte räknar hela befolkningen; Du tar bara ett urval av befolkningen för att göra en uppskattning.

  • Subtrahera: N - 1 = 5 - 1 = 4
  • Dela: 81, 2/4 = 20, 3
Bedöm statistisk betydelse Steg 10
Bedöm statistisk betydelse Steg 10

Steg 6. Beräkna kvadratroten

När du har dividerat med antalet prover minus ett, beräkna kvadratroten för det slutliga värdet. Detta är det sista steget för att beräkna standardavvikelsen. Det finns flera statistiska program som kan beräkna standardavvikelsen efter att du har angett rådata.

Till exempel är standardavvikelsen för poängen för gruppen elever som läser materialet innan klassen börjar: s = √20, 3 = 4, 51

Del 3 av 3: Fastställande av betydelse

Bedöm statistisk betydelse Steg 11
Bedöm statistisk betydelse Steg 11

Steg 1. Beräkna variansen mellan de två provgrupperna

I föregående exempel beräknade vi bara standardavvikelsen för en grupp. Om du vill jämföra två grupper bör du ha data från de två grupperna. Beräkna standardavvikelsen för den andra gruppen och använd resultaten för att beräkna variansen mellan de två grupperna i experimentet. Formeln för varians är sd = ((s1/N1) + (s2/N2)).

  • sd är mellangruppsvariansen.
  • s1 är standardavvikelsen för grupp 1 och N1 är antalet prover i grupp 1.
  • s2 är standardavvikelsen för grupp 2 och N2 är antalet prover i grupp 2.
  • Exempelvis har data från grupp 2 (elever som inte läser materialet innan klassen börjar) en urvalsstorlek på 5 med en standardavvikelse på 5,81. Sedan varianten:

    • sd = ((s1)2/N1) + ((s2)2/N2))
    • sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Bedöm statistisk betydelse Steg 12
Bedöm statistisk betydelse Steg 12

Steg 2. Beräkna t-testvärdet för dina data

T-testvärdet gör att du kan jämföra en datagrupp med en annan datagrupp. Med t-värdet kan du utföra ett t-test för att avgöra hur stor sannolikhet att de två grupperna av data som jämförs är signifikant olika. Formeln för värdet av t är: t = (µ1 -2)/sd.

  • 1 är medelvärdet för den första gruppen.
  • 2 är medelvärdet för den andra gruppen.
  • sd är skillnaden mellan de två proverna.
  • Använd det större medelvärdet som1 så du inte får negativa värden.
  • Till exempel är medelpoängen för grupp 2 (elever som inte läser) 80. T-värdet är: t = (µ1 -2)/sd = (88, 6 – 80)/3, 29 = 2, 61.
Bedöm statistisk betydelse Steg 13
Bedöm statistisk betydelse Steg 13

Steg 3. Bestäm provets frihetsgrader

Vid användning av t-värdet bestäms frihetsgraderna av provets storlek. Lägg till antalet prover från varje grupp och subtrahera sedan två. Till exempel är frihetsgraderna (d.f.) 8 eftersom det finns fem prover i den första gruppen och fem prover i den andra gruppen ((5 + 5) - 2 = 8).

Bedöm statistisk betydelse Steg 14
Bedöm statistisk betydelse Steg 14

Steg 4. Använd tabell t för att bestämma betydelsen

Tabeller med t-värden och frihetsgrader finns i vanliga statistikböcker eller online. Titta på raden som visar de frihetsgrader du valt för dina data och hitta lämpligt p-värde för t-värdet som härrör från dina beräkningar.

Med frihetsgrader på 8 d.f. och t-värdet på 2,61, p-värdet för det ensidiga testet är mellan 0,01 och 0,025. Eftersom vi använde en signifikansnivå som är mindre än eller lika med 0,05, visar de data vi använder att de två datagrupperna är signifikant olika. betydande. Med denna data kan vi förkasta nollhypotesen och acceptera den alternativa hypotesen: gruppen elever som läste materialet innan klassen började fick bättre poäng än gruppen elever som inte läste materialet

Bedöm statistisk betydelse Steg 15
Bedöm statistisk betydelse Steg 15

Steg 5. Överväg att göra en uppföljningsstudie

Många forskare genomför små pilotstudier för att hjälpa dem att förstå hur man utformar större studier. Att göra mer forskning med fler mätningar ökar ditt förtroende för dina slutsatser.

Tips

Statistik är ett brett och komplext område. Ta en gymnasie- eller universitetsklass i slutstatistik för att hjälpa dig förstå statistisk signifikans

Rekommenderad: