Hoe de verschillen in uw gegevens met de R Evalueer

Om het datamodel die u hebt gemaakt met ANOVA (variantieanalyse) controleren, kunt u R's samenvatting () functie te gebruiken op het model voorwerp, zoals deze:

> Samenvatting (AOVModel)
Df Sum Sq Mean Sq F-waarde Pr (> F)
Spuit 5 2669 533,8 34,7 <2e-16 ***
Residuen 66 1015 15,4
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0,05 '.' 0.1 '' 1

R drukt u de variantieanalyse tabel die in wezen vertelt u of de verschillende termen een significant deel van de variantie kan verklaren in uw gegevens. Deze tabel vertelt je alleen iets over de term, maar niets over de verschillen tussen de verschillende sprays. Daarvoor moet je een beetje dieper graven.

Hoe te datamodel tafels controleren

Met de model.tables () functie, dan kunt u een kijkje nemen op de resultaten voor de afzonderlijke niveaus van de factoren. De functie kunt u twee verschillende tabellen te maken; ofwel je kijkt naar de geschatte gemiddelde resultaat voor elke groep, of je kijkt naar het verschil met het totale gemiddelde.

Om te weten hoe veel effect elke spuiten gehad, de volgende code gebruik je:

> Model.tables (AOVModel, type = 'effecten')
Tafels van effecten
besproeien
besproeien
ABCDEF
5,000 5,833 -7,417 -4,583 -6,000 7,167

Hier ziet dat bijvoorbeeld spuiten E resulteerde gemiddeld zes insecten minder dan het gemiddelde over alle gebieden. Anderzijds, op gebieden waar nevel A werd gebruikt, de boeren gevonden gemiddeld vijf bugs meer in vergelijking met het totale gemiddelde.

Om de gemodelleerde middelen per groep en het totale gemiddelde te krijgen, gewoon gebruik maken van het argument waarde type = 'betekent' in plaats van 'effecten' type =.

Hoe om te kijken naar individuele verschillen in data

Een boer zou waarschijnlijk niet overwegen de aanschaf van spuiten A, maar hoe zit het spuiten D? Hoewel sprays E en C lijken beter te zijn, ze kunnen ook een stuk duurder. Om te testen of de paarsgewijze verschillen tussen de sprays zijn aanzienlijk, Eerlijk significant verschil (HSD) -test Tukey's gebruik je. De TukeyHSD () functie kunt u dat heel gemakkelijk doen, zoals deze:

> Vergelijkingen <- TukeyHSD (Model)

De Vergelijkingen object bevat nu een lijst waar elk element is vernoemd naar een van de factoren in het model. In het voorbeeld, je hebt slechts één element, genaamd spray. Dit element bevat, voor elke combinatie van sprays, de volgende:

  • Het verschil tussen de gemiddelden.
  • De onderste en bovenste verdieping van het 95 procent betrouwbaarheidsinterval rond dat gemiddelde verschil.
  • De p-waarde die aangeeft of dit verschil significant verschillend van nul. Deze p-waarde wordt aangepast met behulp van de methode van Tukey (vandaar de naam kolom p adj).

Je kunt al die informatie met behulp van de klassieke methoden voor de extractie uit te pakken. Zo krijg je de informatie over het verschil tussen D en C als volgt uit:

> Vergelijkingen $ spuiten ['D-C',]
diff LWR UPR p adj
2.8333333 -1,8660752 7,5327418 0,4920707

Dat verschil is niet indrukwekkend, als je Tukey vragen.

Hoe om de verschillen te plotten

De TukeyHSD object heeft nog een leuke feature: Het kan worden uitgezet. Doe geen moeite om op zoek naar een Help-pagina van het perceel functie - alles wat je vindt is één zin: "Er is een plot methode." Maar het werkt zeker! Probeer het uit als volgt:

> Plot (Vergelijkingen, las = 1)

Je ziet de output van deze eenvoudige regel. Elke regel staat voor het gemiddelde verschil tussen beide groepen met de volgens betrouwbaarheidsinterval. Wanneer het betrouwbaarheidsinterval omvat niet nul (de verticale lijn), het verschil tussen beide groepen significant.

U kunt een deel van de grafische parameters gebruiken om het perceel beter leesbaar te maken. Specifiek, de parameter las hier bruikbaar. Door hem op 1, u ervoor zorgen dat alle assen labels worden horizontaal afgedrukt zodat u ze daadwerkelijk kan lezen.

Hoe de verschillen in uw gegevens met de R Evalueer