Hoe maak je een Two-Way Data Table maken met R

Een twee-weg tabel is een tabel met twee categorische data variabelen tezamen beschrijft, en R geeft je een hele toolset om te werken met twee-weg tabellen. Ze bevatten het aantal gevallen voor elke combinatie van de categorieën uit beide variabelen. De analyse van categorische data begint altijd met tafels. Maar eerst moet je de tabellen te maken.

Hoe maak je een R data tabel te maken van twee variabelen

Bijvoorbeeld, wilt u weten hoeveel auto's hebben drie, vier, of vijf versnellingen, maar opgesplitst voor auto's met automatische versnellingsbakken en auto's met handgeschakelde versnellingsbakken. U kunt dit weer doen met behulp van de tabel () functie met twee argumenten, zoals deze:

> Met (auto's, tafel (am, versnelling))
3 4 5
auto 0 8 5
handleiding 15 4 0

De niveaus van de variabele geef je als eerste argument zijn de rij namen, en de niveaus van de variabele die u geeft als tweede argument zijn de kolomnamen. In de tabel, krijg je de tellingen voor elke combinatie. Bijvoorbeeld, kunt u rekenen op 15 auto's met handgeschakelde versnellingsbak en drie versnellingen.

Hoe te R data tabellen uit een matrix te creëren

Onderzoekers gebruiken ook tafels voor meer serieuze zaken, zoals voor het vinden van de vraag of een bepaald gedrag (zoals roken) heeft een invloed op het risico op het krijgen van een ziekte (bijvoorbeeld longkanker). Op deze manier heb je vier mogelijke gevallen: risicogedrag en zieken, risicogedrag en gezond, geen risicogedrag en gezond, of geen risicogedrag en ziek.

Vaak is het resultaat van een dergelijke studie bestaat uit de tellingen voor elke combinatie. Als je de tellingen voor alle gevallen, kunt u heel eenvoudig de tafel zelf, zoals deze:

> Proef <- matrix (c (34,11,9,32), Ncol = 2)
> Colnames (proef) <- c ('ziek', 'gezonde')
> Rownames (proef) <- c ('risico', 'no_risk')
> Trial.table <- as.table (trial)

Met deze code, doet u het volgende:

  1. Maak een matrix met het aantal gevallen voor elke combinatie van ziek / gezond en risico / geen risicogedrag.
  2. Voeg kolomnamen om erop te wijzen welke categorie de tellingen zijn voor.
  3. Zetten die matrix naar een tafel.

Het resultaat ziet er als volgt uit:

> Trial.table
zieken gezond
risico 34 9
no_risk 11 32

Een tabel zoals trial.table kan worden beschouwd als een samenvatting van twee variabelen. Één variabele geeft aan of de persoon ziek of gezond, en de andere variabele geeft aan of de persoon toont risicovol gedrag.

Hoe de gegevens in R extraheren

Hoewel de tabellen en matrices zijn twee verschillende beesten, kunt u een twee-weg tafel behandelen als een matrix in de meeste situaties. Dit is zeer handig als je wilt om waarden te extraheren uit de tabel. Als u wilt weten hoeveel mensen waren ziek en liet risicogedrag, je gewoon het volgende doen:

> Trial.table ['risico', 'ziek']
[1] 34