Hoe om te gaan met ontbrekende gegevens Waarden in R

De cor () functie in R kan omgaan met ontbrekende gegevens waarden op meerdere manieren. Voor dat je het argument gebruiken ingesteld op een van de mogelijke tekst waarden. De waarde voor het gebruik argument is vooral belangrijk als de correlaties van de variabelen berekenen een dataframe. Door dit argument om verschillende waarden, kunt u

  • Gebruik alle waarnemingen door gebruik = 'alles'. Dit betekent dat als thereâ € ™ s geen NA waarde in een van de variabelen, de resulterende correlatie is NA ook. Dit is de standaard.
  • Sluiten alle waarnemingen die NA hebben voor minstens één variabele. Gebruik hiervoor = 'complete.obs' u hebt ingesteld. Merk op dat dit u kan verlaten met slechts een paar observaties als ontbrekende waarden worden verspreid door de complete dataset.
  • Waarnemingen te sluiten met NA-waarden voor elk paar variabelen u onderzoeken. Voor dat u het argument gebruik = 'paarsgewijs' ingesteld. Dit zorgt ervoor dat u de correlatie voor elk paar variabelen kunnen berekenen zonder verlies van gegevens als gevolg van ontbrekende waarden in de andere variabelen.

In feite, kunt u verschillende maatregelen van de correlatie te berekenen. Standaard berekent R de standaard Pearson correlatiecoëfficiënt. Voor gegevens die niet normaal verdeeld is, kunt u de cor () functie gebruiken om de Spearman correlatie, of Kendallâ € ™ s tau berekenen. Hiervoor moet je de methode argument om de juiste waarde in te stellen.