როგორ წავშალო R-ში დაკარგული მნიშვნელობები?
როგორ წავშალო R-ში დაკარგული მნიშვნელობები?

ვიდეო: როგორ წავშალო R-ში დაკარგული მნიშვნელობები?

ვიდეო: როგორ წავშალო R-ში დაკარგული მნიშვნელობები?
ვიდეო: How To... Remove Records with Missing Data in R #74 2024, ნოემბერი
Anonim

პირველ რიგში, თუ გვინდა გამოვრიცხოთ დაკარგული ღირებულებები მათემატიკური ოპერაციებიდან გამოიყენეთ na . rm = TRUE არგუმენტი. თუ არ გამორიცხავთ ამათ ღირებულებები ფუნქციების უმეტესობა დაბრუნდება ან NA . ჩვენ ასევე შეიძლება გვსურს ჩვენი ქვეჯგუფი მონაცემები სრული დაკვირვებების მისაღებად, ეს დაკვირვებები (სტრიქონები) ჩვენს მონაცემები რომელიც შეიცავს არა დაკარგული მონაცემები.

უბრალოდ, როგორ უმკლავდება R დაკარგული მნიშვნელობებს?

In რ The დაკარგული ღირებულებები დაშიფრულია სიმბოლოთი NA . თქვენს მონაცემთა ბაზაში დაკარგულის იდენტიფიცირება ფუნქცია არის. na (). მონაცემთა იმპორტის დროს სხვა სტატისტიკური აპლიკაციებიდან დაკარგული ღირებულებები შეიძლება იყოს კოდირებული ნომრით, მაგალითად 99. რათა ნება რ იცოდე რომ არის ა დაკარგული მნიშვნელობა საჭიროა მისი ხელახალი კოდირება.

გარდა ამისა, როგორ ასახელებთ გამოტოვებულ მნიშვნელობებს R-ში? დაკარგული მონაცემების გამკლავება R-ის გამოყენებით

  1. colsum(is.na(მონაცემთა ჩარჩო))
  2. sum(is.na(მონაცემთა ჩარჩო$სვეტის სახელი)
  3. დაკარგული მნიშვნელობების მკურნალობა შესაძლებელია შემდეგი მეთოდების გამოყენებით:
  4. საშუალო/რეჟიმი/ მედიანური იმპუტაცია: იმპუტაცია არის მეთოდი, რომ შეავსოთ გამოტოვებული მნიშვნელობები სავარაუდოთ.
  5. პროგნოზირების მოდელი: პროგნოზირების მოდელი არის ერთ-ერთი დახვეწილი მეთოდი დაკარგული მონაცემების დასამუშავებლად.

შემდგომში, შეიძლება ასევე იკითხოთ, როგორ წავშალო R-ში NA მნიშვნელობების შემცველი რიგები?

omit() ფუნქცია აბრუნებს სიას ყოველგვარი გარეშე რიგები რომ შეიცავს na მნიშვნელობებს . თქვენი მონაცემთა ჩარჩოს გავლით na . omit() ფუნქცია არის მარტივი გზა თქვენი ანალიზიდან არასრული ჩანაწერების გასასუფთავებლად. ეს არის ეფექტური r-ში na მნიშვნელობების ამოღების გზა.

როგორ წავშალო outliers მონაცემთა ნაკრებიდან R-ში?

კონკრეტული არ არის რ ფუნქციები ამოღება outliers . ჯერ უნდა გაარკვიოთ რა არის დაკვირვებები გამოკვეთილები და მერე ამოღება მათ, ანუ პირველი და მესამე კვართის (ანჯის) და ინტერკვარტილის დიაპაზონის პოვნა შიდა ღობეების რიცხობრივად განსაზღვრისთვის.

გირჩევთ: