Სარჩევი:

როგორ გაუმკლავდებით NA მნიშვნელობებს R-ში?
როგორ გაუმკლავდებით NA მნიშვნელობებს R-ში?

ვიდეო: როგორ გაუმკლავდებით NA მნიშვნელობებს R-ში?

ვიდეო: როგორ გაუმკლავდებით NA მნიშვნელობებს R-ში?
ვიდეო: What is NT scan and Double Marker test in pregnancy | Reports kaise samjhein 2024, მაისი
Anonim

მონაცემთა იმპორტის დროს სხვა სტატისტიკური აპლიკაციებიდან დაკარგული ღირებულებები შეიძლება იყოს კოდირებული ნომრით, მაგალითად 99. რათა ნება რ იცოდე რომ არის ა დაკარგული მნიშვნელობა საჭიროა მისი ხელახალი კოდირება. კიდევ ერთი სასარგებლო ფუნქცია რ რომ გაუმკლავდეთ დაკარგული ღირებულებებს არის na . omit() რომელიც წაშლის არასრულ დაკვირვებებს.

უბრალოდ, როგორ გაუმკლავდებით NA-ს R-ში?

NA ვარიანტები რ

  1. გამოტოვება და ნა. exclude: აბრუნებს ობიექტს ამოღებული დაკვირვებებით, თუ ისინი შეიცავს რაიმე გამოტოვებულ მნიშვნელობას; განსხვავებები NA-ების გამოტოვებასა და გამორიცხვას შორის ჩანს ზოგიერთ პროგნოზირებასა და ნარჩენ ფუნქციებში.
  2. pass: აბრუნებს ობიექტს უცვლელად.
  3. fail: აბრუნებს ობიექტს მხოლოდ იმ შემთხვევაში, თუ ის არ შეიცავს გამოტოვებულ მნიშვნელობებს.

ანალოგიურად, როგორ ამუშავებთ გამოტოვებულ კატეგორიულ მონაცემებს R-ში? არსებობს კატეგორიული გზების დაკარგული მნიშვნელობების დამუშავების სხვადასხვა გზა.

  1. იგნორირება გაუკეთეთ გამოტოვებულ მნიშვნელობებზე დაკვირვებებს, თუ საქმე გვაქვს მონაცემთა დიდ ნაკრებებთან და ჩანაწერების ნაკლებ რაოდენობას აქვს დაკარგული მნიშვნელობები.
  2. ცვლადის იგნორირება, თუ ის არ არის მნიშვნელოვანი.
  3. შეიმუშავეთ მოდელი დაკარგული მნიშვნელობების პროგნოზირებისთვის.
  4. განიხილეთ დაკარგული მონაცემები, როგორც სხვა კატეგორია.

ანალოგიურად შეიძლება ვინმემ იკითხოს, როგორ დააყენოთ დაკარგული მნიშვნელობები R-ში?

In რ , დაკარგული ღირებულებები წარმოდგენილია სიმბოლოთი NA (მიუწვდომელია). შეუძლებელია ღირებულებები (მაგ. ნულზე გაყოფა) წარმოდგენილია სიმბოლოთ NaN (არა რიცხვი). SAS-ისგან განსხვავებით, რ იყენებს იგივე სიმბოლოს სიმბოლოსა და რიცხვისთვის მონაცემები . მეტი პრაქტიკისთვის მუშაობისას დაკარგული მონაცემები სცადეთ ეს კურსი დასუფთავების შესახებ მონაცემები რ.

რას ნიშნავს Na Rm R-ში?

მონაცემთა ჩარჩო ფუნქციის გამოყენებისას na . რმ in რ ეხება ლოგიკურ პარამეტრს, რომელიც ეუბნება ფუნქციას წაშალოს თუ არა NA ღირებულებები გაანგარიშებიდან. ეს ფაქტიურად ნიშნავს NA ამოღება. ეს არც ფუნქციაა და არც ოპერაცია. ეს უბრალოდ პარამეტრია, რომელიც გამოიყენება მონაცემთა ჩარჩოს რამდენიმე ფუნქციით.

გირჩევთ: