რა არის მახასიათებლის შემცირება მანქანათმცოდნეობაში?
რა არის მახასიათებლის შემცირება მანქანათმცოდნეობაში?

ვიდეო: რა არის მახასიათებლის შემცირება მანქანათმცოდნეობაში?

ვიდეო: რა არის მახასიათებლის შემცირება მანქანათმცოდნეობაში?
ვიდეო: Machine Learning - Dimensionality Reduction - Feature Extraction & Selection 2024, ნოემბერი
Anonim

გამოყენების მიზანი ფუნქციის შემცირება არის შემცირება რაოდენობა მახასიათებლები (ან ცვლადები), რომლებიც კომპიუტერმა უნდა დაამუშავოს თავისი ფუნქციის შესასრულებლად. მახასიათებლების შემცირება გამოიყენება ზომების რაოდენობის შესამცირებლად, რაც მონაცემებს ნაკლებად მწირს და სტატისტიკურად უფრო მნიშვნელოვანს ხდის მანქანათმცოდნეობა აპლიკაციები.

ანალოგიურად, თქვენ შეიძლება იკითხოთ, რა არის განზომილების შემცირება მანქანათმცოდნეობაში?

სტატისტიკაში, მანქანათმცოდნეობა და ინფორმაციის თეორია, განზომილების შემცირება ან განზომილების შემცირება არის პროცესი შემცირება განხილული შემთხვევითი ცვლადების რაოდენობა ძირითადი ცვლადების ნაკრების მიღებით. მიდგომები შეიძლება დაიყოს ფუნქციების არჩევად და ფუნქციების ამოღებად.

შეიძლება ასევე იკითხოთ, რა არის განზომილების შემცირების 3 გზა? 3. განზომილების შემცირების საერთო ტექნიკა

  • 3.1 გამოტოვებული ღირებულების თანაფარდობა. დავუშვათ, რომ თქვენ მოგეცემათ მონაცემთა ნაკრები.
  • 3.2 დაბალი ვარიაციის ფილტრი.
  • 3.3 მაღალი კორელაციის ფილტრი.
  • 3.4 შემთხვევითი ტყე.
  • 3.5 უკანა ფუნქციის აღმოფხვრა.
  • 3.6 ფუნქციის წინსვლის შერჩევა.
  • 3.7 ფაქტორული ანალიზი.
  • 3.8 ძირითადი კომპონენტის ანალიზი (PCA)

ზემოაღნიშნულის გარდა, ქვემოთ ჩამოთვლილთაგან რომელია საჭირო მანქანური სწავლის მახასიათებლების შემცირებას?

The საჭიროებს მანქანური სწავლის მახასიათებლების შემცირებას არის შეუსაბამო და ზედმეტი მახასიათებლები , შეზღუდული სასწავლო მონაცემები, შეზღუდული გამოთვლითი რესურსები. ეს შერჩევა არის სრულიად ავტომატური და ის ირჩევს ატრიბუტებს მონაცემებიდან, რომლებიც დაკავშირებულია პროგნოზირებად მოდელირებასთან.

რა არის მახასიათებლის მოპოვება მანქანათმცოდნეობაში?

ფუნქციის მოპოვება არის განზომილების შემცირების პროცესი, რომლითაც ნედლეული მონაცემების საწყისი ნაკრები მცირდება დამუშავებისთვის უფრო მართვად ჯგუფებად. ამ დიდი მონაცემთა ნაკრების მახასიათებელია ცვლადების დიდი რაოდენობა, რომელთა დამუშავებასაც ბევრი გამოთვლითი რესურსი სჭირდება.

გირჩევთ: