რა არის გასაღებით შემცირება?
რა არის გასაღებით შემცირება?

ვიდეო: რა არის გასაღებით შემცირება?

ვიდეო: რა არის გასაღებით შემცირება?
ვიდეო: რა არის გლუტამინი? გლუტამინის ბენეფიტები და ის რაც არ იცის ფიტნესში მყოფმა 90% ადამიანმა! განხილვა 2024, მაისი
Anonim

Spark RDD reduceByKey ფუნქცია აერთიანებს მნიშვნელობებს თითოეულისთვის გასაღები ასოციაციური გამოყენებით შემცირება ფუნქცია. ეს ინტუიციურად ნიშნავს, რომ ეს ფუნქცია აწარმოებს იგივე შედეგს, როდესაც განმეორებით გამოიყენება RDD მონაცემების ერთსა და იმავე კომპლექტზე, მრავალი დანაყოფით, ელემენტის რიგის მიუხედავად.

მაშინ, რა განსხვავებაა groupByKey-სა და reduceByKey-ს შორის?

groupByKey () არის მხოლოდ თქვენი მონაცემთა დაჯგუფება გასაღების საფუძველზე. reduceByKey () არის რაღაც დაჯგუფება + აგრეგაცია. reduceByKey შეიძლება გამოყენებულ იქნას, როდესაც ვმუშაობთ მონაცემთა დიდ ნაკრებზე. aggregateByKey() ლოგიკურად იგივეა რაც reduceByKey () მაგრამ ეს საშუალებას გაძლევთ დააბრუნოთ შედეგი განსხვავებული ტიპი.

ასევე იცოდეთ, რატომ არის მოქმედების შემცირება ნაპერწკალში? ნაპერწკლის შემცირება ოპერაცია არის მოქმედება სახის ოპერაცია და ის იწვევს DAG-ის სრულ შესრულებას ყველა ზარმაცი ინსტრუქციისთვის. ნაპერწკალი RDD შემცირება ფუნქცია ამცირებს ამ RDD-ის ელემენტებს მითითებული კომუტაციური და ასოციაციური ორობითი ოპერატორის გამოყენებით. ნაპერწკლის შემცირება ოპერაცია თითქმის მსგავსია შემცირება მეთოდი სკალაში.

გარდა ზემოთ, რა არის Pairrdd?

Spark უზრუნველყოფს სპეციალურ ოპერაციებს RDD-ებზე, რომლებიც შეიცავს გასაღების/მნიშვნელობის წყვილებს. ამ RDD-ებს ეწოდება წყვილი RDD. წყვილი RDD არის სასარგებლო სამშენებლო ბლოკი ბევრ პროგრამაში, რადგან ისინი ავლენენ ოპერაციებს, რომლებიც საშუალებას გაძლევთ იმოქმედოთ თითოეულ კლავიშზე პარალელურად ან გადააჯგუფოთ მონაცემები ქსელში. PairRDD-ები არის KEY/VALUE წყვილი.

არის redByKey მოქმედება?

Reduce() გამოაქვს კოლექცია, რომელიც არ ემატება მიმართულ აციკლურ გრაფიკს (DAG), ასე რომ დანერგილია როგორც მოქმედება . თუმცა, reduceByKey () აბრუნებს RDD-ს, რომელიც არის მხოლოდ სხვა დონე/მდგომარეობა DAG-ში, შესაბამისად არის ტრანსფორმაცია.

გირჩევთ: