რა არის AWS MapReduce?
რა არის AWS MapReduce?

ვიდეო: რა არის AWS MapReduce?

ვიდეო: რა არის AWS MapReduce?
ვიდეო: Introduction to Amazon Elastic MapReduce 2024, მაისი
Anonim

Amazon Elastic MapReduce (EMR) არის ამაზონის ვებ სერვისები ( AWS ) ინსტრუმენტი დიდი მონაცემების დამუშავებისა და ანალიზისთვის. Amazon EMR ამუშავებს დიდ მონაცემებს ვირტუალური სერვერების Hadoop კლასტერში Amazon Elastic Compute Cloud (EC2) და Amazon Simple Storage Service (S3).

ამ გზით, როგორ მუშაობს AWS EMR?

სერვისი იწყებს მომხმარებლის მიერ მითითებულ რაოდენობას Amazon EC2 ინსტანციებისგან, რომელიც შედგება ერთი ძირითადი და მრავალი სხვა კვანძისგან. ამაზონი EMR ამ შემთხვევებზე მუშაობს Hadoop პროგრამული უზრუნველყოფა. ძირითადი კვანძი ყოფს შეყვანის მონაცემებს ბლოკებად და ანაწილებს ბლოკების დამუშავებას სხვა კვანძებზე.

ზემოაღნიშნულის გარდა, რა განსხვავებაა ec2-სა და EMR-ს შორის? განსხვავებით EMR , EC2 არ ანაწილებს სლავურ კვანძებს ძირითად და ამოცანების კვანძებად. ეს ზრდის HDFS მონაცემების დაკარგვის რისკს კვანძის წაშლის/დაკარგვის შემთხვევაში. EC2 იყენებს Apache ბიბლიოთეკებს (s3a) s3-ზე მონაცემებზე წვდომისთვის. Მეორეს მხრივ, EMR იყენებს AWS საკუთრების კოდს s3-ზე უფრო სწრაფი წვდომისთვის.

გარდა ამისა, სრულად იმართება AWS EMR?

ამაზონი ელასტიური რუქის შემცირება ( EMR ) არის სრულად მართავს Hadoop და Spark პლატფორმა-დან ამაზონი ვებ სერვისი ( AWS ). თან EMR , AWS მომხმარებლებს შეუძლიათ სწრაფად დაატრიალონ Hadoop კლასტერები, რათა დაამუშავონ დიდი მონაცემების დატვირთვა.

იყენებს თუ არა AWS Hadoop-ს?

ამაზონი ვებ სერვისები იყენებს ღია კოდის Apache ჰადოპ განაწილებული გამოთვლითი ტექნოლოგია, რათა გაადვილდეს დიდი რაოდენობით გამოთვლითი სიმძლავრის წვდომა მონაცემთა ინტენსიური ამოცანების შესასრულებლად. ჰადოპ Google-ის MapReduce-ის ღია კოდის ვერსიას უკვე იყენებენ ისეთი კომპანიები, როგორიცაა Yahoo და Facebook.

გირჩევთ: