რისთვის გამოიყენება მონაცემთა ნაკადი?
რისთვის გამოიყენება მონაცემთა ნაკადი?

ვიდეო: რისთვის გამოიყენება მონაცემთა ნაკადი?

ვიდეო: რისთვის გამოიყენება მონაცემთა ნაკადი?
ვიდეო: What is Dataflow? 2024, მაისი
Anonim

Google Cloud Მონაცემთა ნაკადი არის ღრუბელზე დაფუძნებული მონაცემთა დამუშავების სერვისი, როგორც სერიული, ასევე რეალურ დროში მონაცემთა ნაკადის აპლიკაციებისთვის. ის საშუალებას აძლევს დეველოპერებს დააყენონ გადამამუშავებელი მილსადენები დიდი მონაცემთა ნაკრების ინტეგრაციისთვის, მომზადებისა და ანალიზისთვის, როგორიცაა ის, რაც გვხვდება ვებ ანალიტიკაში ან დიდი მონაცემთა ანალიტიკის აპლიკაციებში.

ამ გზით, რა არის პროგრამირების ჩარჩო, რომელიც გამოიყენება ღრუბლოვან მონაცემთა ნაკადთან?

Cloud Dataflow მხარს უჭერს მილსადენის სწრაფ, გამარტივებულ განვითარებას გამომხატველი Java და Python API-ების გამოყენებით Apache Beam SDK-ში.

ანალოგიურად, იყენებს თუ არა Google ნაპერწკალს? Google წინასწარ დაათვალიერა მისი Cloud Dataflow სერვისი, რომელიც არის გამოყენებული რეალურ დროში სერიული და ნაკადის დამუშავებისთვის და კონკურენციას უწევს ადგილობრივ კლასტერებს, რომლებიც მუშაობენ Apache-ზე ნაპერწკალი მეხსიერების სისტემამ, ჯერ კიდევ 2014 წლის ივნისში, 2015 წლის აპრილში ჩააყენა ბეტა ვერსიაში და 2015 წლის აგვისტოში გახდა ხელმისაწვდომი.

ამის გათვალისწინებით, რა არის ღრუბლოვანი მონაცემთა ნაკადის კონექტორის დანიშნულება?

The მონაცემთა ნაკადის კონექტორი ამისთვის ღრუბელი Spanner გაძლევთ საშუალებას წაიკითხოთ და ჩაწეროთ მონაცემები ღრუბელი ქანჩი ა Მონაცემთა ნაკადი მილსადენი, სურვილისამებრ გარდაქმნის ან ცვლის მონაცემებს. თქვენ ასევე შეგიძლიათ შექმნათ მილსადენები, რომლებიც გადასცემენ მონაცემებს შორის ღრუბელი Spanner და სხვა Google ღრუბელი პროდუქტები.

როგორ იყენებს Google MapReduce-ს?

Google MapReduce : Apache Hadoop ამის გადასაჭრელად, Google გამოიგონა მონაცემთა დამუშავების ახალი სტილი, რომელიც ცნობილია როგორც MapReduce ფართომასშტაბიანი მონაცემთა დამუშავების მართვა სასაქონლო სერვერების დიდ კლასტერებში. MapReduce არის პროგრამირების მოდელი და ასოცირებული იმპლემენტაცია დიდი მონაცემთა ნაკრების დამუშავებისა და გენერირებისთვის.

გირჩევთ: