სჭირდება თუ არა პრესტოს ჭინჭრის ციება?
სჭირდება თუ არა პრესტოს ჭინჭრის ციება?

ვიდეო: სჭირდება თუ არა პრესტოს ჭინჭრის ციება?

ვიდეო: სჭირდება თუ არა პრესტოს ჭინჭრის ციება?
ვიდეო: 1: What is Presto, WITH RECURSIVE, and Hive connector 2024, ნოემბერი
Anonim

მხარდაჭერილია შემდეგი ფაილის ფორმატები: ტექსტი, SequenceFile, RCFile, ORC და პარკეტი. გარდა ამისა, დისტანციური Hive მეტასტატორი არის საჭირო . ადგილობრივი ან ჩაშენებული რეჟიმი არ არის მხარდაჭერილი. პრესტო აკეთებს არ გამოიყენოთ MapReduce და ამით საჭიროა მხოლოდ HDFS.

ამ გზით, რა არის Presto და hive?

აპაჩი Hive : მონაცემთა საწყობის პროგრამული უზრუნველყოფა კითხვის, წერისა და დიდი მონაცემთა ნაკრების მართვისთვის. პრესტო არის ღია კოდის განაწილებული SQL შეკითხვის ძრავა ინტერაქტიული ანალიტიკური მოთხოვნების გასაშვებად ყველა ზომის მონაცემთა წყაროების წინააღმდეგ, გიგაბაიტიდან პეტაბაიტამდე. აპაჩი Hive და პრესტო შეიძლება დაიყოს "დიდი მონაცემების" ინსტრუმენტებად.

ანალოგიურად, იყენებს თუ არა პრესტო MapReduce-ს? პრესტო არის ღია კოდის პარალელური SQL შესრულების ძრავა. ჰივისგან განსხვავებით, პრესტო არა გამოყენება The რუკის შემცირება ჩარჩო მისი შესრულებისთვის. სამაგიეროდ, პრესტო უშუალოდ წვდება მონაცემებს სპეციალიზებული განაწილებული შეკითხვის ძრავის საშუალებით, რომელიც ძალიან ჰგავს კომერციულ პარალელურ RDBMS-ებში არსებულ მონაცემებს.

ამის გათვალისწინებით, ათენა ეფუძნება პრესტოს?

ტექნოლოგია არის დაფუძნებული ღია კოდის Facebook-ზე პრესტო ან PrestoDB პროგრამული უზრუნველყოფა. ამ წარმომავლობის გათვალისწინებით, ათენა სთავაზობს გუნდებს სერვერის გარეშე SQL შეკითხვის ძრავას ETL ან ELT პროცესისთვის AWS S3 მონაცემთა ტბაზე.

არის პრესტო მეხსიერებაში?

პრესტო (ან PrestoDB) არის ღია კოდის, განაწილებული SQL შეკითხვის ძრავა, შექმნილია თავიდანვე სწრაფი ანალიტიკური მოთხოვნებისთვის ნებისმიერი ზომის მონაცემების წინააღმდეგ. შეკითხვის შესრულება პარალელურად მიმდინარეობს სუფთაზე მეხსიერება -დაფუძნებული არქიტექტურა, შედეგების უმეტესობა წამებში ბრუნდება.

გირჩევთ: