Სარჩევი:

როგორ გავაუმჯობესო ჩემი sqoop შესრულება?
როგორ გავაუმჯობესო ჩემი sqoop შესრულება?

ვიდეო: როგორ გავაუმჯობესო ჩემი sqoop შესრულება?

ვიდეო: როგორ გავაუმჯობესო ჩემი sqoop შესრულება?
ვიდეო: Apache Sqoop Tutorial | Sqoop: Import & Export Data From MySQL To HDFS | Hadoop Training | Edureka 2024, ნოემბერი
Anonim

ოპტიმიზაციისთვის შესრულება , კომპლექტი The რუკის ამოცანების რაოდენობა ნაკლები მნიშვნელობით The კავშირების მაქსიმალური რაოდენობა The მონაცემთა ბაზის მხარდაჭერა. მაკონტროლებელი The პარალელურობის ოდენობა რომ სკუპი გამოიყენებს მონაცემთა გადასაცემად არის The კონტროლის მთავარი გზა The ჩატვირთვა შენი მონაცემთა ბაზა.

შესაბამისად, რა მოხდება, თუ sqoop ჩავარდება პროცესს შორის?

ტიპიური სკუპი სამუშაო, რომელიც იღებს მონაცემებს წყაროს მონაცემთა ბაზიდან HDFS-ში, დააკოპირებს მონაცემებს სამიზნე დირექტორიაში. კოპირებული ფაილი წაიშლება თუ sqoop ვერ მოხერხდა დასრულების გარეშე.

შეიძლება ასევე იკითხოს, როგორ მიაღწევთ პარალელიზმს sqoop-ში? მაკონტროლებელი პარალელიზმი . სკუპი მონაცემთა იმპორტი პარალელურად ხდება მონაცემთა ბაზის წყაროებიდან. თქვენ შეგიძლიათ მიუთითოთ რუკის ამოცანების რაოდენობა (პარალელური პროცესები), რომლებიც გამოიყენებთ იმპორტის შესასრულებლად -m ან --num-mappers არგუმენტის გამოყენებით. თითოეული ეს არგუმენტი იღებს მთელ რიცხვს, რომელიც შეესაბამება ხარისხს პარალელიზმი დასაქმება

შესაბამისად, როგორ გავაუმჯობესო ჩემი Hive შეკითხვის შესრულება?

ქვემოთ მოცემულია პრაქტიკების სია, რომლებსაც შეგვიძლია მივყვეთ Hive Queries-ის ოპტიმიზაციისთვის

  1. ჩართეთ შეკუმშვა Hive-ში.
  2. შეერთების ოპტიმიზაცია.
  3. მოერიდეთ გლობალურ დახარისხებას Hive-ში.
  4. ჩართეთ Tez Execution Engine.
  5. LIMIT ოპერატორის ოპტიმიზაცია.
  6. პარალელური შესრულების ჩართვა.
  7. ჩართეთ Mapreduce მკაცრი რეჟიმი.
  8. ერთჯერადი შემცირება Multi Group BY-სთვის.

როგორ მუშაობს sqoop split?

ის შეიძლება გამოყენებულ იქნას იმპორტის მუშაობის გასაუმჯობესებლად უფრო დიდი პარალელურობის მიღწევით. სკუპი ქმნის ყოფს ცხრილის კონკრეტულ სვეტში მოცემულ მნიშვნელობებზე დაყრდნობით, რომელიც მითითებულია - გაყოფა - მომხმარებლის მიერ იმპორტის ბრძანების საშუალებით. თუ ის არ არის ხელმისაწვდომი, შეყვანის ცხრილის პირველადი გასაღები გამოიყენება მის შესაქმნელად ყოფს.

გირჩევთ: