Სარჩევი:

შემიძლია Python-ის გაშვება Hadoop-ზე?
შემიძლია Python-ის გაშვება Hadoop-ზე?

ვიდეო: შემიძლია Python-ის გაშვება Hadoop-ზე?

ვიდეო: შემიძლია Python-ის გაშვება Hadoop-ზე?
ვიდეო: MapReduce Jobs For Distributed Hadoop Clusters in Python 2024, მაისი
Anonim

არჩევანი პროგრამირების ენებს შორის, როგორიცაა Java, Scala და პითონი ამისთვის ჰადოპ დეველოპერების უმეტესობა იყენებს ეკოსისტემას პითონი მისი დამხმარე ბიბლიოთეკების გამო მონაცემთა ანალიტიკის ამოცანებისთვის. ჰადოპ ნაკადი საშუალებას აძლევს მომხმარებელს შექმნას და შეასრულოს რუკა/შეამცირეთ სამუშაოები ნებისმიერი სკრიპტით ან შესრულებადი, როგორც რუქის ან/და რედუქტორი.

ანალოგიურად, ისმება კითხვა, როგორ უკავშირდება Python Hadoop-ს?

Hadoop HDFS-ის დაკავშირება პითონთან

  1. ნაბიჯი 1: დარწმუნდით, რომ Hadoop HDFS სწორად მუშაობს. გახსენით Terminal/Command Prompt, შეამოწმეთ მუშაობს თუ არა HDFS შემდეგი ბრძანებების გამოყენებით: start-dfs.sh.
  2. ნაბიჯი 2: დააინსტალირეთ libhdfs3 ბიბლიოთეკა.
  3. ნაბიჯი 3: დააინსტალირეთ hdfs3 ბიბლიოთეკა.
  4. ნაბიჯი 4: შეამოწმეთ თუ კავშირი HDFS-თან წარმატებულია.

ანალოგიურად, რა არის Hadoop პითონში? პითონი არის ზოგადი დანიშნულების სრული პროგრამირების ენა, რომელიც შეიძლება გამოყენებულ იქნას პროგრამირების სამყაროში თითქმის ყველაფრის გასაკეთებლად. ჰადოპ არის დიდი მონაცემთა ჩარჩო დაწერილი ჯავაში, რათა გაუმკლავდეს მონაცემთა უზარმაზარ მოცულობას. არსებობს უამრავი ონლაინ ინსტიტუტი, რომელიც ჰადოპ თან პითონი კურსები, როგორიცაა: Analytixlabs. ედურეკა.

შემდგომში ჩნდება კითხვა, როგორ გავუშვათ Python MapReduce პროგრამა Hadoop-ში?

Hadoop MapReduce პროგრამის დაწერა პითონში

  1. Მოტივაცია.
  2. რისი გაკეთებაც გვინდა.
  3. წინაპირობები.
  4. Python MapReduce Code. რუკის ნაბიჯი: mapper.py. შემცირების ნაბიჯი: reducer.py.
  5. პითონის კოდის გაშვება Hadoop-ზე. ჩამოტვირთეთ შეყვანის მონაცემების მაგალითი. დააკოპირეთ ადგილობრივი მაგალითის მონაცემები HDFS-ში.
  6. გაუმჯობესებული Mapper და Reducer კოდი: Python iterators და გენერატორების გამოყენებით. mapper.py. რედუქტორი.py.

რა არის Hadoop Streaming jar?

ჰადოპ განაწილება უზრუნველყოფს Java პროგრამას, რომელსაც ე.წ Hadoop Streaming . ის შეფუთულია ა ქილა ფაილი. თან Hadoop Streaming , ჩვენ შეგვიძლია შევქმნათ და გავუშვათ Map Reduce სამუშაოები შესრულებადი სკრიპტით. Hadoop Streaming არის უტილიტა, რომელიც მოყვება ჰადოპ განაწილება. ის შეიძლება გამოყენებულ იქნას დიდი მონაცემების ანალიზისთვის პროგრამების შესასრულებლად.

გირჩევთ: