რა არის მონაცემთა ტბა ჰადოპში?
რა არის მონაცემთა ტბა ჰადოპში?

ვიდეო: რა არის მონაცემთა ტბა ჰადოპში?

ვიდეო: რა არის მონაცემთა ტბა ჰადოპში?
ვიდეო: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, ნოემბერი
Anonim

ა ჰადოპ მონაცემთა ტბა არის მონაცემები მართვის პლატფორმა, რომელიც მოიცავს ერთ ან მეტს ჰადოპ მტევანი. იგი ძირითადად გამოიყენება არარელატიური დამუშავებისა და შესანახად მონაცემები , როგორიცაა ჟურნალის ფაილები, ინტერნეტის დაწკაპუნების ჩანაწერები, სენსორი მონაცემები , JSON ობიექტები, სურათები და სოციალური მედიის პოსტები.

ამ მხრივ, რა განსხვავებაა მონაცემთა საწყობსა და მონაცემთა ტბას შორის?

დათა ტბები და მონაცემები საწყობები ორივე ფართოდ გამოიყენება დიდი შესანახად მონაცემები , მაგრამ ისინი არ არიან ურთიერთშემცვლელი ტერმინები. ა მონაცემთა ტბა არის ნედლეულის უზარმაზარი აუზი მონაცემები , რომლის მიზანი ჯერ არ არის განსაზღვრული. ა მონაცემთა საწყობი არის სტრუქტურირებული, გაფილტრული საცავი მონაცემები რომელიც უკვე დამუშავებულია კონკრეტული მიზნით.

გარდა ამისა, რა არის მონაცემთა ტბის არქიტექტურა? ა დათა ტბა არის შენახვის საცავი, რომელსაც შეუძლია შეინახოს დიდი რაოდენობით სტრუქტურირებული, ნახევრად სტრუქტურირებული და არასტრუქტურირებული მონაცემები . იერარქიული Dataware სახლისგან განსხვავებით, სადაც მონაცემები ინახება ფაილებსა და საქაღალდეში, დათა ტბა აქვს ბინა არქიტექტურა.

ამასთან დაკავშირებით რა იგულისხმება მონაცემთა ტბაში?

ა მონაცემთა ტბა არის შესანახი საცავი, რომელიც ინახავს ნედლეულის დიდ რაოდენობას მონაცემები მის მშობლიურ ფორმატში, სანამ საჭირო იქნება. ხოლო იერარქიული მონაცემები სასაწყობო მაღაზიები მონაცემები ფაილებში ან საქაღალდეებში, ა მონაცემთა ტბა შესანახად იყენებს ბრტყელ არქიტექტურას მონაცემები . Ტერმინი მონაცემთა ტბა ხშირად ასოცირდება Hadoop-ზე ორიენტირებულ ობიექტების შენახვასთან.

არის თუ არა Elasticsearch მონაცემთა ტბა?

ა მონაცემთა ტბა უბრალოდ ადგილია თქვენი პარკინგისთვის მონაცემები სანამ არ დაგჭირდებათ და შეიძლება მოიცავდეს HDFS (ყველაზე გავრცელებული), ობიექტების საცავს, NAS ყუთებს ან სხვა რამეს. ფუნდამენტურად, Elasticsearch არის ინდექსირების ინსტრუმენტი მონაცემები , არა შესანახად მონაცემები თავად.

გირჩევთ: