Სარჩევი:

როგორ იყენებთ დირიხლეს ლატენტურ გამოყოფას?
როგორ იყენებთ დირიხლეს ლატენტურ გამოყოფას?

ვიდეო: როგორ იყენებთ დირიხლეს ლატენტურ გამოყოფას?

ვიდეო: როგორ იყენებთ დირიხლეს ლატენტურ გამოყოფას?
ვიდეო: Latent Dirichlet Allocation (Part 1 of 2) 2024, მაისი
Anonim

რა არის LDA?

  1. შეარჩიეთ ნაწილების თქვენი უნიკალური ნაკრები.
  2. შეარჩიეთ რამდენი კომპოზიცია გსურთ.
  3. შეარჩიეთ რამდენი ნაწილი გსურთ თითო კომპოზიტზე (ნიმუში პუასონიდან განაწილება ).
  4. აირჩიეთ რამდენი თემა (კატეგორიები) გსურთ.
  5. შეარჩიეთ რიცხვი არა-ნულოვანსა და დადებით უსასრულობას შორის და უწოდეთ მას ალფა.

ანალოგიურად, შეიძლება იკითხოთ, არის თუ არა ლატენტური დირიხლეტის განაწილება მანქანათმცოდნეობა?

ლატენტური დირიხლეს განაწილება ( LDA ) არის კორპუსის გენერაციული ალბათური მოდელი. ძირითადი იდეა ისაა, რომ დოკუმენტები წარმოდგენილია შემთხვევითი ნარევების სახით ლატენტური თემები, სადაც თითოეული თემა ხასიათდება სიტყვების განაწილებით.

ანალოგიურად, როგორ მუშაობს LDA თემის მოდელირება? LDA ვარაუდობს, რომ დოკუმენტები მზადდება თემების ნაზავიდან. შემდეგ ეს თემები წარმოქმნიან სიტყვებს მათი ალბათობის განაწილების საფუძველზე. დოკუმენტების ნაკრების გათვალისწინებით, LDA უკან იხევს და ცდილობს გაარკვიოს რა თემები იქნებოდა შექმენით ეს დოკუმენტები პირველ რიგში. LDA არის მატრიცული ფაქტორიზაციის ტექნიკა.

ამასთან დაკავშირებით, როგორ წარმოთქვამთ ლატენტურ დირიხლეს განაწილებას?

"ჩ" შეიძლება გამოითქვას როგორც "შ" ბგერა, ან მძიმე "კ" ბგერა. და დასასრული "et" შეიძლება გამოითვალოს ფრანგულად, როგორც "lay" ან როგორც "let" მძიმე "t" ხმით. დირიხლეს ლატენტური განაწილება პირველად იყო ახსნილი 2003 წლის კვლევით ნაშრომში, მაგრამ როგორც ტექნიკის უმეტესობა, ძირითადი იდეები ადრე გამოქვეყნდა.

ლატენტური დირიხლეს განაწილება ზედამხედველობის ქვეშ ხდება თუ ზედამხედველობის გარეშე?

სწორედ რომ LDA არის ზედამხედველობის გარეშე მეთოდი. თუმცა, ის შეიძლება გაფართოვდეს ა მეთვალყურეობდა ერთი.

გირჩევთ: