რა არის Gensim პითონში?
რა არის Gensim პითონში?

ვიდეო: რა არის Gensim პითონში?

ვიდეო: რა არის Gensim პითონში?
ვიდეო: Gensim in Python Explained for Beginners | Learn Machine Learning 2024, ნოემბერი
Anonim

გენსიმ არის ღია წყაროს ბიბლიოთეკა თემების უკონტროლო მოდელირებისთვის და ბუნებრივი ენის დამუშავებისთვის, თანამედროვე სტატისტიკური მანქანათმცოდნეობის გამოყენებით. გენსიმ ხორციელდება ქ პითონი და Cython.

ამის გათვალისწინებით, რა არის Gensim Word2Vec?

1. შესავალი Word2vec . Word2vec არის ერთ-ერთი ყველაზე პოპულარული ტექნიკა სიტყვების ჩაშენების შესასწავლად ორი ფენის ნერვული ქსელის გამოყენებით. მისი შეყვანა არის ტექსტის კორპუსი და მისი გამომავალი არის ვექტორების ნაკრები. არსებობს ტრენინგის ორი ძირითადი ალგორითმი word2vec , ერთი არის სიტყვების უწყვეტი ტომარა (CBOW), მეორეს ეწოდება skip-gram.

გარდა ამისა, როგორ მუშაობს Gensim-ის შეჯამება? სახელმძღვანელო: ავტომატური შეჯამება გამოყენებით გენსიმ . ეს მოდული ავტომატურად აჯამებს მოცემულ ტექსტს, ტექსტიდან ერთი ან რამდენიმე მნიშვნელოვანი წინადადების ამოღებით. ანალოგიურად, ის შეუძლია ასევე ამოიღეთ საკვანძო სიტყვები.

შემდგომში შეიძლება ასევე იკითხოთ, როგორ შემოვიტანო Gensim პითონში?

5 პასუხი. ჯერ უნდა დააინსტალიროთ NumPy, შემდეგ SciPy და შემდეგ გენსიმ (ვივარაუდოთ, რომ უკვე გაქვთ პითონი დაინსტალირებული). მე გამოვიყენე პითონი 3.4, რადგან მე უფრო ადვილია SciPy-ის დაყენება 3.4 ვერსიის გამოყენებით. შენიშვნები: დარწმუნდით, რომ pip არის თქვენი გარემოს ცვლადებში (დაამატეთ C:python34scripts თქვენს გარემოს ცვლადში).

რა არის გენსიმის კორპუსი?

შემდეგი მნიშვნელოვანი ობიექტი, რომელსაც უნდა გაეცნოთ სამუშაოდ გენსიმ არის კორპუსი (სიტყვების ტომარა). ანუ ეს არის ა კორპუსი ობიექტი, რომელიც შეიცავს სიტყვა id-ს და მის სიხშირეს თითოეულ დოკუმენტში. შეგიძლიათ იფიქროთ როგორც გენსიმის დოკუმენტი-ტერმინი მატრიცის ეკვივალენტი.

გირჩევთ: