Pythonda Gensim nima?
Pythonda Gensim nima?

Video: Pythonda Gensim nima?

Video: Pythonda Gensim nima?
Video: «Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константиновский 2024, Noyabr
Anonim

Gensim zamonaviy statistik mashinalarni o'rganishdan foydalangan holda, nazoratsiz mavzularni modellashtirish va tabiiy tillarni qayta ishlash uchun ochiq manba kutubxonasidir. Gensim da amalga oshirilmoqda Python va Cython.

Buni hisobga olsak, Gensim Word2Vec nima?

1. Kirish Word2vec . Word2vec ikki qavatli neyron tarmog'i yordamida so'zlarni joylashtirishni o'rganishning eng mashhur usullaridan biridir. Uning kiritilishi matn korpusi va chiqishi vektorlar to'plamidir. Ikkita asosiy ta'lim algoritmlari mavjud word2vec , biri so'zlarning uzluksiz sumkasi (CBOW), ikkinchisi skip-gram deb ataladi.

Bundan tashqari, Gensim xulosasi qanday ishlaydi? Qo'llanma: avtomatik umumlashtirish foydalanish Gensim . Ushbu modul matndan bir yoki bir nechta muhim jumlalarni chiqarib, berilgan matnni avtomatik ravishda umumlashtiradi. Xuddi shunday, u mumkin shuningdek, kalit so'zlarni ajratib oling.

Keyinchalik, Gensim-ni Python-ga qanday import qilishim mumkin?

5 ta javob. Avval NumPy, keyin SciPy va keyin o'rnatishingiz kerak Gensim (allaqachon bor deb hisoblasangiz Python o'rnatilgan). foydalandim Python 3.4, chunki men 3.4 versiyasidan foydalangan holda SciPy-ni o'rnatishni osonlashtiraman. QAYD: Pip sizning muhit o'zgaruvchilaringizda ekanligiga ishonch hosil qiling (muhit o'zgaruvchingizga C: python34scripts qo'shing).

Gensim korpusi nima?

Ishlash uchun siz tanishishingiz kerak bo'lgan keyingi muhim ob'ekt gensim bo'ladi Korpus (So'zlar sumkasi). Ya'ni, bu a korpus Har bir hujjatda id so'zini va uning chastotasini o'z ichiga olgan ob'ekt. Siz buni deb o'ylashingiz mumkin gensim Hujjat-Term matritsasi ekvivalenti.

Tavsiya: