Mundarija:

Python-ni Hadoop-da ishga tushira olamanmi?
Python-ni Hadoop-da ishga tushira olamanmi?

Video: Python-ni Hadoop-da ishga tushira olamanmi?

Video: Python-ni Hadoop-da ishga tushira olamanmi?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, May
Anonim

Java, Scala va kabi dasturlash tillari o'rtasida tanlov bilan Python uchun Hadoop ekotizim, ko'pchilik ishlab chiquvchilar foydalanadi Python ma'lumotlar tahlili vazifalari uchun kutubxonalarni qo'llab-quvvatlaganligi sababli. Hadoop oqim foydalanuvchiga yaratish va bajarmoq Xaritachi va/va reduktor sifatida istalgan skript yoki bajariladigan vazifalarni xaritalash/kamaytirish.

Xuddi shunday, Python Hadoop-ga qanday ulanadi?

Hadoop HDFSni Python bilan ulash

  1. 1-qadam: Hadoop HDFS to'g'ri ishlayotganiga ishonch hosil qiling. Terminal/Buyruq satrini oching, HDFS ishlayotganligini quyidagi buyruqlar yordamida tekshiring: start-dfs.sh.
  2. 2-qadam: libhdfs3 kutubxonasini o'rnating.
  3. 3-qadam: hdfs3 kutubxonasini o'rnating.
  4. 4-qadam: HDFS bilan ulanish muvaffaqiyatli yoki yo'qligini tekshiring.

Xuddi shunday, Pythonda Hadoop nima? Python Bu dasturlash dunyosida deyarli hamma narsani qilish uchun ishlatilishi mumkin bo'lgan umumiy maqsadli turing. Hadoop katta hajmdagi ma'lumotlar bilan ishlash uchun Java-da yozilgan katta ma'lumotlar bazasi. Ko'plab onlayn institutlar mavjud Hadoop bilan Python kabi kurslar: Analytixlabs. Edureka.

Keyinchalik savol tug'iladi: Hadoop-da Python MapReduce dasturini qanday ishga tushirishim mumkin?

Pythonda Hadoop MapReduce dasturini yozish

  1. Motivatsiya.
  2. Biz nima qilishni xohlaymiz.
  3. Old shartlar.
  4. Python MapReduce kodi. Xarita bosqichi: mapper.py. Qadamni qisqartirish: reduktor.py.
  5. Hadoop-da Python kodini ishga tushirish. Misol kiritish ma'lumotlarini yuklab oling. Mahalliy misol ma'lumotlarini HDFSga nusxalash.
  6. Yaxshilangan Mapper va Reducer kodi: Python iteratorlari va generatorlaridan foydalanish. mapper.py. reduktor.py.

Hadoop Streaming jar nima?

Hadoop tarqatish deb nomlangan Java yordam dasturini taqdim etadi Hadoop oqimi . U qadoqlangan banka fayl. Bilan Hadoop oqimi , biz bajariladigan skript yordamida Map Reduce ishlarini yaratishimiz va ishga tushirishimiz mumkin. Hadoop oqimi bilan birga keladigan yordamchi dastur hisoblanadi Hadoop tarqatish. U katta ma'lumotlarni tahlil qilish uchun dasturlarni bajarish uchun ishlatilishi mumkin.

Tavsiya: