Hadoop-da ma'lumotlarni mahalliylashtirishga qanday erishiladi?
Hadoop-da ma'lumotlarni mahalliylashtirishga qanday erishiladi?

Video: Hadoop-da ma'lumotlarni mahalliylashtirishga qanday erishiladi?

Video: Hadoop-da ma'lumotlarni mahalliylashtirishga qanday erishiladi?
Video: Hadoop Processing Frameworks 2024, Noyabr
Anonim

Ma'lumotlarni mahalliylashtirish ichida Hadoop . Wordcount misolini oling, bu erda so'zlarning aksariyati 5 lak yoki undan ko'p marta takrorlangan. Bunday holda, Mapper bosqichidan so'ng, har bir mapper chiqishi 5 Lacs oralig'ida so'zlarga ega bo'ladi. Mapper chiqishini LFSga saqlashning ushbu to'liq jarayoni deyiladi Ma'lumotlarni mahalliylashtirish.

Buni hisobga olsak, Hadoop-da ma'lumotlarni mahalliylashtirish nima?

ning kontseptsiyasi Ma'lumotlar da joylashgan joy Hadoop ma'lumotlari da joylashgan joy MapReduce hisoblashni haqiqiy joyga yaqinlashtirish qobiliyatini bildiradi ma'lumotlar katta harakat qilish o'rniga, tugun ustida joylashgan ma'lumotlar hisoblash uchun. Bu tarmoqdagi tiqilib qolishni kamaytiradi va tizimning umumiy o'tkazuvchanligini oshiradi.

Bundan tashqari, katta ma'lumotlar qanday saqlanadi? Aksariyat odamlar avtomatik ravishda HDFS yoki Hadoop taqsimlangan fayl tizimini Hadoop bilan bog'laydi ma'lumotlar omborlar. HDFS ma'lumotlarni kichikroq bloklardan tashkil topgan klasterlarda saqlaydi. Bu bloklar saqlanadi joyida jismoniy saqlash birliklar, masalan, ichki disklar.

Shunday qilib, Hadoop-da ma'lumotlar qanday saqlanadi?

a kuni Hadoop klaster, ma'lumotlar HDFS ichida va MapReduce tizimi klasterdagi har bir mashinada joylashgan. Ma'lumotlar hisoblanadi saqlanadi ichida ma'lumotlar DataNodes-dagi bloklar. HDFS ularni takrorlaydi ma'lumotlar bloklar, odatda 128 MB hajmda va ularni klaster bo'ylab bir nechta tugunlarda takrorlanishi uchun tarqatadi.

HDFS da fayllar qanday saqlanadi?

HDFS fosh qiladi a fayl tizim nom maydoni va foydalanuvchi ma'lumotlari bo'lishiga imkon beradi saqlanadi ichida fayllar . Ichkarida, a fayl bir yoki bir nechta bloklarga bo'linadi va bu bloklar saqlanadi DataNodes to'plamida. NameNode ishlaydi fayl ochish, yopish va qayta nomlash kabi tizim nomlari maydoni operatsiyalari fayllar va kataloglar.

Tavsiya: