AWS MapReduce nima?
AWS MapReduce nima?

Video: AWS MapReduce nima?

Video: AWS MapReduce nima?
Video: Big Data Technologies. Лекция 3. MapReduce 2024, Dekabr
Anonim

Amazon Elastik MapReduce (EMR) bu Amazon veb-xizmatlari ( AWS ) katta ma'lumotlarni qayta ishlash va tahlil qilish vositasi. Amazon EMR katta ma'lumotlarni Amazon Elastic Compute Cloud (EC2) va Amazon Simple Storage Service (S3) virtual serverlarining Hadoop klasterida qayta ishlaydi.

Shu tarzda, AWS EMR qanday ishlaydi?

Xizmat bitta asosiy va bir nechta boshqa tugunlardan tashkil topgan Amazon EC2 nusxalarining mijoz tomonidan belgilangan sonini ishga tushiradi. Amazon EMR bu misollarda Hadoop dasturini ishga tushiradi. Asosiy tugun kirish ma'lumotlarini bloklarga ajratadi va bloklarni qayta ishlashni boshqa tugunlarga taqsimlaydi.

Yuqoridagilardan tashqari, ec2 va EMR o'rtasidagi farq nima? Undan farqli o'laroq EMR , EC2 tobe tugunlarni asosiy va vazifa tugunlariga ajratmaydi. Bu tugun olib tashlangan/yo'qolgan taqdirda HDFS ma'lumotlarini yo'qotish xavfini oshiradi. EC2 s3-dagi ma'lumotlarga kirish uchun Apache kutubxonalaridan (s3a) foydalanadi. Boshqa tarafdan, EMR s3 ga tezroq kirish uchun AWS xususiy kodidan foydalanadi.

Bundan tashqari, AWS EMR to'liq boshqariladimi?

Amazon Elastic MapReduce ( EMR ) a to'liq boshqariladi Hadoop va Spark platformasidan Amazon veb-xizmati ( AWS ). Bilan EMR , AWS Mijozlar katta ma'lumotlar yuklarini qayta ishlash uchun ko'p tugunli Hadoop klasterlarini tezda aylantirishlari mumkin.

AWS Hadoop-dan foydalanadimi?

Amazon Veb-xizmatlar foydalanadi ochiq manbali Apache Hadoop ma'lumotlarni ko'p talab qiladigan vazifalarni bajarish uchun katta hajmdagi hisoblash quvvatiga kirishni osonlashtiradigan taqsimlangan hisoblash texnologiyasi. Hadoop , Google MapReduce’ning ochiq manbali versiyasi allaqachon Yahoo va Facebook kabi kompaniyalar tomonidan qo‘llanila boshlandi.

Tavsiya: