R Hadoop nima?
R Hadoop nima?

Video: R Hadoop nima?

Video: R Hadoop nima?
Video: Big Data Technologies. Лекция 4. Hadoop-программы 2024, Noyabr
Anonim

Hadoop taqsimlangan hisoblash muhitida katta ma'lumotlar to'plamlarini qayta ishlashni qo'llab-quvvatlaydigan Java-ga asoslangan buzg'unchi dasturlash tizimidir. R statistik hisoblash va grafika uchun dasturlash tili va dasturiy muhitdir.

Bundan tashqari, R yoki Pythonni o'rganishim kerakmi?

R esa, asosan, statistik tahlil uchun ishlatiladi Python ma'lumotlar faniga umumiy yondashuvni ta'minlaydi. R va Python ma'lumotlar faniga yo'naltirilgan dasturlash tili nuqtai nazaridan eng zamonaviy hisoblanadi. O'rganish ularning ikkalasi ham, albatta, ideal yechimdir. Python o'qilishi mumkin bo'lgan sintaksisga ega umumiy maqsadli til.

Bundan tashqari, uchqun Hadoopdan qanday farq qiladi? Hadoop yuqori kechikishli hisoblash tizimi bo'lib, interaktiv rejimga ega emas Uchqun kechikish vaqtini hisoblashga ruxsat bermaydi va ma'lumotlarni interaktiv tarzda qayta ishlay oladi. Bilan Hadoop MapReduce, ishlab chiquvchi faqat ommaviy rejimda ma'lumotlarni qayta ishlashi mumkin, holbuki Uchqun orqali real vaqtda ma'lumotlarni qayta ishlash mumkin Uchqun Striming.

Buni hisobga olsak, Rhadoop nima?

Rhadoop Hadoop foydalanuvchilariga ma'lumotlarni boshqarish va tahlil qilish imkonini beruvchi 5 xil paketlar to'plamidir R dasturlash tili. rhdfs -rhdfs to'plami taqdim etadi R Hadoop tarqatilgan fayl tizimlariga ulanishi bo'lgan dasturchilar HadoopHDFS-da saqlangan ma'lumotlarni o'qiydilar, yozadilar yoki o'zgartiradilar.

Hadoop taqsimoti nimani anglatadi?

The Hadoop tarqatildi Fayl tizimi (HDFS) hisoblanadi tomonidan ishlatiladigan asosiy ma'lumotlarni saqlash tizimi Hadoop ilovalar. Unda NameNode va DataNode arxitekturasidan foydalaniladi tarqatilgan yuqori darajada kengaytiriladigan ma'lumotlarga yuqori unumdorlikni ta'minlaydigan fayl tizimi Hadoop klasterlar.

Tavsiya: