Mundarija:

Hadoop-da tuzilmagan ma'lumotlarni qanday yuklaysiz?
Hadoop-da tuzilmagan ma'lumotlarni qanday yuklaysiz?

Video: Hadoop-da tuzilmagan ma'lumotlarni qanday yuklaysiz?

Video: Hadoop-da tuzilmagan ma'lumotlarni qanday yuklaysiz?
Video: BU NEXIA 2 3 HAQIDA MA'LUMOTLAR PRIKOLNA DA NEKSIYA 3...ЭТО ИНФОРМАЦИЯ О NEXIA 3 ПРИКОЛНА ДА... 2024, May
Anonim

Foydalanish holatlaringizga qarab, tuzilmagan ma'lumotlarni Hadoop-ga import qilishning bir necha yo'li mavjud

  1. Foydalanish HDFS tekis siljitish uchun put yoki copyFromLocal kabi qobiq buyruqlari fayllar ichiga HDFS .
  2. Ilova integratsiyasi uchun WebHDFS REST API dan foydalanish.
  3. Apache Flume-dan foydalanish.
  4. Storm, umumiy maqsadli, hodisalarni qayta ishlash tizimidan foydalanish.

Shu munosabat bilan, Hadoop-da tuzilmagan ma'lumotlar qanday saqlanadi?

Ma'lumotlar ichida HDFS hisoblanadi saqlanadi fayllar sifatida. Hadoop uchun sxema yoki tuzilishga ega bo'lishni majburlamaydi ma'lumotlar shunday bo'lishi kerak saqlanadi . Bu foydalanish imkonini beradi Hadoop har qanday tuzilish uchun tuzilmagan ma'lumotlar va keyin yarim tuzilgan yoki tuzilgan eksport ma'lumotlar keyingi tahlil qilish uchun an'anaviy ma'lumotlar bazalariga.

Bundan tashqari, tuzilmagan ma'lumotlarni qanday ishlatasiz? Quyida muvaffaqiyatli biznes korxonalari uchun tuzilmagan ma'lumotlarni tahlil qilishga yordam beradigan 10 ta qadam mavjud.

  1. Ma'lumot manbai haqida qaror qabul qiling.
  2. Tarkibi bo'lmagan ma'lumotlar qidirishingizni boshqaring.
  3. Foydasiz ma'lumotlarni yo'q qilish.
  4. Saqlash uchun ma'lumotlarni tayyorlang.
  5. Ma'lumotlar to'plami va saqlash texnologiyasi haqida qaror qabul qiling.
  6. Barcha ma'lumotlarni saqlangangacha saqlang.

Shu tarzda, biz Hive-da tuzilmagan ma'lumotlarni saqlashimiz mumkinmi?

Strukturasiz qayta ishlash Ma'lumotlar Foydalanish Uya Shunday ekan siz bor, Uya mumkin samarali qayta ishlash uchun foydalaniladi tuzilmagan ma'lumotlar . Keyinchalik murakkab qayta ishlash ehtiyojlari uchun siz o'rniga ba'zi maxsus UDF yozishga qaytishi mumkin. Past darajadagi Map Reduce kodini yozishdan ko'ra yuqori darajadagi abstraksiyadan foydalanishning ko'p afzalliklari bor.

Biz tuzilmagan ma'lumotlarni tuzilgan ma'lumotlarga aylantira olamizmi?

Ushbu bosqichda tuzilmagan ma'lumotlar ga aylantiriladi tuzilgan ma'lumotlar bu erda tasnifiga ko'ra topilgan so'z guruhlariga qiymat beriladi. Ijobiy so'z 1 ga, salbiy -1 ga va neytral 0 ga teng bo'lishi mumkin. Bu tuzilmagan ma'lumotlar bo'lishi mumkin sifatida saqlanadi va tahlil qilinadi siz bilan bo'lardi tuzilgan ma'lumotlar.

Tavsiya: