Mundarija:

Sqoop ish faoliyatini qanday yaxshilashim mumkin?
Sqoop ish faoliyatini qanday yaxshilashim mumkin?

Video: Sqoop ish faoliyatini qanday yaxshilashim mumkin?

Video: Sqoop ish faoliyatini qanday yaxshilashim mumkin?
Video: Hadoop Rack Awareness 2024, May
Anonim

Optimallashtirish uchun ishlash , oʻrnating the dan pastroq qiymatga xarita vazifalari soni the ulanishlarning maksimal soni the ma'lumotlar bazasini qo'llab-quvvatlaydi. Nazorat qilish the parallelizm miqdori Sqoop ma'lumotlarni uzatish uchun foydalanadi the nazorat qilishning asosiy usuli the yuklang sizning ma'lumotlar bazasi.

Shunga mos ravishda, agar jarayon o'rtasida sqoop bajarilmasa nima bo'ladi?

Oddiy Sqoop HDFS-ga manba ma'lumotlar bazasidan ma'lumotlarni qabul qiladigan ish ma'lumotlarni maqsadli katalogga ko'chiradi. Nusxalangan fayl o'chiriladi agar sqoop muvaffaqiyatsiz bo'lsa tugatmasdan.

Bundan tashqari, siz sqoopda parallellikka qanday erishasiz? Nazorat qilish Parallellik . Sqoop ko'pgina ma'lumotlar bazasi manbalaridan ma'lumotlarni parallel ravishda import qiladi. Importni amalga oshirish uchun foydalaniladigan xarita vazifalari (parallel jarayonlar) sonini -m yoki --num-mappers argumentidan foydalanib belgilashingiz mumkin. Ushbu argumentlarning har biri darajasiga mos keladigan butun sonni oladi parallelizm ishga berish

Shunday qilib, Hive so'rovlarimni qanday yaxshilashim mumkin?

Quyida biz Hive so'rovlarini optimallashtirish uchun amal qilishimiz mumkin bo'lgan amaliyotlar ro'yxati keltirilgan

  1. Hive-da siqishni yoqing.
  2. Qo'shilishlarni optimallashtirish.
  3. Hiveda global saralashdan saqlaning.
  4. Tez Execution Engine-ni yoqing.
  5. LIMIT operatorini optimallashtirish.
  6. Parallel bajarishni yoqing.
  7. Mapreduce qat'iy rejimini yoqing.
  8. Multi Group BY uchun yagona kamaytirish.

Sqoop split qanday ishlaydi?

U ko'proq parallellikka erishish orqali import ko'rsatkichlarini oshirish uchun ishlatilishi mumkin. Sqoop yaratadi bo'linadi -- tomonidan ko'rsatilgan jadvalning ma'lum bir ustunidagi qiymatlarga asoslangan Split -import buyrug'i orqali foydalanuvchi tomonidan. Agar u mavjud bo'lmasa, kiritish jadvalining asosiy kaliti yaratish uchun ishlatiladi bo'linadi.

Tavsiya: