Spark translyatsiyasi nima?
Spark translyatsiyasi nima?

Video: Spark translyatsiyasi nima?

Video: Spark translyatsiyasi nima?
Video: SPARK TANLASHDA 5TA XATO ! 2024, Noyabr
Anonim

Translyatsiya Apache'dagi o'zgaruvchilar Uchqun faqat o'qish uchun mo'ljallangan ijrochilar bo'ylab o'zgaruvchilarni almashish mexanizmidir. holda efirga uzatish o'zgaruvchilar, bu o'zgaruvchilar har bir transformatsiya va harakat uchun har bir ijrochiga yuboriladi va bu tarmoq yukiga olib kelishi mumkin.

Xuddi shunday, odamlar so'rashadi, men qachon uchqunni efirga uzatishim kerak?

Translyatsiya o'zgaruvchilar, asosan, bir nechta bosqichlardagi vazifalar bir xil ma'lumotlarni talab qilganda yoki ma'lumotlarni seriyadan chiqarilgan shaklda keshlash zarur bo'lganda ishlatiladi. Translyatsiya o'zgaruvchilar SparkContext chaqiruvi orqali v o'zgaruvchisi yordamida yaratiladi.

Bundan tashqari, uchqundagi akkumulyatorlar va translyatsiya o'zgaruvchilari nima? Uchqun ikki turdagi umumiy foydalanishni qo'llab-quvvatlaydi o'zgaruvchilar : translyatsiya o'zgaruvchilari , bu barcha tugunlarda xotiradagi qiymatni keshlash uchun ishlatilishi mumkin va akkumulyatorlar , qaysiki o'zgaruvchilar hisoblagichlar va summalar kabi faqat "qo'shiladi".

Buni hisobga olsak, uchqun akkumulyatori nima?

Akkumulyatorlar ular faqat assotsiativ operatsiya orqali "qo'shiladigan" o'zgaruvchilardir va shuning uchun parallel ravishda samarali qo'llab-quvvatlanishi mumkin. Ular hisoblagichlarni (MapReduce-dagi kabi) yoki summalarni amalga oshirish uchun ishlatilishi mumkin. Uchqun tabiiy ravishda qo'llab-quvvatlaydi akkumulyatorlar Raqamli turdagi va dasturchilar yangi turlarni qo'llab-quvvatlashi mumkin.

Sparkdagi translyatsiya o'zgaruvchini qanday yangilashim mumkin?

  1. Malumot ma'lumotlarini qidirishni forEachPartition yoki forEachRdd ga o'tkazing, shunda u butunlay ishchilarda qoladi.
  2. Spark kontekstini har safar qayta ma'lumotlar o'zgarganda yangi Broadcast o'zgaruvchisi bilan qayta ishga tushiring.

Tavsiya: