Video: Presto ma'lumotlarni keshlaydimi?
2024 Muallif: Lynn Donovan | [email protected]. Oxirgi o'zgartirilgan: 2023-12-15 23:54
Presto oraliq do'konlar ma'lumotlar uning buferidagi vazifalar davrida kesh . Biroq, u xizmat qilish uchun mo'ljallanmagan keshlash eritma yoki doimiy saqlash qatlami.
Shu munosabat bilan, Presto ma'lumotlar bazasimi?
Presto Bu Hadoop-da ishlaydigan taqsimlangan tizim bo'lib, klassik massiv parallel ishlov berish (MPP) ga o'xshash arxitekturadan foydalanadi. ma'lumotlar bazasi boshqaruv tizimi. Qilish uchun Presto har qanday ma'lumot manbasiga kengaytirilishi mumkin bo'lib, u ulanishi mumkin bo'lgan ulagichlarni yaratishni osonlashtirish uchun saqlash abstraktsiyasi bilan yaratilgan.
Bundan tashqari, presto MapReduce-dan foydalanadimi? Presto ochiq manbali parallel SQL ijro mexanizmi. Hive-dan farqli o'laroq, Presto qilmaydi foydalanish the xaritani qisqartirish uni amalga oshirish uchun asos. Buning o'rniga, Presto to'g'ridan-to'g'ri ma'lumotlarga tijorat parallel RDBMSlarda topilganlarga juda o'xshash maxsus taqsimlangan so'rovlar tizimi orqali kiradi.
Shunday ekan, Presto nima uchun tez?
Sabab №1: Presto ko'p Tez MapReduce "tortishish" modelida ishlaydi va oldingi vazifalardan ma'lumotlarni oladi. Yuqori bosqich o'zining quyi bosqichlaridan ma'lumotlarni oladi, shuning uchun oraliq ma'lumotlar to'g'ridan-to'g'ri uzatilishi mumkin, bu esa so'rovni sezilarli darajada oshiradi. Tezroq.
Apache Presto qanday ishlaydi?
Presto tugunlar klasterida ishlaydigan taqsimlangan tizimdir. Presto taqsimlangan so'rovlar mexanizmi interaktiv tahlil uchun optimallashtirilgan va standart ANSI SQL-ni qo'llab-quvvatlaydi, shu jumladan murakkab so'rovlar, yig'ishlar, birlashmalar va oyna funktsiyalari. Presto arxitektura oddiy va kengaytirilishi mumkin.
Tavsiya:
Biznes qarorlarini qabul qilish uchun ma'lumotlarni saqlash va tahlil qilish uchun korxonalar ko'pincha nimani rivojlantiradilar?
Biznes qarorlarini qabul qilish uchun ma'lumotlarni saqlash va tahlil qilish uchun korxonalar ko'pincha nimani rivojlantiradilar? operatsion tizim. Axborotni boshqarishning maqsadlaridan biri korxonalarni strategik ma'lumotlar bilan ta'minlashdan iborat: vazifani bajarish
Google kuniga qancha ma'lumotlarni qayta ishlaydi?
Hozirda Google oʻzining yirik hisoblash klasterlari boʻylab tarqalgan oʻrtacha 100 000 MapReduce ishlari orqali kuniga 20 petabaytdan ortiq maʼlumotlarni qayta ishlaydi
Ma'lumotlarni qazib olish nima va nima ma'lumotlarni qazib olish emas?
Ma'lumotni qazib olish oldindan o'ylab topilgan gipotezasiz amalga oshiriladi, shuning uchun ma'lumotlardan olingan ma'lumotlar tashkilotning aniq savollariga javob bermaydi. Ma'lumotni qazib olish emas: Ma'lumotni qazib olish maqsadi ma'lumotlarning o'zi emas, balki katta hajmdagi ma'lumotlardan naqsh va bilimlarni olishdir
Nima uchun ustunga yo'naltirilgan ma'lumotlarni saqlash disklardagi ma'lumotlarga kirishni satrga yo'naltirilgan ma'lumotlarni saqlashga qaraganda tezroq qiladi?
Ustunlarga yo'naltirilgan ma'lumotlar bazalari (aka ustunli ma'lumotlar bazalari) analitik ish yuklari uchun ko'proq mos keladi, chunki ma'lumotlar formati (ustun formati) so'rovlarni tezroq qayta ishlashga yordam beradi - skanerlash, yig'ish va hokazo. Boshqa tomondan, qatorga yo'naltirilgan ma'lumotlar bazalari bitta qatorni (va uning barcha ma'lumotlarini) saqlaydi. ustunlar) yonma-yon
Presto uyaga muhtojmi?
Quyidagi fayl formatlari qo'llab-quvvatlanadi: Matn, SequenceFile, RCFile, ORC va Parket. Bundan tashqari, masofaviy Hive metastore talab qilinadi. Mahalliy yoki o'rnatilgan rejim qo'llab-quvvatlanmaydi. Presto MapReduce-dan foydalanmaydi va shuning uchun faqat HDFS-ni talab qiladi