Parket ma'lumotlar formati nima?
Parket ma'lumotlar formati nima?

Video: Parket ma'lumotlar formati nima?

Video: Parket ma'lumotlar formati nima?
Video: #01 ALGORITMLAR | ALGORITM NIMA? 2024, Noyabr
Anonim

Apache Parket bepul va ochiq manbali ustunga yo'naltirilgan ma'lumotlar saqlash format Apache Hadoop ekotizimining. Ko'pchilik bilan mos keladi ma'lumotlar Hadoop muhitida ramkalarni qayta ishlash. U samarali ta'minlaydi ma'lumotlar murakkab ishlov berish uchun yaxshilangan ishlashga ega siqish va kodlash sxemalari ma'lumotlar ommaviy.

Oddiy qilib aytganda, parket fayl formati nima?

Parket , ochiq manba fayl formati Hadoop uchun. Parket ichki ma'lumotlar tuzilmalarini tekis ustun shaklida saqlaydi format . Ma'lumotlar qatorga yo'naltirilgan yondashuvda saqlanadigan an'anaviy yondashuv bilan solishtirganda, parket saqlash va ishlash jihatidan ancha samarali.

Bundan tashqari, parket nima uchun ishlatiladi? Parket Hadoop ekotizimidagi har qanday loyiha uchun mavjud ochiq manba fayl formatidir. Apache Parket CSV yoki TSV fayllari kabi qatorga asoslangan fayllar bilan solishtirganda ma'lumotlarning samarali va samarali tekis ustunli saqlash formati uchun mo'ljallangan.

Bundan tashqari, parket formati ma'lumotlarni qanday saqlaydi?

DATA BLOCK dagi har bir blok parket fayl hisoblanadi saqlanadi qator guruhlari shaklida. Shunday qilib, ma'lumotlar a ichida parket fayl bir nechta qator guruhlariga bo'lingan. Ushbu qator guruhlari o'z navbatida ustundagi ustunga mos keladigan bir yoki bir nechta ustun bo'laklaridan iborat ma'lumotlar o'rnatish. The ma'lumotlar sahifalar shaklida yozilgan har bir ustun bo'lagi uchun.

Parketni odam o'qiy oladimi?

ORC, Parket , va Avro ham mashina- o'qilishi mumkin ikkilik formatlar, ya'ni fayllar ma'nosiz ko'rinadi odamlar . Agar kerak bo'lsa inson - o'qilishi mumkin JSON yoki XML kabi formatga ega bo'lsangiz, unda nima uchun birinchi navbatda Hadoop-dan foydalanayotganingizni qayta ko'rib chiqishingiz kerak.

Tavsiya: