Mundarija:

Ro'yxatdan PySpark DataFrame-ni qanday qilishim mumkin?
Ro'yxatdan PySpark DataFrame-ni qanday qilishim mumkin?

Video: Ro'yxatdan PySpark DataFrame-ni qanday qilishim mumkin?

Video: Ro'yxatdan PySpark DataFrame-ni qanday qilishim mumkin?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Noyabr
Anonim

Men kortejlar ro'yxatidan DataFrame yaratish uchun quyidagi bosqichlarni bajaraman:

  1. Yaratmoq a ro'yxati kortejlardan iborat. Har bir kortejda yoshi bo'lgan odamning ismi mavjud.
  2. Yaratmoq dan RDD ro'yxati yuqorida.
  3. Konvertatsiya qilish har bir qatorni bir qatorga.
  4. Yaratmoq a DataFrame sqlContext yordamida RDD-da createDataFrame-ni qo'llash orqali.

Buni hisobga olib, DataFrame-ni Python-dagi ro'yxatga qanday o'zgartirasiz?

  1. 1-qadam: DataFrame.to_numpy() yordamida Dataframe-ni ichki o'rnatilgan Numpy massiviga aylantiring, ya'ni,
  2. 2-qadam: 2D Numpy massivini ro'yxatlar ro'yxatiga aylantiring.
  3. 1-qadam: satrlarni ustunlar va ustunlarni qatorlar sifatida aylantirish uchun ma'lumotlar ramkasini o'zgartiring.
  4. 2-qadam: DataFrame.to_numpy() yordamida Dataframe-ni ichki oʻrnatilgan Numpy massiviga aylantiring.

Bundan tashqari, Spark DataFrame nima? A Spark DataFrame agregatlarni filtrlash, guruhlash yoki hisoblash operatsiyalarini ta'minlaydigan va foydalanish mumkin bo'lgan nomli ustunlarga ajratilgan ma'lumotlarning taqsimlangan to'plamidir. Uchqun SQL. DataFrames tuzilgan ma'lumotlar fayllari, mavjud RDDlar, Hive-dagi jadvallar yoki tashqi ma'lumotlar bazalaridan tuzilishi mumkin.

Shuningdek, bilingki, PySpark SQL nima?

Spark SQL a Uchqun tuzilgan ma'lumotlarni qayta ishlash moduli. U DataFrames deb nomlangan dasturlash abstraktsiyasini taqdim etadi va shuningdek, taqsimlangan sifatida ham harakat qilishi mumkin SQL so'rov mexanizmi. U o'zgartirilmagan Hadoop Hive so'rovlarini mavjud joylashtirish va ma'lumotlarda 100 barobar tezroq ishga tushirish imkonini beradi.

Spark DataFrames o'zgarmasmi?

In Uchqun qila olmaysiz - DataFrames bor o'zgarmas . Foydalanishingiz kerak.

Tavsiya: