Fungsi Penting Panda Library Python

Pandas adalah pustaka (library) Python yang sangat populer dan digunakan untuk manipulasi serta analisis data secara efisien dan fleksibel. Dengan struktur data utamanya yaitu DataFrame dan Series, pandas memungkinkan pengguna untuk membaca, menulis, membersihkan, memfilter, mengelompokkan, hingga menggabungkan data dengan cara yang sederhana namun powerful. Pustaka ini sangat berguna dalam bidang analisis data, sains data, dan pembelajaran mesin karena mendukung berbagai format file seperti CSV, Excel, SQL, dan JSON. Pandas dibangun di atas pustaka NumPy dan memberikan antarmuka tingkat tinggi yang ramah pengguna untuk pengolahan data berstruktur dua dimensi (seperti tabel di Excel atau database).

A. Input/Output

FungsiPenjelasan
pd.read_csv()Membaca file CSV menjadi DataFrame
pd.read_excel()Membaca file Excel (.xls/.xlsx)
df.to_csv()Menyimpan DataFrame ke file CSV
df.to_excel()Menyimpan DataFrame ke file Excel

B. DataFrame

FungsiPenjelasan
pd.DataFrame()Membuat DataFrame dari dictionary atau array
df.head()Menampilkan 5 baris pertama
df.tail()Menampilkan 5 baris terakhir
df.info()Informasi umum (jumlah baris, kolom, tipe data)
df.describe()Statistik ringkasan dari kolom numerik
df.shapeMenampilkan ukuran DataFrame (baris, kolom)
df.columnsMenampilkan nama-nama kolom
df.dtypesMenampilkan tipe data setiap kolom

C. Seleksi dan Penyaringan Data

FungsiPenjelasan
df['kolom']Mengakses satu kolom
df[['kolom1', 'kolom2']]Mengakses beberapa kolom
df.iloc[]Seleksi berdasarkan posisi (index)
df.loc[]Seleksi berdasarkan label (nama kolom/baris)
df[df['kolom'] > 10]Memfilter baris berdasarkan kondisi

? Pembersihan dan Transformasi Data

FungsiPenjelasan
df.dropna()Menghapus nilai yang hilang (NaN)
df.fillna()Mengisi nilai yang hilang
df.drop()Menghapus kolom atau baris
df.rename()Mengganti nama kolom atau baris
df.astype()Mengubah tipe data kolom
df.replace()Mengganti nilai tertentu
df.duplicated()Mengecek data duplikat
df.drop_duplicates()Menghapus data duplikat

D. Agregasi dan Pengelompokan Data

FungsiPenjelasan
df.groupby()Mengelompokkan data berdasarkan kolom tertentu
df.mean()Menghitung nilai rata-rata
df.sum()Menjumlahkan nilai
df.count()Menghitung jumlah data non-null
df.agg()Menggabungkan beberapa fungsi agregasi
df.value_counts()Menghitung frekuensi nilai unik

E. Pengurutan dan Penataan Ulang Data

FungsiPenjelasan
df.sort_values()Mengurutkan baris berdasarkan nilai kolom
df.sort_index()Mengurutkan berdasarkan index
df.pivot_table()Membuat tabel pivot
df.melt()Mengubah bentuk DataFrame dari lebar ke panjang
df.stack() / df.unstack()Menyusun kembali dimensi DataFrame

F. Penggabungan Data

FungsiPenjelasan
pd.concat()Menggabungkan beberapa DataFrame
pd.merge()Menggabungkan DataFrame seperti SQL JOIN
df.join()Menggabungkan DataFrame berdasarkan index

Share Artikel ini:

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *