💻 کتابخانهی Pandas یکی از محبوبترین و قدرتمندترین کتابخانههای پایتون برای تحلیل و پردازش دادهها است. این کتابخانه بهطور خاص برای کار با دادههای ساختاریافته (مانند جداول و دادههای آماری) طراحی شده است و ابزارهای قدرتمندی برای خواندن، نوشتن، دستکاری و تحلیل دادهها ارائه میدهد.
کاربردهای اصلی Pandas:
1. خواندن و نوشتن دادهها: پانداس از فرمتهای مختلفی مانند CSV، Excel، SQL، JSON و ... پشتیبانی میکند.
2. دستکاری دادهها: امکان فیلتر کردن، مرتبسازی، گروهبندی و تغییر ساختار دادهها.
3. پاکسازی دادهها: مدیریت مقادیر گمشده، حذف دادههای تکراری و تبدیل انواع دادهها.
4. تحلیل دادهها: انجام عملیات آماری، محاسبهی میانگین، میانه، انحراف معیار و …
5. تجسم دادهها: با استفاده از کتابخانههایی مانند Matplotlib و Seaborn، میتوان دادهها را بهصورت نمودار نمایش داد.
ساختارهای اصلی دادهها در Pandas:
1. Series: یک آرایه یکبعدی با برچسب (Label) که میتواند هر نوع دادهای را نگه دارد.
2. DataFrame: یک ساختار دوبعدی شبیه به جدول یا صفحهگسترده (Spreadsheet) که شامل سطرها و ستونها است.
نصب Pandas:
برای نصب Pandas میتوانید از دستور زیر استفاده کنید:
bash
pip install pandas
مثالهای ساده:
1. ایجاد یک DataFrame:
python
import pandas as pd
data = {
'Name': ['Ali', 'Reza', 'Maryam', 'Sara'],
'Age': [25, 30, 22, 28],
'City': ['Tehran', 'Mashhad', 'Isfahan', 'Tabriz']
}
df = pd.DataFrame(data)
print(df)
خروجی:
Name Age City
0 Ali 25 Tehran
1 Reza 30 Mashhad
2 Maryam 22 Isfahan
3 Sara 28 Tabriz
2. خواندن از یک فایل CSV:
python
df = pd.read_csv('data.csv')
print(df.head()) # نمایش ۵ سطر اول
3. فیلتر کردن دادهها:
python
filtered_df = df[df['Age'] > 25]
print(filtered_df)
4. محاسبهی میانگین:
python
mean_age = df['Age'].mean()
print(f"Mean Age: {mean_age}")
5. گروهبندی و تجمیع:
python
grouped_df = df.groupby('City')['Age'].mean()
print(grouped_df)
منابع یادگیری بیشتر:
- [مستندات رسمی Pandas](https://pandas.pydata.org/docs/)
- دورههای آموزشی آنلاین مانند Coursera، Udemy و DataCamp.
✅️ Pandas ابزاری ضروری برای هر کسی است که با دادهها در پایتون کار میکند و یادگیری آن به شما کمک میکند تا تحلیلهای دادهای خود را بهطور مؤثرتری انجام دهید.