پانداس pandas برای تحلیل اطلاعات در پایتون

💻 کتابخانه‌ی Pandas یکی از محبوب‌ترین و قدرتمندترین کتابخانه‌های پایتون برای تحلیل و پردازش داده‌ها است. این کتابخانه به‌طور خاص برای کار با داده‌های ساختاریافته (مانند جداول و داده‌های آماری) طراحی شده است و ابزارهای قدرتمندی برای خواندن، نوشتن، دستکاری و تحلیل داده‌ها ارائه می‌دهد.

 کاربردهای اصلی Pandas:

1. خواندن و نوشتن داده‌ها: پانداس از فرمت‌های مختلفی مانند CSV، Excel، SQL، JSON و ... پشتیبانی می‌کند.

2. دستکاری داده‌ها: امکان فیلتر کردن، مرتب‌سازی، گروه‌بندی و تغییر ساختار داده‌ها.

3. پاک‌سازی داده‌ها: مدیریت مقادیر گم‌شده، حذف داده‌های تکراری و تبدیل انواع داده‌ها.

4. تحلیل داده‌ها: انجام عملیات آماری، محاسبه‌ی میانگین، میانه، انحراف معیار و …

5. تجسم داده‌ها: با استفاده از کتابخانه‌هایی مانند Matplotlib و Seaborn، می‌توان داده‌ها را به‌صورت نمودار نمایش داد.

 ساختارهای اصلی داده‌ها در Pandas:

1. Series: یک آرایه یک‌بعدی با برچسب (Label) که می‌تواند هر نوع داده‌ای را نگه دارد.

2. DataFrame: یک ساختار دو‌بعدی شبیه به جدول یا صفحه‌گسترده (Spreadsheet) که شامل سطرها و ستون‌ها است.

 نصب Pandas:

برای نصب Pandas می‌توانید از دستور زیر استفاده کنید:

bash

pip install pandas

 

 مثال‌های ساده:

1. ایجاد یک DataFrame:

   python

   import pandas as pd

   data = {

       'Name': ['Ali', 'Reza', 'Maryam', 'Sara'],

       'Age': [25, 30, 22, 28],

       'City': ['Tehran', 'Mashhad', 'Isfahan', 'Tabriz']

   }

   df = pd.DataFrame(data)

   print(df)

   

   خروجی:

   

      Name  Age      City

   0   Ali   25    Tehran

   1  Reza   30   Mashhad

   2 Maryam   22   Isfahan

   3  Sara   28    Tabriz

   

2. خواندن از یک فایل CSV:

   python

   df = pd.read_csv('data.csv')

   print(df.head())  # نمایش ۵ سطر اول

   

3. فیلتر کردن داده‌ها:

   python

   filtered_df = df[df['Age'] > 25]

   print(filtered_df)

   

4. محاسبه‌ی میانگین:

   python

   mean_age = df['Age'].mean()

   print(f"Mean Age: {mean_age}")

   

5. گروه‌بندی و تجمیع:

   python

   grouped_df = df.groupby('City')['Age'].mean()

   print(grouped_df)

   

 منابع یادگیری بیشتر:

- [مستندات رسمی Pandas](https://pandas.pydata.org/docs/)

- دوره‌های آموزشی آنلاین مانند Coursera، Udemy و DataCamp.

✅️ Pandas ابزاری ضروری برای هر کسی است که با داده‌ها در پایتون کار می‌کند و یادگیری آن به شما کمک می‌کند تا تحلیل‌های داده‌ای خود را به‌طور مؤثرتری انجام دهید.

به اشتراک بگذارید: