شرح مفصل حول وحدة Pandas في بايثون وكيفية استخدامها

 

Pandas في Python — خطوة مهمة في عالم البيانات والذكاء الاصطناعي

تخيّل أن لديك جدولًا كبيرًا يحتوي على أسماء الطلاب، الدرجات، الأعمار، أو مبيعات متجر كامل. يمكنك التعامل مع هذه البيانات يدويًا، لكن الأمر سيصبح متعبًا جدًا عندما تكبر الجداول.

هنا يأتي دور Pandas، واحدة من أهم مكتبات Python للتعامل مع البيانات بطريقة سهلة ومنظمة.

ما هو Pandas؟

Pandas هو مكتبة في Python تساعدنا على قراءة البيانات، ترتيبها، تحليلها، وتنظيفها بسهولة.

بدل أن نتعامل مع الجداول بطريقة معقدة، Pandas يعطينا أدوات جاهزة للتعامل مع:

  • الجداول
  • ملفات Excel
  • ملفات CSV
  • البيانات الناقصة
  • ترتيب البيانات وتصفيتها
  • تحليل البيانات قبل استخدامها في الذكاء الاصطناعي

أهم كائن في Pandas اسمه DataFrame، ويمكنك تخيله كأنه جدول منظم يحتوي على صفوف وأعمدة.

لماذا نحتاج Pandas؟

لأن معظم مشاريع الذكاء الاصطناعي لا تبدأ بالنماذج المعقدة مباشرة.
هي تبدأ أولًا بالبيانات.

قد تكون البيانات في ملف Excel، أو جدول مبيعات، أو ملف يحتوي على درجات الطلاب، أو بيانات عملاء، أو نتائج تجربة.

قبل أن نستخدم هذه البيانات، نحتاج إلى:

  • قراءتها
  • فهم شكلها
  • تنظيف الأخطاء
  • التعامل مع القيم الناقصة
  • اختيار الأعمدة المهمة
  • تجهيزها للتحليل أو الذكاء الاصطناعي

لذلك تعتبر Pandas من أهم الأدوات لأي شخص يريد دخول عالم:
Data Science
Machine Learning
Artificial Intelligence

التثبيت

افتح Terminal أو Command Prompt واكتب:

pip install pandas

الاستدعاء داخل Python

الطريقة المشهورة لاستخدام Pandas هي:

import pandas as pd

وهذا الاختصار pd هو الأسلوب الشائع بين المبرمجين لأنه يجعل الكود أقصر وأسهل قراءة.

أول مثال

لننشئ جدولًا صغيرًا يحتوي على أسماء طلاب ودرجاتهم:

import pandas as pd

data = {
    "name": ["Ali", "Sara", "Omar"],
    "grade": [85, 90, 78]
}

students = pd.DataFrame(data)

print(students)

النتيجة

   name  grade
0   Ali     85
1  Sara     90
2  Omar     78

هنا أنشأنا جدولًا باستخدام DataFrame. كل عمود له اسم، وكل صف يحتوي على بيانات طالب.

ما الفرق بين List و DataFrame؟

في Python العادية يمكننا كتابة البيانات هكذا:

students = [
    ["Ali", 85],
    ["Sara", 90],
    ["Omar", 78]
]

لكن هذه الطريقة ليست مريحة عندما نريد تحليل البيانات أو اختيار أعمدة معينة.

أما في Pandas يمكننا كتابة البيانات كجدول واضح:

import pandas as pd

students = pd.DataFrame({
    "name": ["Ali", "Sara", "Omar"],
    "grade": [85, 90, 78]
})

print(students)

النتيجة

   name  grade
0   Ali     85
1  Sara     90
2  Omar     78

الفرق أن DataFrame يجعل البيانات منظمة مثل جدول حقيقي، وهذا يسهل القراءة، البحث، الترتيب، والتحليل.

اختيار عمود من الجدول

إذا أردنا عرض درجات الطلاب فقط، نكتب:

print(students["grade"])

النتيجة

0    85
1    90
2    78
Name: grade, dtype: int64

هنا طلبنا من Pandas عرض عمود واحد فقط من الجدول.

إضافة عمود جديد

تخيل أننا نريد إضافة 5 درجات لكل طالب:

students["new_grade"] = students["grade"] + 5

print(students)

النتيجة

   name  grade  new_grade
0   Ali     85         90
1  Sara     90         95
2  Omar     78         83

جميل جدًا، أليس كذلك؟
Pandas أضافت 5 درجات لكل طالب بسهولة، ووضعت النتيجة في عمود جديد.

مثال بسيط من الحياة

تخيل أن لديك جدول مبيعات صغير:

import pandas as pd

sales = pd.DataFrame({
    "product": ["Laptop", "Mouse", "Keyboard"],
    "price": [800, 20, 50],
    "quantity": [2, 5, 3]
})

sales["total"] = sales["price"] * sales["quantity"]

print(sales)

النتيجة

    product  price  quantity  total
0    Laptop    800         2   1600
1     Mouse     20         5    100
2  Keyboard     50         3    150

هنا حسبنا إجمالي المبيعات لكل منتج بضرب السعر في الكمية. هذا مثال بسيط يوضح كيف تساعدنا Pandas في تحليل البيانات بسرعة.

قراءة ملف CSV

من أقوى مميزات Pandas أنها تستطيع قراءة ملفات البيانات بسهولة. إذا كان لديك ملف اسمه students.csv يمكنك قراءته هكذا:

import pandas as pd

students = pd.read_csv("students.csv")

print(students)

هذه الخطوة مهمة جدًا في عالم البيانات، لأن كثيرًا من البيانات الحقيقية تكون محفوظة داخل ملفات CSV أو Excel.

💡 الخلاصة ورؤية مدونة airealm.info لقادة المستقبل الرقمي

Pandas تجعل التعامل مع البيانات:
أوضح
أسرع
أكثر تنظيمًا
أسهل في التحليل
ومناسبًا كبداية قوية للذكاء الاصطناعي

نهاية الدرس
إذا كنت تريد تعلم الذكاء الاصطناعي، فلا تقفز مباشرة إلى النماذج المعقدة.
ابدأ من الأساس:
Python → NumPy → Pandas → Data → AI

NumPy يساعدنا في التعامل مع الأرقام والمصفوفات.
أما Pandas فيساعدنا في التعامل مع الجداول والبيانات الحقيقية.

وبهذه الطريقة تبدأ في فهم كيف تتحول البيانات الخام إلى معلومات…
وكيف تتحول المعلومات إلى ذكاء.