Pandas في Python — خطوة مهمة في عالم البيانات والذكاء الاصطناعي
تخيّل أن لديك جدولًا كبيرًا يحتوي على أسماء الطلاب، الدرجات، الأعمار، أو مبيعات متجر كامل.
يمكنك التعامل مع هذه البيانات يدويًا، لكن الأمر سيصبح متعبًا جدًا عندما تكبر الجداول.
هنا يأتي دور Pandas، واحدة من أهم مكتبات Python للتعامل مع البيانات بطريقة سهلة ومنظمة.
ما هو Pandas؟
Pandas هو مكتبة في Python تساعدنا على قراءة البيانات، ترتيبها، تحليلها، وتنظيفها بسهولة.
بدل أن نتعامل مع الجداول بطريقة معقدة، Pandas يعطينا أدوات جاهزة للتعامل مع:
- الجداول
- ملفات Excel
- ملفات CSV
- البيانات الناقصة
- ترتيب البيانات وتصفيتها
- تحليل البيانات قبل استخدامها في الذكاء الاصطناعي
أهم كائن في Pandas اسمه DataFrame، ويمكنك تخيله كأنه جدول منظم يحتوي على صفوف وأعمدة.
لماذا نحتاج Pandas؟
لأن معظم مشاريع الذكاء الاصطناعي لا تبدأ بالنماذج المعقدة مباشرة.
هي تبدأ أولًا بالبيانات.
قد تكون البيانات في ملف Excel، أو جدول مبيعات، أو ملف يحتوي على درجات الطلاب، أو بيانات عملاء، أو نتائج تجربة.
قبل أن نستخدم هذه البيانات، نحتاج إلى:
- قراءتها
- فهم شكلها
- تنظيف الأخطاء
- التعامل مع القيم الناقصة
- اختيار الأعمدة المهمة
- تجهيزها للتحليل أو الذكاء الاصطناعي
لذلك تعتبر Pandas من أهم الأدوات لأي شخص يريد دخول عالم:
Data Science
Machine Learning
Artificial Intelligence
التثبيت
افتح Terminal أو Command Prompt واكتب:
pip install pandas
الاستدعاء داخل Python
الطريقة المشهورة لاستخدام Pandas هي:
import pandas as pd
وهذا الاختصار pd هو الأسلوب الشائع بين المبرمجين لأنه يجعل الكود أقصر وأسهل قراءة.
أول مثال
لننشئ جدولًا صغيرًا يحتوي على أسماء طلاب ودرجاتهم:
import pandas as pd
data = {
"name": ["Ali", "Sara", "Omar"],
"grade": [85, 90, 78]
}
students = pd.DataFrame(data)
print(students)
النتيجة
name grade
0 Ali 85
1 Sara 90
2 Omar 78
هنا أنشأنا جدولًا باستخدام DataFrame. كل عمود له اسم، وكل صف يحتوي على بيانات طالب.
ما الفرق بين List و DataFrame؟
في Python العادية يمكننا كتابة البيانات هكذا:
students = [
["Ali", 85],
["Sara", 90],
["Omar", 78]
]
لكن هذه الطريقة ليست مريحة عندما نريد تحليل البيانات أو اختيار أعمدة معينة.
أما في Pandas يمكننا كتابة البيانات كجدول واضح:
import pandas as pd
students = pd.DataFrame({
"name": ["Ali", "Sara", "Omar"],
"grade": [85, 90, 78]
})
print(students)
النتيجة
name grade
0 Ali 85
1 Sara 90
2 Omar 78
الفرق أن DataFrame يجعل البيانات منظمة مثل جدول حقيقي، وهذا يسهل القراءة، البحث، الترتيب، والتحليل.
اختيار عمود من الجدول
إذا أردنا عرض درجات الطلاب فقط، نكتب:
print(students["grade"])
النتيجة
0 85
1 90
2 78
Name: grade, dtype: int64
هنا طلبنا من Pandas عرض عمود واحد فقط من الجدول.
إضافة عمود جديد
تخيل أننا نريد إضافة 5 درجات لكل طالب:
students["new_grade"] = students["grade"] + 5
print(students)
النتيجة
name grade new_grade
0 Ali 85 90
1 Sara 90 95
2 Omar 78 83
جميل جدًا، أليس كذلك؟
Pandas أضافت 5 درجات لكل طالب بسهولة، ووضعت النتيجة في عمود جديد.
مثال بسيط من الحياة
تخيل أن لديك جدول مبيعات صغير:
import pandas as pd
sales = pd.DataFrame({
"product": ["Laptop", "Mouse", "Keyboard"],
"price": [800, 20, 50],
"quantity": [2, 5, 3]
})
sales["total"] = sales["price"] * sales["quantity"]
print(sales)
النتيجة
product price quantity total
0 Laptop 800 2 1600
1 Mouse 20 5 100
2 Keyboard 50 3 150
هنا حسبنا إجمالي المبيعات لكل منتج بضرب السعر في الكمية. هذا مثال بسيط يوضح كيف تساعدنا Pandas في تحليل البيانات بسرعة.
قراءة ملف CSV
من أقوى مميزات Pandas أنها تستطيع قراءة ملفات البيانات بسهولة. إذا كان لديك ملف اسمه students.csv يمكنك قراءته هكذا:
import pandas as pd
students = pd.read_csv("students.csv")
print(students)
هذه الخطوة مهمة جدًا في عالم البيانات، لأن كثيرًا من البيانات الحقيقية تكون محفوظة داخل ملفات CSV أو Excel.
💡 الخلاصة ورؤية مدونة airealm.info لقادة المستقبل الرقمي
Pandas تجعل التعامل مع البيانات:
أوضح
أسرع
أكثر تنظيمًا
أسهل في التحليل
ومناسبًا كبداية قوية للذكاء الاصطناعي
نهاية الدرس
إذا كنت تريد تعلم الذكاء الاصطناعي، فلا تقفز مباشرة إلى النماذج المعقدة.
ابدأ من الأساس:
Python → NumPy → Pandas → Data → AI
NumPy يساعدنا في التعامل مع الأرقام والمصفوفات.
أما Pandas فيساعدنا في التعامل مع الجداول والبيانات الحقيقية.
وبهذه الطريقة تبدأ في فهم كيف تتحول البيانات الخام إلى معلومات…
وكيف تتحول المعلومات إلى ذكاء.