
تعرّف هذه الدورة بسرعة على مفاهيم أساسية في علم البيانات مع تركيز عملي على التجميع (Clustering) وخوارزمية K-Means باستخدام بايثون. ستفهم لماذا تعتمد المؤسسات على البيانات لاستخراج أنماط تساعدها في التسويق والتمويل والبحث والصحة، وكيف يختلف التعلم غير المراقب عن الأنواع الأخرى. تبدأ الدورة بمبادئ تمثيل البيانات، والإحصاء الوصفي، وكيفية تجهيز البيانات للتجميع عبر التطبيع وفحص التوزيعات. ثم تتعلم مفاهيم المسافة، اختيار عدد العناقيد، وتفسير مراكز العناقيد، مع استخدام أدوات شائعة مثل NumPy وPandas لإدارة البيانات. بعد ذلك تطبق خطوات خوارزمية K-Means برمجيا: التهيئة، الإسناد، التحديث، ومعايير التوقف، ثم تبني سير عمل متكامل يبدأ من تحميل البيانات وتنظيفها وصولا إلى تقييم المخرجات وعرضها بصريا. بنهاية الدورة ستكون قادرا على تنفيذ تجربة تجميع كاملة، تفسير النتائج، ومناقشة حدود الطريقة وكيف تؤثر القرارات المسبقة على جودة العناقيد.
Professor Matthew Yee-King
Computing Department, Goldsmiths, University of London
Dr Betty Fyn-Sydney
Department of Computing, Goldsmiths, University of London
Dr Jamie A Ward
Department of Computing, Goldsmiths, University of London
Dr Larisa Soldatova
Department of Computing, Goldsmiths, University of London