
في هذا المساق، ستتعلم التعامل مع البيانات الواقعية غير النظيفة، المنتشرة عبر مواقع الويب، واجهات برمجة التطبيقات، وقواعد البيانات. ستركز على جمع البيانات وتنظيفها وتحضيرها للتحليل باستخدام بايثون وSQL. يبدأ المساق بالتعرف على استخراج البيانات من صفحات الويب باستخدام مكتبات مثل Pandas وBeautiful Soup، مع الاهتمام بالتعامل مع النصوص غير المنظمة وممارسات الاستخراج الأخلاقي. بعد ذلك، ستتعلم الوصول إلى البيانات الحية عبر APIs، وتحليل ملفات JSON، وتنظيف البيانات الرقمية باستخدام تقنيات مثل التوحيد والتصنيف. ستتعرف أيضًا على إدارة مفاتيح API بأمان، وكيفية الاستعلام عن الجداول ودمجها في قواعد البيانات باستخدام SQL مع التحقق من النتائج. كما سيتم توضيح متى يُفضل استخدام SQL مقابل بايثون لمهام المعالجة المختلفة. هذا المساق مثالي للمبتدئين الذين يرغبون في بناء مهارات أساسية في معالجة البيانات.
Sean Barnes
Data Science Leader at Netflix