
قد يتضمن مشروع تحليل بيانات نموذجي عدة أجزاء، يضم كل جزء منها ملفات بيانات متعددة ونصوصاً برمجية مختلفة تحتوي على شيفرة. ومع تزايد عدد الملفات والإصدارات، يصبح الحفاظ على تنظيم كل ذلك تحدياً حقيقياً. تأتي هذه الدورة ضمن برنامج الشهادة المهنية في علم البيانات، وتهدف إلى تزويدك بأدوات عملية لرفع إنتاجيتك وتنظيم عملك. ستتعلم كيفية استخدام Unix/Linux كأداة لإدارة الملفات والمجلدات على جهازك، وكيفية الحفاظ على نظام ملفات منظم يسهل تتبعه والعمل عليه. كما ستتعرّف إلى نظام التحكم في الإصدارات git، وهو أداة قوية لتتبع التغييرات التي تُجريها على النصوص البرمجية والتقارير، والعودة إلى نسخ سابقة عند الحاجة، والعمل بطريقة أكثر أماناً ووضوحاً. بعد ذلك، سنقدم GitHub ونوضح كيف يمكنك استخدام هذه الخدمة لاستضافة عملك داخل مستودع (Repository) يسهّل التعاون مع الآخرين، ومشاركة الشيفرة، ومراجعة التغييرات، وتنظيم المشروع ضمن بيئة مناسبة للعمل الجماعي. وأخيراً، ستتعلم كتابة التقارير باستخدام R Markdown، الذي يتيح دمج النص مع الشيفرة والنتائج داخل مستند واحد قابل لإعادة الإنتاج، ما يساعدك على توثيق التحليل وتقديمه بشكل احترافي. كما سنستعرض ميزات مفيدة في RStudio لدعم سير العمل وإدارة المشاريع بكفاءة.
Rafael Irizarry
Professor of Biostatistics