
تبدأ هذه الدورة باستعراض مناهج متقدمة لتصوّر البيانات على نطاق الجينوم، مع تقديم أدوات تساعدك على بناء واجهات رسومية تفاعلية تُسرّع عملية الاكتشاف وتُحسّن تفسير النتائج. ستتعلم كيف يمكن للتصورات الثابتة والتفاعلية أن تدعم فهم بيانات القياسات الجينومية واسعة النطاق، وكيفية تصميم واجهات تُمكّن من الاستكشاف السريع للبيانات. وباستخدام knitr وrmarkdown كأدوات أساسية للتأليف، تطوّر الدورة مفهوم «البحث القابل لإعادة الإنتاج»، وتقدّم فكرة «المستند القابل للتنفيذ». ضمن هذا الإطار، تُربط التقارير ارتباطاً وثيقاً بالبيانات والشيفرة البرمجية التي أُنتجت منها، مما يعزّز قابلية إعادة الإنتاج وقابلية التوسّع في التحليلات المكتملة، ويجعل مشاركة النتائج وإعادة تشغيلها وتحديثها أكثر موثوقية. كما تتناول الدورة أساليب تحليل الموارد الضخمة جداً دون تحميلها كاملة في الذاكرة (out-of-memory)، عبر استخدام قواعد البيانات العلائقية أو HDF5 كواجهات خلفية (Back ends) مع واجهات R مألوفة، بما يتيح العمل بكفاءة مع مجموعات بيانات كبيرة الحجم. وتُعرض أمثلة على تكامل البيانات متعددة الأوميكس (Multiomics) باستخدام نسخة مُنقّحة من مشروع أطلس جينوم السرطان (The Cancer Genome Atlas)، لفهم كيفية التعامل مع تجارب متعددة الطبقات في سياق السرطان. وأخيراً، تستكشف الدورة موارد جينومية مقيمة على السحابة طُوّرت لأرشيفات جينومية على نطاق اتحادات بحثية كبيرة، مع التركيز على الاستعلام الموجّه والفعّال عن هذه البيانات واسعة النطاق.
Rafael Irizarry
Professor of Biostatistics
Michael Love
Assistant Professor, Departments of Biostatistics and Genetics