
نبدأ هذه الدورة بمقدمة في علم الأحياء ذي الصلة، مع توضيح ما الذي نقيسه في تجارب الجينوم واسعة النطاق ولماذا نقيسه. بعد ذلك نركّز على تقنيتَي القياس الرئيسيتين المستخدمتين على نطاق واسع: تسلسل الجيل التالي (Next Generation Sequencing) والمصفوفات الدقيقة (Microarrays). ثم ننتقل إلى شرح كيفية استيراد البيانات الخام ومعلومات التجربة إلى بيئة R، وكيف نستخدم أصناف (Classes) بايوكوندكتور لتنظيم هذه البيانات وإدارتها، سواء كانت مُولَّدة محلياً في المختبر، أو مُستخرجة من مستودعات عامة، أو من أرشيفات مؤسسية. ستتعلّم كيف يساعد هذا التنظيم القياسي على جعل التحليل قابلاً لإعادة الإنتاج، وكيف يسهّل الربط بين بيانات القياس والبيانات الوصفية الخاصة بالتصميم التجريبي. وبما أن السمات الجينومية تُعرَّف عادةً باستخدام فترات (Intervals) ضمن إحداثيات جينومية، فسنفحص بالتفصيل خوارزميات عالية الكفاءة للحوسبة على الفترات الجينومية، بما في ذلك عمليات المطابقة والتقاطع والدمج والاستعلام، وهي أساس كثير من مهام التحليل والتعليق الجينومي. وأخيراً، نستعرض أساليب إحصائية لاختبار فرضيات تتمحور حول الجينات أو المسارات الحيوية باستخدام بيانات على مستوى الجينوم. تتوفر هذه الأساليب في حزم مثل limma، وسيتم توضيح بعض هذه التقنيات من خلال أمثلة تطبيقية ضمن المحاضرات.
Rafael Irizarry
Professor of Biostatistics
Michael Love
Assistant Professor, Departments of Biostatistics and Genetics
Vincent Carey
Professor, Medicine