
تشرح هذه الدورة كيفية تنفيذ خطوات المعالجة القياسية والتطبيع (Normalization) بدءاً من البيانات الخام وصولاً إلى مرحلة تمكّنك من طرح أسئلة بيولوجية ذات صلة والإجابة عنها اعتماداً على البيانات. عبر دراسات الحالة المختلفة، سنستخدم رسوماً استكشافية (Exploratory plots) للحصول على نظرة عامة على شكل البيانات ونتائج التجربة، وفهم الأنماط العامة قبل الانتقال إلى التحليلات المتقدمة. نبدأ بتحليل بيانات RNA-seq، مع تغطية المفاهيم الأساسية وإلقاء نظرة أولى على ملفات FASTQ. ثم ننتقل إلى ضبط الجودة لملفات FASTQ، ومحاذاة (Aligning) قراءات RNA-seq، وتصور المحاذاة (Visualizing alignments). بعد ذلك نتابع إلى تحليل RNA-seq على مستوى الجينات (Gene-level)، بما يشمل: عدّ القراءات داخل الجينات، والتحليل الاستكشافي للبيانات وتثبيت التباين (Variance stabilization) لبيانات العدّ، وتحليل التعبير التفاضلي المعتمد على العدّ (Count-based differential expression)، إضافة إلى التطبيع ومعالجة تأثيرات الدُفعات (Batch effects). وأخيراً، نغطي تحليل RNA-seq على مستوى النسخ (Transcript-level)، بما في ذلك استنتاج/استدلال معلومات النسخ (Inferring) من البيانات. كما تتناول الدورة دراسات حالة لتحليل بيانات ChIP-Seq وبيانات مثيلة الحمض النووي DNA باستخدام برمجيات مفتوحة المصدر، مع التركيز على سير عمل عملي قابل للتطبيق باستخدام R وBioconductor.
Rafael Irizarry
Professor of Biostatistics
Michael Love
Assistant Professor, Departments of Biostatistics and Genetics
Vincent Carey
Professor, Medicine