تقدم هذه الدورة مقدمة شاملة في التنقيب عن النصوص ومعالجتها باستخدام بايثون. تبدأ الدورة بشرح كيفية تعامل بايثون مع النصوص من الناحيتين البشرية والآلية، وتقديم نظرة عامة على مكتبة NLTK التي تُستخدم في معالجة النصوص. في الأسبوع الثاني، يتم التركيز على مهارات المعالجة الشائعة مثل التعبيرات النمطية لتنقية النصوص، وتنظيفها، وإعدادها لاستخدامات التعلم الآلي. الأسبوع الثالث يطبق أساسيات معالجة اللغات الطبيعية، مما يمكّن المتعلم من كتابة أكواد لتجميع المستندات حسب الموضوعات. تعد هذه الدورة مثالية لمن لديهم معرفة متوسطة ببايثون ويرغبون في تطوير مهاراتهم في تحليل النصوص.
VG Vinod Vydiswaran
School of Information