
University of Illinois Urbana-Champaign
شهدت السنوات الأخيرة تزايدًا كبيرًا في بيانات النصوص الطبيعية مثل صفحات الويب والمقالات الإخبارية والمراجعات والتغريدات، وتستخدم هذه البيانات لاستخلاص المعرفة حول آراء وتفضيلات الناس.
شهدت السنوات الأخيرة نموًا هائلًا في حجم بيانات النصوص الطبيعية، بما يشمل صفحات الويب والمقالات العلمية والبريد الإلكتروني، بالإضافة إلى الوثائق المؤسسية ووسائل التواصل الاجتماعي كالتدوينات ومنشورات المنتديات ومراجعات المنتجات والتغريدات. تتميز بيانات النصوص بكونها عادةً ما تنتج مباشرةً من البشر، مما يجعلها ذات قيمة عالية في استكشاف المعرفة المتعلقة بآراء الأشخاص وتفضيلاتهم، إلى جانب أنواع أخرى من المعرفة المشفرة في النصوص. يغطي هذا المساق تقنيات محركات البحث التي تلعب دورًا رئيسيًا في تطبيقات التنقيب عن البيانات التي تعتمد على البيانات النصية لسببين أساسيين: استخراج المعلومات وتنظيمها بكفاءة لتسهيل الوصول إليها، وفهم المحتوى والنصوص بشكل دقيق لتحسين تجربة المستخدم والتطبيقات ذات الصلة.
ChengXiang Zhai
Professor