📄 پروپوزال پروژه

تحلیل ترافیک شبکه و شناسایی حملات DDoS با استفاده از الگوریتم‌های یادگیری ماشین

👥 اعضای گروه:

علی مؤمن زاده
علی زارع منصوری
محمدطاها نصیری
🧠 عنوان پروژه
تحلیل ترافیک شبکه و شناسایی حملات DDoS با استفاده از الگوریتم‌های یادگیری ماشین
📖 مقدمه
با گسترش استفاده از سامانه‌های آنلاین و اینترنت اشیاء، تهدیدات امنیتی به شکل قابل توجهی افزایش یافته‌اند. یکی از متداول‌ترین و مخرب‌ترین این تهدیدات، حملات انکار سرویس توزیع‌شده (DDoS) است که با ایجاد ترافیک غیرواقعی و شدید، منجر به اختلال در سرویس‌دهی سیستم‌ها می‌شود.

در این پروژه با بهره‌گیری از یادگیری ماشین و تحلیل داده‌های واقعی ترافیک شبکه، به شناسایی و تحلیل این نوع حملات می‌پردازیم. این کار نه تنها در تشخیص دقیق‌تر حملات مؤثر است بلکه می‌تواند به طراحی سیستم‌های پیشگیرانه کمک کند.
🎯 اهداف پروژه
  • تحلیل داده‌های ترافیک شبکه برای شناسایی الگوهای حملات سایبری
  • تشخیص حملات DDoS با استفاده از الگوریتم‌های یادگیری ماشین
  • مقایسه دقت و کارایی مدل‌های مختلف در این زمینه
  • ارائه یک چارچوب قابل پیاده‌سازی در سامانه‌های امنیت شبکه
سؤال پژوهشی
آیا می‌توان با استفاده از ویژگی‌های موجود در داده‌های ترافیک شبکه، حملات DDoS را با دقت و سرعت بالا شناسایی کرد؟
📊 داده‌ها (Dataset)
مشخصه جزئیات
نام دیتاست IDS Intrusion Dataset
منبع Kaggle Dataset Link
فرمت فایل CSV
تعداد رکوردها بیش از ٢ میلیون رکورد
تعداد ویژگی‌ها ٨٠ ویژگی (عددی و دسته‌ای)
برخی از ویژگی‌ها:
Flow Duration, Total Fwd Packets, Packet Length Mean, Protocol, Flag Count و...

ویژگی هدف: Label (حمله یا عادی)
🔄 داده‌های ورودی و خروجی
نوع داده شرح
ورودی ویژگی‌های عددی و دسته‌ای از ترافیک شبکه
خروجی برچسب Label که نشان‌دهنده حمله DDoS یا ترافیک عادی (Benign) است
🛠️ ابزارها و کتابخانه‌های مورد استفاده
Python
زبان برنامه‌نویسی اصلی
Pandas, NumPy
تحلیل و پیش‌پردازش داده
Matplotlib, Seaborn, Plotly
مصورسازی داده‌ها
Scikit-learn
مدل‌سازی الگوریتم‌های ML
XGBoost, LightGBM
مدل‌های ML پیشرفته
⚙️ روش اجرا (Methodology)

پیش‌پردازش داده‌ها

  • حذف یا اصلاح مقادیر گمشده
  • نرمال‌سازی ویژگی‌ها
  • بررسی Outlierها
  • Encoding داده‌های دسته‌ای

تحلیل داده (EDA)

  • بررسی توزیع داده‌ها
  • جداول همبستگی
  • تحلیل ویژگی‌های مهم در تشخیص حمله
  • نمودارهای هیستوگرام، KDE، BoxPlot و PairPlot

مدل‌سازی

مدل‌هایی که آزمایش خواهند شد:

  • Logistic Regression
  • Random Forest
  • K-Nearest Neighbors
  • Support Vector Machine

ارزیابی مدل‌ها

  • Accuracy
  • Precision
  • Recall
  • F1-Score
  • Confusion Matrix
💡 نوآوری و ارزش پروژه
استفاده از داده واقعی ترافیک شبکه با حجم بالا
ترکیب تحلیل آماری با یادگیری ماشین برای تشخیص حملات
ارائه مدل‌های دقیق و مقایسه‌پذیر
قابلیت توسعه به سیستم‌های هشداردهنده آنی (Real-time Alert)
کاربرد در زیرساخت‌های سایبری ایران
📋 خروجی نهایی پروژه
مدل آموزش‌دیده و قابل ارزیابی برای تشخیص حمله DDoS
گزارش تحلیلی کامل شامل مصورسازی و تحلیل عملکرد مدل‌ها
کد مستند و قابل توسعه در محیط Jupyter Notebook
پیشنهاد‌هایی برای توسعه به سیستم‌های عملیاتی
📚 منابع