دانلود پایان نامه مدل های یادگیری ماشین برای طبقه بندی URLهای مخرب
عنوان فارسی |
ارزیابی مدل های یادگیری ماشین برای طبقه بندی URLهای مخرب |
عنوان انگلیسی |
Evaluation of machine learning models for classifying malicious URLs |
کلمات کلیدی : |
  یادگیری ماشین؛ امنیت سایبری؛ طبقه بندی؛ URL مخرب؛ انتخاب نمونه |
رشته های مرتبط | مهندسی کامپیوتر |
تعداد صفحات پایان نامه انگلیسی : 41 | دانشگاه : University of Gävle |
سال انتشار : 2023 | تعداد رفرنس : 33 |
فرمت فایل ترجمه شده : PDF و WORD قابل ویرایش | کیفیت ترجمه : تخصصی ویژه با کیفیت طلایی |
پاورپوینت :
ندارد سفارش پاورپوینت این پایان نامه |
وضعیت ترجمه : انجام شده و با خرید بسته می توانید فایل ترجمه را دانلود کنید |
1. مقدمه 2. نظریه 3. فرآیند و نتایج 4. بحث و بررسی 5. نتیجه گیری
چکیده – میلیون ها وب سایت جدید بطور روزانه ایجاد می شوند و تعیین اینکه کدام یک ایمن هستند را دچار چالش کرده است. امنیت سایبری شامل حفاظت از شرکت ها و کاربران در برابر حمله های سایبری است. مجرمان سایبری از روش های مختلفی شامل حمله های فیشینگ، فریب دادن کاربران به آشکار کردن اطلاعات حساس بهره می گیرند. فقط در استرالیا، بیش از 74000 حمله فیشینگ در سال 2022 گزارش شده و این امر منجر به زیان مالی بیش از 24 میلیون دلار شده است. هوش مصنوعی (AI) و یادگیری ماشین، ابزارهای موثری در حوزه های مختلف، مانند آشکارسازی سرطان، آشکارسازی تقلب مالی و توسعه چت بات، می باشند. مدل های یادگیری ماشین، مانند «جنگل تصادفی» و «ماشین های بردار پشتیبان»، معمولاً برای امور دسته بندی استفاده می شوند. با افزایش جرایم سایبری، استفاده از یادگیری ماشین برای شناسایی URL های بدخواه شناخته شده و جدید، بسیار مهم است. هدف این مطالعه، مقایسه روش های انتخاب نمونه مختلف و مدلهای یادگیری ماشین برای دسته بندی URL های بدخواه می باشد. در این مطالعه، یک مجموعه داده حاوی تقریباً 650,000 عدد URL از Kaggle مورد استفاده قرار گرفت. این مجموعه داده، شامل چهار دسته بود: فیشینگ، تغییر ظاهر (defacement)، بدافزار و URL های خوشخیم. سه مجموعه داده، که هر کدام حاوی حدود 170,000 عدد URL بود، با استفاده از روش های انتخاب نمونه (DRLSH، BPLSH و انتخاب تصادفی) پیاده سازی شده در MATLAB، تولید شدند. مدل های یادگیری ماشین، شامل SVM، DT، KNN ها و RF به کار گرفته شدند. این مطالعه از این روش های انتخاب نمونه برای یک زیرمجموعه از URL های بدخواه، استفاده کرد، مدلهای یادگیری ماشین را برروی مجموعه داده های حاصل آموزش داد و عملکرد آنها را با استفاده از 16 ویژگی و یک ویژگی خروجی، ارزیابی کرد. در فرایند تنظیم دقیق ابرپارامتر، مجموعه داده آموزشی برای آموزش دادن چهار مدل با تنظیمات ابرپارامتر مختلف استفاده شد. از بهینه سازی بیزی برای یافتن بهترین ابرپارامترها برای هر مدل استفاده شد. سپس فرایند دسته بندی انجام شد و نتایج مقایسه شدند. این مطالعه دریافت که روش انتخاب نمونه تصادفی عملکرد بهتری نسبت به دو روش دیگر یعنی BPLSH و DRLSH هم از نظر دقت و هم از نظر زمان سپری شده برای انتخاب داده ها داشت. دقت کمتر حاصل شده بوسیله روش های DRLSH و BPLSH را می توان به مجموعه داده نامتوازن نسبت داد که باعث انتخاب نمونه ضعیف شده است.
Millions of new websites are created daily, making it challenging to determine which ones are safe. Cybersecurity involves protecting companies and users from cyberattacks. Cybercriminals exploit various methods, including phishing attacks, to trick users into revealing sensitive information. In Australia alone, there were over 74,000 reported phishing attacks in 2022, resulting in a financial loss of over $24 million. Artificial intelligence (AI) and machine learning are effective tools in various domains, such as cancer detection, financial fraud detection, and chatbot development. Machine learning models, such as Random Forest and Support Vector Machines, are commonly used for classification tasks. With the rise of cybercrime, it is crucial to use machine learning to identify both known and new malicious URLs. The purpose of the study is to compare different instance selection methods and machine learning models for classifying malicious URLs. In this study, a dataset containing approximately 650,000 URLs from Kaggle was used. The dataset consisted of four categories: phishing, defacement, malware, and benign URLs. Three datasets, each consisting of around 170,000 URLs, were generated using instance selection methods (DRLSH, BPLSH, and random selection) implemented in MATLAB. Machine learning models, including SVM, DT, KNNs, and RF, were employed. The study applied these instance selection methods to a dataset of malicious URLs, trained the machine learning models on the resulting datasets, and evaluated their performance using 16 features and one output feature. In the process of hyperparameter tuning, the training dataset was used to train four models with different hyperparameter settings. Bayesian optimization was employed to find the best hyperparameters for each model. The classification process was then conducted, and the results were compared. The study found that the random instance selection method outperformed the other two methods, BPLSH and DRLSH, in terms of both accuracy and elapsed time for data selection. The lower accuracies achieved by the DRLSH and BPLSH methods may be attributed to the imbalanced dataset, which led to poor sample selection.
میلیونها وبسایت جدید هر روز ایجاد میشوند که از طریق توابع ورود به سیستم، دادههای کاربر را جمعآوری میکنند. تعداد زیاد شبکهها، تعیین ایمن و قابل اعتماد بودن هر کدام را دشوار میکند. امنیت سایبری را میتوان به عنوان مجموعهای از ابزارها یا تکنیکها برای محافظت از شرکتها و کاربران در برابر حملات سایبری تعریف کرد. مجرمان سایبری از روشهای زیادی برای دستکاری کاربران اینترنتی برای ارائه اطلاعات حساس و شخصی استفاده میکنند و یکی از رایجترین روشها برای انجام این کار از طریق URL های مخرب است که هایپرلینک هستند. با تعامل با این لینکها، کاربران خود را در معرض یک سری پیامد قرار میدهند، از به خطر افتادن اطلاعات حساس تا تبدیل شدن به یک هدف اصلی برای حملات سایبری.
ترجمه این پایان نامه در 34 صفحه آماده شده و در ادامه نیز صفحه 20 آن به عنوان نمونه قرار داده شده است که با خرید این محصول می توانید، فایل WORD و PDF آن را دریافت نمایید.
محتوی بسته دانلودی:
فایل PDF پایان نامه انگلیسی فایل ورد قابل ویرایش (WORD) و PDF ترجمه پایان نامه به صورت کاملا مرتب ترجمه شکل ها و جداول انجام شده است
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.