Saldırı tespitinde makine öğrenmesi ve özellik seçiminin performansa etkisi

dc.contributor.advisorŞentürk, Arafat
dc.contributor.authorTürkyılmaz, Yasin
dc.date.accessioned2023-04-04T16:04:51Z
dc.date.available2023-04-04T16:04:51Z
dc.date.issued2021
dc.departmentDÜ, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.description.abstractİnternete olan ilgi son yıllarda artmış ve artmaya devam etmektedir. Bu artışa birde salgın hastalık koşulları eklenince insan, hayatını etkileyen her şeyi internet vasıtasıyla yapmaya odaklanılmıştır. İnternete olan ilginin artmasıyla birlikte, internet üzerinden gerçekleştirilen saldırı sayılarındaki ve suç ifa edebilecek olan durumdaki faaliyetler de artmış ve istikrarlı şekilde artmaya devam etmektedir. Bu sebepten, organizasyonların ağ güvenliğini sağlaması çok daha zor hale gelmektedir. Saldırı ve suçlulara karşı ağ güvenliğini sağlamak için birçok farklı güvenlik sistemi kullanılmaktadır. Saldırı Tespit Sistemleri (STS) ağ güvenliği için kullanılan güvenlik sistemlerinden bir tanesidir. Son yıllarda araştırmacılar daha verimli ve etkin bir STS ortaya koymak için birçok çalışma gerçekleştirmişlerdir. Yapılan çalışmalarda kıyaslama veri seti olarak kullanılan veri setlerinin artan ağ trafiğinden dolayı günümüz şartlarına uygun olmadığı ve değerlendirmelerde doğru sonuçları vermediği görülmüştür. Bu soruna çözüm olması için 2015 yılında yayınlanan UNSW-NB15 veri seti oluşturulmuştur. UNSW-NB15 veri seti ReliefF puanlama yöntemi kullanılarak özellik seçimine tabi tutulmuştur. Orijinal halinde 42 olan özellik sayısı 29'a düşürülmüştür. Bu tez çalışmanın amacı STS'yi daha verimli ve etkin hale getirmek için kullanılan makine öğrenmesi yöntemlerini UNSW-NB15 veri seti kullanılarak dört farklı senaryoda performanslarını incelemek ve karşılaştırmaktır. Tez çalışması kapsamında, yeni kıyaslama veri seti olarak literatürde yerini alan UNSW-NB15 veri seti için Orange benzetim aracı kullanılarak makine öğrenmesi yöntemlerinin performansları karşılaştırılmıştır. Gerçekleştirilen benzetimler sonucunda, elde edilen değerler ile daha önce yapılmış çalışmalar karşılaştırılarak performans değerlendirmesi yapılmıştır. Sonuçlara göre özellik seçiminin yapılması test veri setinin bağımsız oluşturulduğu senaryolarda doğruluk performansını arttırmıştır. Özellik Seçimi (ÖS) uygulanarak elde edilen sonuçlardan en yüksek doğruluk oranına "Rassal Orman" yöntemi ulaşmıştır.en_US
dc.description.abstractInterest in the Internet has grown tremendously in recent years and increasing continuously. When epidemic disease conditions are added to this increase, it is focused on doing everything that affects human life via the internet. Just as the interest in the Internet has increased, the number of people who want to abuse this interest has also increased in the number of attacks carried out over the Internet and in activities capable of committing crimes, and it has continued to increase steadily. It has become much more difficult for organizations to maintain network security. Many different security systems are used to provide network security against attacks and criminals. Intrusion Detection Systems (IDS) is one of the security systems used for network security. IDS is also a subject of great interest in the academic world. In recent years, researchers have done many studies to reveal a more efficient and effective IDS. In the studies, it has been seen that the data sets used as the benchmark data set do not meet today's conditions and do not give the correct results in the evaluations. The UNSW-NB15 dataset, published in 2015, was created to solve this problem. The aim of this study is to examine and compare the machine learning methods used to make IDS more efficient and effective using the UNSW-NB15 data set. Within the scope of the study, the performances of machine learning methods were compared using the Orange tool for the UNSW-NB15 dataset, which took its place in the literature as a new benchmark dataset. In addition, performance evaluation was made with the results obtained and previous studies. Feature selection according to the results increased the accuracy performance in scenarios where the test data set was created independently. The "Random Forest" method reached the highest accuracy rate among the results obtained by applying Feature Selection (PS).en_US
dc.identifier.endpage60en_US
dc.identifier.startpage1en_US
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=5XiSE4yCP_gmnukpMEp65Qgtoe_8_sOLsyw8lM18UrTEjLlFmM0klzD2PxTGs4nU
dc.identifier.urihttps://hdl.handle.net/20.500.12684/11053
dc.identifier.yoktezid711278en_US
dc.institutionauthorTürkyılmaz, Yasin
dc.language.isotren_US
dc.publisherDüzce Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolen_US
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleSaldırı tespitinde makine öğrenmesi ve özellik seçiminin performansa etkisien_US
dc.title.alternativeThe effect of machine learning and feature selection on performance in attack detectionen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
711278.pdf
Boyut:
759.94 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text

Koleksiyon