Emre Mutlu, Yeni Bir Veri Seti ve Derin Öğrenme Modelleri ile Görüntü Tabanlı Zararlı Yazılım Aile Sınıflandırması

Yüksek Lisans Adayı: Emre Mutlu

EABD: Siber Güvenlik

Tarih: 17.05.2024 / 11:00

Yer: A-212

 

Özet: Zararlı yazılımlardan kaynaklanan güvenlik ihlalleri artmaya devam etmekte ve gelecekte önemli bir güvenlik endişesi olacağı değerlendirilmektedir. Zararlı yazılım oluşturmak ise yeni teknikler sayesinde eskiye nazaran daha kolaydır. Zararlı yazılım sayılarındaki artış nedeniyle zararlı yazılım tespiti, güncel bir araştırma konusu olmaya devam etmektedir. Binlerce zararlı yazılımın manuel yöntemlerle analiz edilmesi mümkün olmadığından derin öğrenme algoritmaları      zararlı yazılım tespiti konusunda sıklıkla kullanılmaya başlanmıştır. Zararlı yazılımları tespit etmedeki asıl zorluklardan birisi, makul bir süre içerisinde manuel metotlar kullanmadan onları tanımlayabilecek yöntemler geliştirmektir. Öte yandan akademik amaçlarla yeni bir zararlı yazılım veri seti hazırlamak da oldukça zordur. Bu nedenle MamMalware adında güncel ve yeni bir veri seti oluşturduk ve MamMalware'den farklı sayı ve ailelerden iki özel veri seti hazırladık. Veri setleri herkese açıktır. Tüm örnekler gri tonlamalı görüntü dosyalarına çevrildi ve ayrıca örneklerin işlem kodu dizileri de çıkarıldı. Görüntü dosyaları ve işlem kodu dizileri girdi olarak kullanıldı. Daha sonra yeni veri setlerimiz üzerinde 2 ve 3 katmanlı Evrişimsel Sinir Ağları (CNN) deneylerini uyguladık. Ayrıca ResNet152 ve VGG19 önceden eğitilmiş modellerle transfer öğrenme yöntemlerini kullanarak deneyler gerçekleştirdik. Sonuç olarak transfer öğrenme modelleri %94 test doğruluğu ile en iyi sonuçları elde etti. Ayrıca daha önce yapılan bir çalışmanın sonuçlarını da doğruladık. Bunun dışında bu çalışmada kullanılan veri seti boyutunun, belirli bir büyüklükten sonra doğruluk üzerinde göz ardı edilebilir bir etkisi olduğunu gözlemledik.