Yüksek Lisans Adayı: Barış Deniz Sağlam
EABD: Veri Bilişimi
Tarih: 29.08.2024 / 10:00
Yer: A-212
Özet: Bu tez, küçük ve orta büyüklükteki büyük dil modellerinin çok adımlı soru yanıtlamadaki kullanımını incelemektedir. Gerçek dünya uygulamalarında hesaplama kaynakları ve gecikme önemli kısıtlamalar sunduğundan, daha küçük dil modelleri genellikle tercih edilir. Ancak, bu daha küçük modeller genellikle GPT-4 gibi daha büyük muadillerinin sahip olduğu geniş parametrik bilgi ve ileri düzeydeki akıl yürütme yeteneklerinden yoksundur. Bu araştırma, bu sınırlamaları telafi etmek için yapılandırılmış bir bilgi ve ilişkiler temsili sunan bilgi grafikleri kullanımı başta olmak üzere çeşitli artırma stratejilerini araştırmaktadır. Bu çalışma şu konuları incelemektedir: bilgi grafiklerinin büyük dil modellerinin çok adımlı soru yanıtlama yeteneklerini iyileştirip iyileştirmediği, varlık-ilişki üçlülerinin metin içeriğiyle bütünleştirilmesinin etkisi ve görevle ilgili geri bildirimle denetimli ince ayar veya pekiştirmeli öğrenme gibi uyarlama yöntemlerinin ortak varlık-ilişki çıkarım performansını iyileştirip iyileştirmediği. Çalışma, ilgili varlık-ilişkilerin soruları yanıtlamadan önce çıkarılmasını kolaylaştıran ve MuSiQue-Ans veri seti üzerinde daha az hesaplama gereksinimi ile performansı artıran, Bağlantı-Kur-Varlıklarla (CTE) adlı yeni bir yönlendirme tekniği sunmaktadır. Ek olarak, harici bir bilgi kaynağı olarak önceden oluşturulmuş bir bilgi grafiğinin kullanılması, temel sistemlere benzer sonuçlar göstermektedir. Genel olarak, bu tez, görece küçük dil modellerin yapılandırılmış bilgi entegrasyonu ve gelişmiş yönlendirme teknikleri ile geliştirilmiş soru yanıtlama performansına nasıl ulaşabileceğini göstererek alana katkıda bulunmaktadır.