İSTATİSTİKSEL YÖNTEMLERİN YENİ BAHARI: BÜYÜK DİL MODELLERİ (BDM)
DOI:
https://doi.org/10.17740/eas.stat.2025-V25-06Anahtar Kelimeler:
Büyük Dil Modelleri, İstatistiksel Öğrenme, Bayesci Çıkarım, Transformer, EM Algoritması, PCA, SVDÖzet
Büyük dil modelleri (LLM’ler), günümüz yapay zekâ uygulamalarının merkezinde yer alan ve insan benzeri dil üretme, anlama, akıl yürütme kabiliyetleriyle dikkat çeken derin öğrenme sistemleridir. Bu modellerin başarısının temelinde yalnızca derin sinir ağları değil, aynı zamanda güçlü bir istatistiksel altyapı bulunmaktadır. Bu makale, LLM’lerin ardındaki olasılık teorisi, istatistiksel öğrenme kuramı, Bayesci yöntemler, Markov zincirleri, beklenti–maksimizasyon algoritması (EM), boyut indirgeme (PCA, SVD), olasılıksal grafik modeller, varyasyonel çıkarım ve örnekleme yöntemleri (MCMC) gibi tüm temel istatistiksel teknikleri kapsamlı bir biçimde ele almaktadır. Ayrıca bu tekniklerin Transformer mimarisi ve modern LLM eğitim süreçlerinde nasıl kullanıldığı ayrıntılı olarak gösterilmiştir. Makale, doğal dil işleme, sağlık, finans, hukuk gibi alanlarda LLM tabanlı istatistiksel modellerin uygulamalarını da örneklerle incelemektedir.