
Makine Öğrenmesi Modellerini Kıyaslama
11 Temmuz 2025
Monte Carlo Analizi
11 Temmuz 2025
*Hazırlayan: Umut Kale
Bu video, Titanic veri seti üzerinde Random Forest modeli kullanarak hangi özelliklerin (feature importance) yolcuların hayatta kalıp kalmamasını tahmin etmede ne kadar etkili olduğunu incelemektedir. Böylece bir makine öğrenmesi modelinde girdilerin modelin sonucu üzerindeki etkisi çıkarılabilir.
Veri Seti ve Ön İşleme: Kaggle’dan alınan Titanic veri seti kullanılmıştır. Eksik yaş ve liman verileri doldurulmuş, cinsiyet ve liman gibi kategorik değişkenler sayısal formata çevrilmiştir. Hedef değişken “survived” (hayatta kalıp kalmama) olarak tanımlanmıştı
Model ve Analiz: Veri seti %80 eğitim, %20 test olarak ikiye ayrılmıştır. 100 ağaçlık bir Random Forest modeli kurulmuş ve model eğitildikten sonra “feature importance” özelliğiyle her bir değişkenin önem düzeyi elde edilmiştir
•Sonuçlar: En önemli özellikler sırasıyla cinsiyet, bilet ücreti ve yaş olarak çıkmıştır. Modelin kadınların hayatta kalma şansının daha yüksek olduğunu öğrendiği belirtilmiştir ki bu Titanic’in gerçek hikayesiyle de uyumludur. Bu önem değerleri ayrıca bir bar grafiği ile görselleştirilmiştir
Video, veri bilimi projelerinde sadece model kurmanın değil, aynı zamanda modeli yorumlamanın da ne kadar etkili olduğunu göstermektedir




