Uygulama
İlk olarak, YSA ile Çarpma İşlemi, ardından Altın (Ons) Fiyat Tahmini (Öngörü) ve Gögüs Kanseri Verilerinin Çözümlenmesi (Sınıflandırma) başlıkları altında sizlere 3 örnek sunacağım.
1.YSA ile Çarpma İşlemi
Çarpma işlemi doğrusal olmayan bir işlemdir ve yapay zekâ için zor bir problemdir. Bu örnekte 1 ile 10 arasındaki sayıların çarpım işlemi YSA’ya öğretilmiştir. Çarpma işleminde iki giriş(x ve y) ve bir çıkış(z) vardır. Eğitim veri setinde 20 adet rastgele sayı seçilerek YSA Modeli kurulmuştur. Bu model üzerinden Test veri seti için yine 20 adet rastgele sayı seçilerek sistemin performansı ölçülmüştür.
Öngörü performansını doğrudan etkilediği için; Mimari Yapı, Öğrenme Algoritması, Aktivasyon Fonksiyonlarının seçimi önem arz etmektedir.
Öğrenme algoritması: Levenberg-Marquart,
Aktivasyon Fonksiyonları: Tanjant Sigmoid (Girdi ile Gizli Katman Arası) ve Purelin (Gizli ile Çıktı Katman Arası)
Gizli Nöron Sayısı: 1-10 arasında (En İyi Perf Göre Seçiliyor)
Performans Ölçütü: Root Mean Square Error – RMSE, (Hata Kareler Ortalamasının Karekökü HKOK)
Veri Seti Tablosu
No | Eğitim Giriş Verisi |
Eğitim Çıkış Verisi |
Test Giriş Verisi |
Test Çıkış Verisi |
||
X | Y | Z | X | Y | Z | |
1 | 4 | 5 | 20 | 4 | 3 | 12 |
2 | 7 | 4 | 28 | 3 | 2 | 6 |
3 | 0 | 1 | 0 | 0 | 9 | 0 |
4 | 6 | 4 | 24 | 5 | 6 | 30 |
5 | 9 | 1 | 9 | 3 | 10 | 30 |
6 | 4 | 5 | 20 | 10 | 10 | 100 |
7 | 1 | 9 | 9 | 7 | 7 | 49 |
8 | 6 | 9 | 54 | 3 | 5 | 15 |
9 | 6 | 0 | 0 | 3 | 7 | 21 |
10 | 3 | 1 | 3 | 8 | 1 | 8 |
11 | 6 | 1 | 6 | 2 | 2 | 4 |
12 | 7 | 5 | 35 | 6 | 7 | 42 |
13 | 3 | 5 | 15 | 8 | 0 | 0 |
14 | 7 | 8 | 56 | 2 | 5 | 10 |
15 | 3 | 3 | 9 | 4 | 3 | 12 |
16 | 3 | 7 | 21 | 1 | 8 | 8 |
17 | 9 | 8 | 72 | 4 | 7 | 28 |
18 | 9 | 9 | 81 | 6 | 1 | 6 |
19 | 2 | 9 | 18 | 3 | 10 | 30 |
20 | 10 | 8 | 80 | 9 | 4 | 36 |
Performans Tablosu
Gizli Katmandaki Nöron Sayısı |
En İyi Performans Değerleri |
1 | 0,01283182 |
2 | 0,000374943 |
3 | 8,47031E-07 |
4 | 1,15522E-08 |
5 | 5,71441E-08 |
6 | 7,65397E-07 |
7 | 1,50007E-08 |
8 | 1,5496E-15 |
9 | 9,82129E-12 |
10 | 9,24E-17 |
Girdi tabakasındaki nöron sayısı (x ve y olmak üzere) 2 tabaka, gizli tabakadaki nöron sayısı minimum Rmse değerine sahip olacak şekilde 1 ile 10 arasında değiştirilmiş olup, çıktı tabakasındaki nöron sayısı (z olmak üzere) 1 tabakadan oluşmuş olup toplamda 10 model denenmiştir. En iyi model en küçük Rmse değerine sahip 2-10-1 modeli olup olduğu gözlenmiş ve çıktıları aşağıda verilmiştir.
Veri Seti | Yöntem | Model | RMSE |
Rasgele Çarpma Veri Seti | İleri Beslemeli YSA | (2-10-1) | 0,0000000000000000924 |
2.Altın (Ons) Fiyat Tahmini
Bu çalışmada Altın (ons) fiyatları ele alınmıştır. Altın (ons) fiyatları 2 Ocak 2012 ile 8 Ağustos 2012 tarihleri arasındaki günlük altın kapanış değerleri içeren 156 gözlemden oluşmaktadır. Bu seri için ilk 140 gözlem (2 Ocak 2012 – 17 Temmuz 2012) belirlenen eğitim algoritması ile ağ eğitilmiş, sonraki 16 gözlem (18 Temmuz 2012 – 08 Ağustos 2012) ise tahmin edilerek gerçek değerler ile karşılaştırılarak modelin performansı ölçülmüştür. Altın (Ons) Fiyat verileri Türkiye Cumhuriyeti Merkez Bankasından alınmıştır.
Uygulama Adımları;
- Veri setinin ilk 140 gözlemi eğitim, son 16 gözlemi test için kullanılmıştır.
- Öğrenme Algoritması: Levenberg-Marquardt
- Aktivasyon Fonksiyonları: Tan-Sigmoid ve Doğrusal fonksiyonlardır.
- Girdi ve gizli tabakalardaki nöron sayısı 1 ile 12 arasında değiştirilmiş olup, çıktı tabakasındaki nöron sayısı 1 olarak sabit alınarak altın (ons) fiyat serisi için 144 model denenmiştir.
Performans Ölçütü
- Performans ölçütü olarak Hata Kareler Ortalamasının Karekökü kullanılmıştır.
Veri Seti | Yöntem | Model | HKOK |
Altın (Ons) | İleri Beslemeli YSA | (1-4-1) | 11,0558 |
Bu tabloda en iyi YSA modelini görmekteyiz. Burada Altın (ons) fiyatları için ileri beslemeli sinir ağları ile bulunan en iyi mimari 1-4-1’dir. Bu bize sinir ağındaki girdi tabakasında 1 nöronun, gizli tabakada 4 nöronun bulunduğu mimari yapının en iyi öngörü sonuçlarını veren yapı olduğunu göstermektedir. Bu mimari ile elde edilen öngörülerin test kümesi üzerinden hesaplanan hata kareler ortalamasının karekökü değeri 11,0558’tir.
Gözlem ve Tahmin Sonuçları
Test kümesi üzerinde elde edilen grafikte, Gözlem ve Tahmin değerleri yer almaktadır. Mavi renk gözlem değerlerini, Yeşil renk ise Tahmin değerlerini içermektedir. Tahmin değerlerinin, gözlem değerlerine yaklaştığı ve kırılmaları yakaladığı görülmüştür.
Bu çalışma, 10. Uluslararası İstatistik Öğrenci Kolokyumun da tarafımdan sözlü sunum olarak sunulmuştur.
3. Gögüs Kanseri Verileri ile Sınıflandırma
Bu çalışmada kullanılan göğüs kanseri verisi 9 adet özellik, 2 adet sınıf bilgisi içeren 699 gözlemden oluşan bir veri setidir.
Bağımsız Değişkenler
- Kütle kalınlığı (Clump thickness)
- Hücre büyüklüğünün üniformluğu (Uniformity of cell size)
- Hücre şeklinin üniformluğu (Uniformity of cell shape)
- Marjinal yapışma (Marginal Adhesion)
- Tek epithelial hücre büyüklüğü (Single epithelial cell size)
- Yalın çekirdek (Bare nuclei)
- Hafif kromatin (Bland chomatin)
- Normal Nükleoli (Normal nucleoli)
- Mitozlar (Mitoses)
Bağımlı Değişkenler
- İyi Huylu (Bening)
- Kötü Huylu (Malignant)
Veri setine ait dağılımlar aşağıdaki tablo da gösterilmiştir.
Eğitim Kümesi | Test Kümesi | Toplam | ||||
Sınıf | Gözlem | Yüzde | Gözlem | Yüzde | Gözlem | Yüzde |
İyi Huylu | 394 | 0,66 | 64 | 0,61 | 458 | 0,66 |
Kötü Huylu | 200 | 0,34 | 41 | 0,39 | 241 | 0,34 |
Toplam | 594 | 105 | 699 |
Uygulama adımları;
- Uygulama Göğüs Kanseri verileri ele alınmıştır.
- Kanser verileri 699 gözlemden oluşmaktadır.
- Bu veri seti için 594 gözlem eğitim algoritması ile ağ eğitilmiş, sonraki 105 gözlem ise tahmin edilerek sınıflandırma yapılmış ve gerçek sonuçlar ile karşılaştırılarak modelin performansı ölçülmüştür.
- Kanser verileri Matlab R2012a paket programı içerisinden alınmıştır.
- Veri setinin 594 gözlemi eğitim, 105 gözlem ise test için kullanılmıştır.
- Yapay sinir ağı mimarisi girdi, gizli ve çıktı katmanı olmak üzere 3 katman kullanılmıştır.
- Girdi katmanında nöron sayısı 9, Gizli katmandaki nöron sayısı 1 ile 10 arasında değiştirilmiş olup, çıktı tabaksındaki nöron sayısı 2 olarak alınmıştır.
- Öğrenme algoritması Levenberg-Marquard geri yayılım öğrenme algoritmasıdır.
Veri Seti | Yöntem | Model | |
Kanser Verisi | İBYSA | 9-2-2 | |
Gözlenen | Tahmin | ||
İyi Huylu | Kötü Huylu | Yüzde | |
İyi Huylu | 61 | 3 | 0,953 |
Kötü Huylu | 0 | 41 | 1,000 |
Toplam Yüzde | 0,971 |
Yapay sinir ağlarının başarı ile kullanıldığı alanlardan birisi de sınıflandırma problemleridir. Bu çalışmada, göğüs kanserine ilişkin veri setindeki bağımsız değişkenler kullanılarak sınıflandırma yapılmıştır.
Test veri setinde sonuçlarına göre;
- İyi Huylu dağılımına sahip 64 birimin YSA tahmininde 61 tanesi yani %95’i İyi Huylu, 3 tanesi ise Kötü Huylu olarak sınıflandırılmış,
- Kötü Huylu dağılımına sahip 41 tanenin tamamı ise doğru olarak sınıflandırılmıştır.
- Sınıflandırma başarısı %97 olarak görülmüştür.
Yazının sonuna gelenler için, Eray Aktokluk arkadaşımınızın Yapay Sinir Ağı Anlatımı videosunuhttps://www.youtube.com/watch?v=NkUY-VBQfTo tavsiye ediyorum.
Görüş, öneri ve katkıda bulunmak ve beraber öğrenmek isterseniz uslumetin@gmail.com ‘dan bana ulaşabilirsiniz. Görüşmek üzere.
Not: Bu yazı ilk kez 5 Ekim 2015 tarihinde Kod5.org sitesinde yayınlanmıştır.
Kaynakça
1- Yapay Sinir Ağları İlkeleri; Zekâi Şen; Su Vakfı Yayınları
2- Tek Değişkenli Zaman Serileri Analizine Giriş; Prof. Dr. Süleyman Günay, Dr. Erol Eğrioğlu, Çağdaş Hakan Aladağ; Hacettepe Üniversitesi Yayınları – 2007
3- Şifrelerin Matematiği: Kriptografi; Canan Çimen, Sedat Akleylek, Ersan Akyıldız
ODTU Yayıncılık (4. Baskı) Temmuz 2009
4- Yapay Sinir Ağları Kullanılarak Altın(Ons) Fiyat Tahmini; Metin USLU; 10. Uluslarararası İstatistik Öğrenci Kolokyumu Sözlü Sunumu; Mayıs 2013
5-Gögüs Kanseri Verilerinin YSA ile Çözümlenmesi; Metin USLU;2013