Yapay Zeka ve Yapay Sinir Ağları Yaklaşımı
Yapay sinir ağları, insan beyninin modellenerek taklit edilmesi yoluyla geliştirilmiş yapay zeka yaklaşımıdır. Söz konusu modellemede insan beyninde bulunan nöronlar (biyolojik sinir hücreleri) temel alınmıştır. Sinir ağlarının tıp bilimi ile elde edilen verilerle matematiksel olarak modellenmesi sonucu bir çok mühendislik uygulamasında yaygın olarak kullanılan sinir ağları ortaya çıkmıştır.
Sorunların çözümünde farklı türdeki yapılarda bilgileri hızlı şekilde tanımlamak ve algılamak gerekmektedir. Yapay sinir ağları yaklaşımı bu konuda oldukça başarılıdır. Ayrıcı bu yaklaşımda tanıma ve tahmin etme gibi becerileri öğrenerek geliştirme de mümkündür.
Bilgisayar sistemleri insanlara kıyasla hız, doğruluk, işlem gücü ve performans yönünden daha başarılı olabilmektedir. Ancak buna rağmen bilgisayarlar henüz insan beyni kadar kapsamlı öğrenme yeteneğine sahip değildir. Yapay sinir ağları söz konusu güç ve yeteneği makinelere kazandırmayı amaçlamaktadır.
Bunun gibi özelliklerden dolayı yapay sinir ağları yaklaşımı, klasik çözüm yöntemleri ile birlikte zor problemler için kullanılabilir bir yöntem haline gelmiştir.
BİYOLOJİK NÖRONLAR
Makine öğrenmesi için insan zekası modellenirken nöronlar (sinir hücreleri) örnek alınmıştır. İnsanlarda nöronlar yapısal olarak dendrit, akson, çekirdek ve bağlantılar olmak üzere dört kısımdan oluşmaktadır.
Dendrit
Diğer nöronlardan aktarılan sinyalleri, bulunduğu nöronun çekirdeğine aktarmaktan sorumludur.
Akson
Çekirdekten aldığı toplanmış sinyalleri diğer nöronlara aktarmaktan sorumludur. Söz konusu sinyaller ön işlemden geçtikten sonra iletilmektedir.
Bağlantılar
Yeni üretilen sinyalleri diğer nöronlara iletmekten sorumludur.
Çekirdek ile dendrit arasında iletişim bazı durumlarda farklılık göstermektedir. Örneğin bazı dendritler dominant, bazıları da pasif iletişim kurmaktadır.
Soma
Dendrit ile gönderilen sinyalleri toplayan ve bu sinyalleri aksona ileten merkezdir. Çekirdek olarak olarak da bilinmektedir.
Sinapsis
Aksondan gelen sinyalleri ön işlemden geçirmekten ve diğer nöronların dentdritlerine aktarmaktan sorumludur.
KULLANIM ALANLARI
Yapay sinir ağları bilgi saklama, hesaplama yapma, daha önce sunulan örnekleri kullanarak sorun öğrenebilme ve yeni sorunlara çözüm üretebilme özelliklerine sahiptir.
Bundan dolayı aşağıdaki gibi birçok alanda yapay sinir ağları kullanılmaktadır.
Adli bilişim
Biyomedikal
Dayanıklılık analizi
Denetim
Dil tercüme
El yazısı tanıma
Elektrik işareti tanıma
Finans
Görüntü işleme
Görüntü ve veri karşılaştırma
Hava durumu tahminleme
Kalite kontrolü
Maliyet analizi
Otomatik araç denetimi
Otomatik pilot uygulamaları
Parmak izi tanıma
Plaka tanıma
Robotik
Ses tanıma
Siber güvenlik
Sinyal işleme
Sistem modelleme
Sözcük tanıma
Uçuş simülasyonları
Üretim işlem kontrolü
Yol izleme
Yüz eşleştirme
AVANTAJLAR VE DEZAVANTAJLAR
Yapay sinir ağlarında en güçlü ve önemli özellik sistemin öğrenme yeteneğine sahip olmasıdır. En önemli eksiklik ise ağın sistemin çalışmasını yeterli düzeyde analiz edememesi ve öğrenme sürecinde başarısız olma ihtimalidir.
Avantajlar
Eğitilen veri dışındaki verilere de anlamlı yanıtlar üretilmektedir.
Doğrusal olmayan alt birimler ile ilgili problemlerin çözümüne imkan sunmaktadır.
Yapay sinir ağı hücrelerinden herhangi birinde sorun oluşması durumunda ana sistem çalışmasına güvenli şekilde devam edebilmektedir.
Sorunları öğrenerek benzer durumlarda mantıklı kararlar vermektedir.
Klasik yöntemlerden farklı şekilde çalıştığından bu yöntemlerden kaynaklanan hataları içermemektedir.
Hücrelerden işlevini kaybeden olması durumunda anlamlı bilginin kaybolmasına sebep olmaz.
Bellekte veri dağıtık olarak tutulmaktadır.
Eğitim sırasında kullanılan örnek veri miktarı filtrelenir ve artırılırsa yüksek doğruluk sunmaktadır.
Eksik veri olsa dahi anlamlı çıktı üretebilmektedir.
Ayrı bir matematik modele ihtiyaç duymamaktadır.
Hücrelerin bozulması durumunda bile hata toleransına uyum sağlanmaktadır.
Algılama amaçlı kullanılmektedir.
Örüntü tanıma temelli çalışabilmektedir.
Sınıflandırma problemlerinde yüksek doğruluklu çözüm sunabilmektedir.
Kendi kendine öğrenme ve organizyon mümkündür.
Klasik yöntemlere göre daha hızlı çözüm sunabilmektedir.
Dezavantajlar
Bazı ağlar haricinde yapay sinir ağları için kararlılık analizi yapılamamaktadır.
Bir probleme çözüm üretildiğinde ilgili çözümün nasıl ve neden olduğuna dair detaylı bilgi alınamamaktadır.
Yapay sinir ağları sayısal veri ile çalıştığından öncelikle verinin yüksek doğruluklu yöntemlerle sayısallaştırılması gerekmektedir.
Yapay sinir ağı oluşturmadan önce belirlenen parametreler farklı uygulama alanlarında istenmeyen sonuçlar doğurabilmektedir.
Eğitimin ne zaman sonlanacağına ilişkin genel bir kural bulunmamaktadır.
Bazı durumlarda paralel çalışma gereksinimden dolayı donanım bağımlılığı söz konusudur.
TARİHÇE VE GELECEK
Tarihçe
1969: Doğrusal ilişkilendiricilerin önerilmesi
1972: Korelasyon matris belleğinin geliştirilmesi
1974: Geriye yayılım modelinin tasarlanması
1978: ART modelinin tasarlanması
1982: Kohonen öğrenmesinin geliştirilmesi
1982: SOM modellinin tasarlanması
1982: Hopfield ağlarının geliştirilmesi
1982: Çok katmanlı algılayıcının geliştirilmesi
1984: Boltzman makinesinin tasarlanması
1985: Delta öğrenme kuralının tasarlanması
1988: RBF modelinin tasarlanması
1988: PNN modelinin tasarlanması
1991: GRNN modelinin tasarlanması
Gelecek
Günümüzde tüm dünyada yapay sinir ağlan ile ilgili olarak birçok araştırma yapılmaktadır. Yapay sinir ağları daha yüksek doğruluk ve daha yüksek hız sunacak şekilde yeniden tasarlanmaktadır. Sorunların çözümüne yönelik farklı sinir ağı mimarileri tasarlanmakta ve geliştirilmektedir.
Daha verimli öğrenme algoritmaları geliştirilmekte, zamana göre değişen modellere karşılık verebilen ağlar tasarlanmaktadır.
Yapay sinir ağları donanımsal olarak gerçekleşmemekte, silikon sinir ağları geliştirilmektedir. Sinir ağı yongaları tasarlanmakta, sadece bu amaçla çalışan devreler üretilmektedir. Burada alternatif olarak optik yonga mimarileri düşünülmektedir.
FPGA ve ASIC gibi teknolojiler ile donanım tabanlı olarak daha verimli çalışan yapay sinir ağları tasarlanmaktadır.
TEMEL BİLEŞENLER
Daha önce belirtildiği gibi yapay sinir ağı hücreleri, biyolojik sinir hücrelerine benzer yapıda çalışmaktadır. Ağlar aralarında bağlantı kurarak daha büyük sistemleri oluşturmaktadır.
Birbirine bağlı düğüm ve işlem elemanları bulunan yapay sinir ağlarında genellikle eş zamanlı çalışan alt bileşenler bulunmaktadır.
Biyolojik ağlara benzer şekilde yapay ağların da giriş sinyallerini aldıkları, bu sinyalleri toplayıp işledikleri ve çıktıları ilettikleri alt birimleri bulunmaktadır.
Yapay sinir ağları, insan beynindekine benzer şekilde genelleme, öğrenme, uyum sağlama gibi yeteneklere sahiptir. İnsan beyninde öğrenme işlemi yeni aksonlar üreterek, söz konusu aksonları uyararak ve var olan aksonların güçlerini değiştirerek gerçekleşmektedir.
Biyolojik sinir ağlarındaki sinir hücrelerinin yapay sinir ağlarındaki karşılığı proses elemanlarıdır. Her proses elemanı; girdi, ağırlık, toplama fonksiyonu, aktivasyon fonksiyonu ve çıktı olmak üzere 5 bileşen içermektedir.
Girdiler
Ağın öğrenmesi istenen bilgilerdir. Bu girdiler ile elde edilen veriler biyolojik sinir hücrelerinde olduğu gibi toplanmak üzere çekirdeğine gönderilmektedir.
Ağırlıklar
Yapay sinir ağı tarafından alınan girdilerin ağ üzerindeki etkisini belirleyen tanımlı katsayı değerleridir.
Her girdi için ağırlık verisi söz konusudur. Bir ağırlığın değerinin büyük olması o girişin ağa daha güçlü bağlanması veya önem derecesinin yüksek olmasını belirtmektedir.
Değerin küçük olması ise zayıf bağlanması ya da önemli olmaması anlamına gelmektedir.
Toplama Fonksiyonu
Ağ üzerindeki her bir ağırlığın ait olduğu girdilerle çarpımının toplamlarını eşik değeri ile toplayarak etkinlik işlevine göndermektedir. Bazı durumlarda toplama işlevi basit bir fonksiyondur. Bazı durumlarda da minimum, maksimum, çoğunluk veya normalizasyon temelli daha karmaşık algoritmalar olabilir.
Etkinlik Fonksiyonu
Toplama işleminin sonucunu zamana bağlı olarak değiştiren fonksiyondur.
Ölçeklendirme ve Sınırlandırma
Etkinlik fonksiyonunun sonuçları ölçeklendirme ve / veya sınırlandırma işlemlerinden geçebilmektedir. Bu ölçeklendirme basit olarak bir ölçek değeri ile etkinlik değerinin çarpımının sonucudur.
Sınırlandırma ise ölçeklenen sonuçların minimum ve maksimum sınırları aşmasını önleme sürecidir.
Çıkış Fonksiyonu
Etkinlik fonksiyonu sonucunun diğer nöronlara veya dış dünyaya gönderildiği kısımdır. Bir nöronun bir tek çıkışı bulunmaktadır. Bu çıkıştan kendinden sonra gelen herhangi bir sayıdaki diğer sinirlere giriş yapılabilmektedir.
ÖĞRENME
Yapay sinir ağı öğrendikten sonra ağa daha önce verilmeyen girişler sunularak, sinir ağı test edilmektedir. Eğer ağ daha önce karşılaşmadığı bu örneklere de iyi sonuç veriyorsa “ağ sorunu öğrenmiş” anlamını taşımaktadır.
Bu durumu sınamak için probleme ait veriler eğitim seti ve test seti olarak iki gruba ayrılmalıdır. Eğitim seti ağın öğrenmesinin sağlanması için girdi ve çıktı değerleri sisteme sunulan verilerdir. Test seti ise eğitim setinden farklı olarak sisteme daha önce sunulmamış; çıktısı bilinmesine rağmen sisteme sadece girdilerin sunulduğu verilerdir.
Verilerin ne kadarının eğitim seti ne kadarının test seti olması gerektiği konusunda belirli bir kural bulunmamaktadır. Bu aşamada önem verilmesi gereken durum özellikle eğitim setinin problem uzayını kapsayacak şekilde seçilmesidir.
Öğrenme Süreci
Ağ tarafından öğrenilmesi istenen probleme ait örneklerin toplanmaktadır.
Toplama ve etkinlik fonksiyonları belirlenmektedir.
Ağın topolojik çıktısı belirlenmektedir.
Ağırlıkların başlangıç ve eşik değerleri atanmaktadır.
Eğitim setindeki örnekler sunulmaktadır.
Eğitim setinden sunulan girdiler için ağın çıktısı hesaplanmaktadır.
Ağın çıktısı beklenen çıktı ile karşılaştırılarak hata değerleri hesaplanmaktadır.
Geri hesaplama fonksiyonu çalıştırılarak hatanın azalması için ağırlık güncellenmesi gerçekleştirilmektedir.
Danışmanlı Öğrenme
Öğretene gereksinim bulunmayan öğrenme yöntemidir. Probleme ait olan girdi değerleri için çıktı değerlerinin de yapay sinir ağına verilmesi gerekmektedir. Bu tip öğrenmede sisteme verilen girdiler modelde bulunan ağırlıkların en uygun değeri ile güncellenerek bulunmaktadır. Ağ tarafından bulunan çıktı değeri ile gerçek değer arasındaki fark ile hata hesaplanmakta ve buna göre ağırlık değerleri belirlenmektedir.
Danışmansız Öğrenme
Bu yöntemde elde sadece girdi değerleri olduğundan yapay sinir ağına sadece söz konusu değerler sunulmaktadır. Girdi değerleri ağ tarafından sınıflandırılarak öğrenme süreci gerçekleşmektedir.
Takviyeli Öğrenme
Bu yöntemde de öğretici bulunmaktadır. Ancak danışmanlı öğrenmeden farklı olarak sisteme çok fazla ayrıntı verilmemektedir. Sonuçta her iterasyonunda elde edilen değerin iyi veya kötü olduğu konusunda yapay sinir ağına bilgi verilmektedir. Verilen bilgilere göre ağ öğrenerek verileri tekrar düzenlemektedir.
YAPAY SİNİR AĞI TÜRLERİ
Konvolüsyonel Sinir Ağları (Convulational Neural Network)
İlk olarak önerilen birçok katmanlı ileri beslemeli yapay sinir ağıdır. Görüntü işleme, konuşma tanıma ve doğal dil işleme alanlarında yaygın olarak kullanılmaktadır.
CNN’de öğrenme özelliği, kıvrımlı katmanların ve havuzlama işlemlerinin alternatif hale getirilmesi ve istiflenmesiyle elde edilir. Kıvrımlı katmanlarda birden fazla yerel çekirdek kullanarak ham giriş verileri ile kıvrımlı filtreler ve değişmez yerel özellikler oluşturulmaktadır. Sonraki katmanlarda da en önemli özellikler ayıklanmaktadır.
Derin öğrenme, akıllı üretim için gelişmiş analitik sağlamıştır. Ayrıca işlemleri birleştirerek ham giriş verilerinin üzerinde maksimum havuzlama ve ortalama havuzlama getirileri sunmaktadır. Maksimum havuzlama, havuzlama işlemi sırasında seyrek özellikleri ayıklamak için iyi uygundur.
Çok katmanlı özellik öğrenmeden sonra, tam bağlı katmanlar iki boyutlu özellik matrisini tek boyutlu bir vektöre dönüştürmektedir.
Her durumda entropi değerleri hesaplanarak hata oranı ve doğruluk tespit edilebilir.
Tekrarlayan Sinir Ağı (Recurrent Neural Network)
Daha çok dil çevrimleri için kullanılmakla birlikte ardışık yapıdan bir sonraki noktanın tahminini sağlamaktadır.
Örneğin ekonomik veriler için dizi şeklinde zaman serileri ile girdi olarak kullanılarak sonraki bir zamanda değerlerin hangi durumda olacağının tahmin edilmesi olarak gösterilebilmektedir.
Kurulacak bir cümlede art arda gelen kelimelerin arkasından cümlenin devamının nasıl olacağını gösteren kelimenin tahmini de örnek olarak verilebilir.
İki tür RNN vardır bunlar: İki yönlü RNN (Bidirectional RNNs) ve Derin RNN (Deep RNN)
Uzun-Kısa Süreli Hafıza (Long Short-Term Memory)
RNN mimarilerinde diziler arasında boşluklar olması, sonraki dizenin tahmin edilmesi sürecini zorlaştırmaktadır. Bu durum RNN türü ağlar için dezavantajlı bir durumdur. Bu aşamada yapılan araştırmalar söz konusu durumu ortadan kaldıracak uzun ve kısa süreli hafıza olan LSTM’i ortaya çıkarmıştır.
Aslında LSTM ağlarının RNN ağlarına çok benzerler. LSTM içerisinde ek olarak hafıza hücreleri bulunmaktadır. Söz konusu hücre önceki durumu ve girdi bilgisini tutmaktadır. Ayrıca bu hücre hangi verinin tutulacağına veya hangi verinin silineceğine karar vermektedir.
Sonraki aşamada ise önceki durumu mevcut bellek ile giriş verisini birleştirilmektedir. Böyle bir yaklaşımla uzun vadeli bağımlılıkların ortadan kaldırılarak veri dizilerinin devam ettirilmesi sağlanmaktadır.
Kısıtlı Boltzmann Makinesi (Restricted Boltzmann Machine)
Kısıtlı Boltzmann makinesi, görünür ve gizli nöral iki katmandan oluşan ağdır. Sınıflandırma, regresyon, boyut azaltma, işbirlikçi filtreleme, öğrenme ve modelleme amaçlı kullanılmaktadır. Ayrıca derin inanç ağlarının temelini oluşturmaktadırlar.
RBM üzerindeki düğümler birbirlerine katmanlar halinde bağlıdırlar.
Aynı katmandaki iki düğüm arasında bağlantı ve iletişim yoktur. Her düğümde veri işlenmekte ve söz konusu veriyi iletme konusunda stokastik kararlar alınmaktadır.
KAYNAKÇA
http://www.alikoker.com.tr/yapay-sinir-aglari
Anderson, J.A.; Pellionisz, A.; and Rosenfeld, E. (Eds) 1990, Neurocomput¬ing 2: Directions for research, The MIT Press.
Chakrapani, J. and Skorin-Kapov, J. 1992, “A connectionist approach to the quadratic assignment problem,” Computers and Operations Research, Vol. 19, №3/4, pp. 287–295.
Dagli, C. H.; Kumara, S. R. T.; and Shin, Y. C. 1991, Intelligent Engineering Systems Through Artificial Neural Networks, ASME Press, Fairfield, NJ.
Damodran, P.S.; Kolli, S.S.; and Alexander, S.M. 1993, “The investigation of new approaches to business data analysis,” Computers and Industrial Engineering, Vol. 25, №1–4, pp. 545–548.
De Ca.valho, Luis A. V. and Barbosa, V. C. 1989, “Towards a stochastic neu¬ral model for combinatorial optimization,” in Proceedings of the IEEE Inter¬national Joint Conf on Neural Networks, Washington D.C., Vol.2, pp.587.
DeSilets, L.; Golden, B.; Kumar, R.; and Wang, Q. 1992, “A neural network model for cell suppression of tabular data,” Working paper, College of Busi¬ness and Management, University of Maryland, College Park, MD.
Glover, F. 1994, “Optimization by ghost image processes in neural networks,” Computers and Operations Research , Vol. 21, №8, pp. 801–822.
Jagota, A. 1996, “An adaptive, multiple restarts neural network algorithm for graph coloring,” European Journal of Operational Research, In Press.
Kavcioğlu Ş. — İstanbul İktisat Dergisi, 2019. Kurumsal Kredi Skorlamasında Klasik Yöntemlerle Yapay Sinir Ağı Karşılaştırması
Keskenler M., Keskenler E. — Takvim-i Vekayî, Geçmişten Günümüze Yapay Sinir Ağları ve Tarihçesi
Lee, B. W. and Sheu, B. J. 1990, “Combinatorial optimization using competi¬tive Hopfield neural networks,” in Proceedings of the IEEE International Joint Conference on Neural Networks, Washington D.C., Vol. 2, pp. 627630.
Lee, J.K. and Jhee, W.C. 1994, “A two-stage neural network approach for ARMA model identification with ESCAF,” Decision Support Systems, Vol. II, №4, pp. 461–479.
Lee, T.H.; White, H.; and Granger, C.W.J. 1993, “Testing for neglected non¬linearity in time series models,” Journal of Econometrics, Vol. 56, pp. 269- 290.
Looi, C. 1992, “Neural network methods in combinatorial optimization,” Computers and Operations Research, Vol. 19, №3/4, pp. 191–208.
Meriç E. — Bursa Uludağ Üniversitesi, 2019. Yapay zekâ yöntemleriyle havalimanlarında personel planlaması
Öztürk K., Şahin M. — Takvim-i Vekayî, 2018. Yapay Sinir Ağları ve Yapay Zekâ’ya Genel Bir Bakış
Ramanujam, J. and Sadayappan, P. 1988, “Optimization by neural networks,” in Proceedings of the IEEE International Conference on Neural Networks, San Diego, CA, Vol. 2, pp. 325332.
Tank, D. W. and Hopfield, J. J. 1986, “Simple ‘neural’ optimization networks: An A/D converter, signal decision circuit, and linear programming circuit,” IEEE Transaction on Circuits and Systems, Vol. CAS33, №5 (May), pp. 533–541.
Yılmaz Ş., Özcan B. 2019 — Uluslararası Sosyal Bilimler Akademi Dergisi, Yapay Sinir Ağı Ve Regresyon İle Satın Alma Gücü Paritesine Göre Kişi Başı Gayrisafi Yurt İçi Hasıla Tahmini