Yapay Zeka ve Yapay Sinir Ağları Yaklaşımı

Yük. Müh. Muhammet Ali Köker
9 min readMar 20, 2021

--

Yapay sinir ağları, insan beyninin modellenerek taklit edilmesi yoluyla geliştirilmiş yapay zeka yaklaşımıdır. Söz konusu modellemede insan beyninde bulunan nöronlar (biyolojik sinir hücreleri) temel alınmıştır. Sinir ağlarının tıp bilimi ile elde edilen verilerle matematiksel olarak modellenmesi sonucu bir çok mühendislik uygulamasında yaygın olarak kullanılan sinir ağları ortaya çıkmıştır.

Sorunların çözümünde farklı türdeki yapılarda bilgileri hızlı şekilde tanımlamak ve algılamak gerekmektedir. Yapay sinir ağları yaklaşımı bu konuda oldukça başarılıdır. Ayrıcı bu yaklaşımda tanıma ve tahmin etme gibi becerileri öğrenerek geliştirme de mümkündür.

Bilgisayar sistemleri insanlara kıyasla hız, doğruluk, işlem gücü ve performans yönünden daha başarılı olabilmektedir. Ancak buna rağmen bilgisayarlar henüz insan beyni kadar kapsamlı öğrenme yeteneğine sahip değildir. Yapay sinir ağları söz konusu güç ve yeteneği makinelere kazandırmayı amaçlamaktadır.

Bunun gibi özelliklerden dolayı yapay sinir ağları yaklaşımı, klasik çözüm yöntemleri ile birlikte zor problemler için kullanılabilir bir yöntem haline gelmiştir.

Resim 1: Yapay Sinir Ağı

BİYOLOJİK NÖRONLAR

Makine öğrenmesi için insan zekası modellenirken nöronlar (sinir hücreleri) örnek alınmıştır. İnsanlarda nöronlar yapısal olarak dendrit, akson, çekirdek ve bağlantılar olmak üzere dört kısımdan oluşmaktadır.

Dendrit

Diğer nöronlardan aktarılan sinyalleri, bulunduğu nöronun çekirdeğine aktarmaktan sorumludur.

Akson

Çekirdekten aldığı toplanmış sinyalleri diğer nöronlara aktarmaktan sorumludur. Söz konusu sinyaller ön işlemden geçtikten sonra iletilmektedir.

Bağlantılar

Yeni üretilen sinyalleri diğer nöronlara iletmekten sorumludur.

Çekirdek ile dendrit arasında iletişim bazı durumlarda farklılık göstermektedir. Örneğin bazı dendritler dominant, bazıları da pasif iletişim kurmaktadır.

Soma

Dendrit ile gönderilen sinyalleri toplayan ve bu sinyalleri aksona ileten merkezdir. Çekirdek olarak olarak da bilinmektedir.

Sinapsis

Aksondan gelen sinyalleri ön işlemden geçirmekten ve diğer nöronların dentdritlerine aktarmaktan sorumludur.

KULLANIM ALANLARI

Yapay sinir ağları bilgi saklama, hesaplama yapma, daha önce sunulan örnekleri kullanarak sorun öğrenebilme ve yeni sorunlara çözüm üretebilme özelliklerine sahiptir.

Bundan dolayı aşağıdaki gibi birçok alanda yapay sinir ağları kullanılmaktadır.

Adli bilişim

Biyomedikal

Dayanıklılık analizi

Denetim

Dil tercüme

El yazısı tanıma

Elektrik işareti tanıma

Finans

Görüntü işleme

Görüntü ve veri karşılaştırma

Hava durumu tahminleme

Kalite kontrolü

Maliyet analizi

Otomatik araç denetimi

Otomatik pilot uygulamaları

Parmak izi tanıma

Plaka tanıma

Robotik

Ses tanıma

Siber güvenlik

Sinyal işleme

Sistem modelleme

Sözcük tanıma

Uçuş simülasyonları

Üretim işlem kontrolü

Yol izleme

Yüz eşleştirme

AVANTAJLAR VE DEZAVANTAJLAR

Yapay sinir ağlarında en güçlü ve önemli özellik sistemin öğrenme yeteneğine sahip olmasıdır. En önemli eksiklik ise ağın sistemin çalışmasını yeterli düzeyde analiz edememesi ve öğrenme sürecinde başarısız olma ihtimalidir.

Avantajlar

Eğitilen veri dışındaki verilere de anlamlı yanıtlar üretilmektedir.

Doğrusal olmayan alt birimler ile ilgili problemlerin çözümüne imkan sunmaktadır.

Yapay sinir ağı hücrelerinden herhangi birinde sorun oluşması durumunda ana sistem çalışmasına güvenli şekilde devam edebilmektedir.

Sorunları öğrenerek benzer durumlarda mantıklı kararlar vermektedir.

Klasik yöntemlerden farklı şekilde çalıştığından bu yöntemlerden kaynaklanan hataları içermemektedir.

Hücrelerden işlevini kaybeden olması durumunda anlamlı bilginin kaybolmasına sebep olmaz.

Bellekte veri dağıtık olarak tutulmaktadır.

Eğitim sırasında kullanılan örnek veri miktarı filtrelenir ve artırılırsa yüksek doğruluk sunmaktadır.

Eksik veri olsa dahi anlamlı çıktı üretebilmektedir.

Ayrı bir matematik modele ihtiyaç duymamaktadır.

Hücrelerin bozulması durumunda bile hata toleransına uyum sağlanmaktadır.

Algılama amaçlı kullanılmektedir.

Örüntü tanıma temelli çalışabilmektedir.

Sınıflandırma problemlerinde yüksek doğruluklu çözüm sunabilmektedir.

Kendi kendine öğrenme ve organizyon mümkündür.

Klasik yöntemlere göre daha hızlı çözüm sunabilmektedir.

Dezavantajlar

Bazı ağlar haricinde yapay sinir ağları için kararlılık analizi yapılamamaktadır.

Bir probleme çözüm üretildiğinde ilgili çözümün nasıl ve neden olduğuna dair detaylı bilgi alınamamaktadır.

Yapay sinir ağları sayısal veri ile çalıştığından öncelikle verinin yüksek doğruluklu yöntemlerle sayısallaştırılması gerekmektedir.

Yapay sinir ağı oluşturmadan önce belirlenen parametreler farklı uygulama alanlarında istenmeyen sonuçlar doğurabilmektedir.

Eğitimin ne zaman sonlanacağına ilişkin genel bir kural bulunmamaktadır.

Bazı durumlarda paralel çalışma gereksinimden dolayı donanım bağımlılığı söz konusudur.

TARİHÇE VE GELECEK

Tarihçe

1969: Doğrusal ilişkilendiricilerin önerilmesi

1972: Korelasyon matris belleğinin geliştirilmesi

1974: Geriye yayılım modelinin tasarlanması

1978: ART modelinin tasarlanması

1982: Kohonen öğrenmesinin geliştirilmesi

1982: SOM modellinin tasarlanması

1982: Hopfield ağlarının geliştirilmesi

1982: Çok katmanlı algılayıcının geliştirilmesi

1984: Boltzman makinesinin tasarlanması

1985: Delta öğrenme kuralının tasarlanması

1988: RBF modelinin tasarlanması

1988: PNN modelinin tasarlanması

1991: GRNN modelinin tasarlanması

Gelecek

Günümüzde tüm dünyada yapay sinir ağlan ile ilgili olarak birçok araştırma yapılmaktadır. Yapay sinir ağları daha yüksek doğruluk ve daha yüksek hız sunacak şekilde yeniden tasarlanmaktadır. Sorunların çözümüne yönelik farklı sinir ağı mimarileri tasarlanmakta ve geliştirilmektedir.

Daha verimli öğrenme algoritmaları geliştirilmekte, zamana göre değişen modellere karşılık verebilen ağlar tasarlanmaktadır.

Yapay sinir ağları donanımsal olarak gerçekleşmemekte, silikon sinir ağları geliştirilmektedir. Sinir ağı yongaları tasarlanmakta, sadece bu amaçla çalışan devreler üretilmektedir. Burada alternatif olarak optik yonga mimarileri düşünülmektedir.

FPGA ve ASIC gibi teknolojiler ile donanım tabanlı olarak daha verimli çalışan yapay sinir ağları tasarlanmaktadır.

TEMEL BİLEŞENLER

Daha önce belirtildiği gibi yapay sinir ağı hücreleri, biyolojik sinir hücrelerine benzer yapıda çalışmaktadır. Ağlar aralarında bağlantı kurarak daha büyük sistemleri oluşturmaktadır.

Birbirine bağlı düğüm ve işlem elemanları bulunan yapay sinir ağlarında genellikle eş zamanlı çalışan alt bileşenler bulunmaktadır.

Biyolojik ağlara benzer şekilde yapay ağların da giriş sinyallerini aldıkları, bu sinyalleri toplayıp işledikleri ve çıktıları ilettikleri alt birimleri bulunmaktadır.

Yapay sinir ağları, insan beynindekine benzer şekilde genelleme, öğrenme, uyum sağlama gibi yeteneklere sahiptir. İnsan beyninde öğrenme işlemi yeni aksonlar üreterek, söz konusu aksonları uyararak ve var olan aksonların güçlerini değiştirerek gerçekleşmektedir.

Biyolojik sinir ağlarındaki sinir hücrelerinin yapay sinir ağlarındaki karşılığı proses elemanlarıdır. Her proses elemanı; girdi, ağırlık, toplama fonksiyonu, aktivasyon fonksiyonu ve çıktı olmak üzere 5 bileşen içermektedir.

Girdiler

Ağın öğrenmesi istenen bilgilerdir. Bu girdiler ile elde edilen veriler biyolojik sinir hücrelerinde olduğu gibi toplanmak üzere çekirdeğine gönderilmektedir.

Ağırlıklar

Yapay sinir ağı tarafından alınan girdilerin ağ üzerindeki etkisini belirleyen tanımlı katsayı değerleridir.

Her girdi için ağırlık verisi söz konusudur. Bir ağırlığın değerinin büyük olması o girişin ağa daha güçlü bağlanması veya önem derecesinin yüksek olmasını belirtmektedir.

Değerin küçük olması ise zayıf bağlanması ya da önemli olmaması anlamına gelmektedir.

Toplama Fonksiyonu

Ağ üzerindeki her bir ağırlığın ait olduğu girdilerle çarpımının toplamlarını eşik değeri ile toplayarak etkinlik işlevine göndermektedir. Bazı durumlarda toplama işlevi basit bir fonksiyondur. Bazı durumlarda da minimum, maksimum, çoğunluk veya normalizasyon temelli daha karmaşık algoritmalar olabilir.

Etkinlik Fonksiyonu

Toplama işleminin sonucunu zamana bağlı olarak değiştiren fonksiyondur.

Ölçeklendirme ve Sınırlandırma

Etkinlik fonksiyonunun sonuçları ölçeklendirme ve / veya sınırlandırma işlemlerinden geçebilmektedir. Bu ölçeklendirme basit olarak bir ölçek değeri ile etkinlik değerinin çarpımının sonucudur.

Sınırlandırma ise ölçeklenen sonuçların minimum ve maksimum sınırları aşmasını önleme sürecidir.

Çıkış Fonksiyonu

Etkinlik fonksiyonu sonucunun diğer nöronlara veya dış dünyaya gönderildiği kısımdır. Bir nöronun bir tek çıkışı bulunmaktadır. Bu çıkıştan kendinden sonra gelen herhangi bir sayıdaki diğer sinirlere giriş yapılabilmektedir.

ÖĞRENME

Yapay sinir ağı öğrendikten sonra ağa daha önce verilmeyen girişler sunularak, sinir ağı test edilmektedir. Eğer ağ daha önce karşılaşmadığı bu örneklere de iyi sonuç veriyorsa “ağ sorunu öğrenmiş” anlamını taşımaktadır.

Bu durumu sınamak için probleme ait veriler eğitim seti ve test seti olarak iki gruba ayrılmalıdır. Eğitim seti ağın öğrenmesinin sağlanması için girdi ve çıktı değerleri sisteme sunulan verilerdir. Test seti ise eğitim setinden farklı olarak sisteme daha önce sunulmamış; çıktısı bilinmesine rağmen sisteme sadece girdilerin sunulduğu verilerdir.

Verilerin ne kadarının eğitim seti ne kadarının test seti olması gerektiği konusunda belirli bir kural bulunmamaktadır. Bu aşamada önem verilmesi gereken durum özellikle eğitim setinin problem uzayını kapsayacak şekilde seçilmesidir.

Öğrenme Süreci

Ağ tarafından öğrenilmesi istenen probleme ait örneklerin toplanmaktadır.

Toplama ve etkinlik fonksiyonları belirlenmektedir.

Ağın topolojik çıktısı belirlenmektedir.

Ağırlıkların başlangıç ve eşik değerleri atanmaktadır.

Eğitim setindeki örnekler sunulmaktadır.

Eğitim setinden sunulan girdiler için ağın çıktısı hesaplanmaktadır.

Ağın çıktısı beklenen çıktı ile karşılaştırılarak hata değerleri hesaplanmaktadır.

Geri hesaplama fonksiyonu çalıştırılarak hatanın azalması için ağırlık güncellenmesi gerçekleştirilmektedir.

Danışmanlı Öğrenme

Öğretene gereksinim bulunmayan öğrenme yöntemidir. Probleme ait olan girdi değerleri için çıktı değerlerinin de yapay sinir ağına verilmesi gerekmektedir. Bu tip öğrenmede sisteme verilen girdiler modelde bulunan ağırlıkların en uygun değeri ile güncellenerek bulunmaktadır. Ağ tarafından bulunan çıktı değeri ile gerçek değer arasındaki fark ile hata hesaplanmakta ve buna göre ağırlık değerleri belirlenmektedir.

Danışmansız Öğrenme

Bu yöntemde elde sadece girdi değerleri olduğundan yapay sinir ağına sadece söz konusu değerler sunulmaktadır. Girdi değerleri ağ tarafından sınıflandırılarak öğrenme süreci gerçekleşmektedir.

Takviyeli Öğrenme

Bu yöntemde de öğretici bulunmaktadır. Ancak danışmanlı öğrenmeden farklı olarak sisteme çok fazla ayrıntı verilmemektedir. Sonuçta her iterasyonunda elde edilen değerin iyi veya kötü olduğu konusunda yapay sinir ağına bilgi verilmektedir. Verilen bilgilere göre ağ öğrenerek verileri tekrar düzenlemektedir.

YAPAY SİNİR AĞI TÜRLERİ

Konvolüsyonel Sinir Ağları (Convulational Neural Network)

İlk olarak önerilen birçok katmanlı ileri beslemeli yapay sinir ağıdır. Görüntü işleme, konuşma tanıma ve doğal dil işleme alanlarında yaygın olarak kullanılmaktadır.

CNN’de öğrenme özelliği, kıvrımlı katmanların ve havuzlama işlemlerinin alternatif hale getirilmesi ve istiflenmesiyle elde edilir. Kıvrımlı katmanlarda birden fazla yerel çekirdek kullanarak ham giriş verileri ile kıvrımlı filtreler ve değişmez yerel özellikler oluşturulmaktadır. Sonraki katmanlarda da en önemli özellikler ayıklanmaktadır.

Derin öğrenme, akıllı üretim için gelişmiş analitik sağlamıştır. Ayrıca işlemleri birleştirerek ham giriş verilerinin üzerinde maksimum havuzlama ve ortalama havuzlama getirileri sunmaktadır. Maksimum havuzlama, havuzlama işlemi sırasında seyrek özellikleri ayıklamak için iyi uygundur.

Çok katmanlı özellik öğrenmeden sonra, tam bağlı katmanlar iki boyutlu özellik matrisini tek boyutlu bir vektöre dönüştürmektedir.

Her durumda entropi değerleri hesaplanarak hata oranı ve doğruluk tespit edilebilir.

Tekrarlayan Sinir Ağı (Recurrent Neural Network)

Daha çok dil çevrimleri için kullanılmakla birlikte ardışık yapıdan bir sonraki noktanın tahminini sağlamaktadır.

Örneğin ekonomik veriler için dizi şeklinde zaman serileri ile girdi olarak kullanılarak sonraki bir zamanda değerlerin hangi durumda olacağının tahmin edilmesi olarak gösterilebilmektedir.

Kurulacak bir cümlede art arda gelen kelimelerin arkasından cümlenin devamının nasıl olacağını gösteren kelimenin tahmini de örnek olarak verilebilir.

İki tür RNN vardır bunlar: İki yönlü RNN (Bidirectional RNNs) ve Derin RNN (Deep RNN)

Uzun-Kısa Süreli Hafıza (Long Short-Term Memory)

RNN mimarilerinde diziler arasında boşluklar olması, sonraki dizenin tahmin edilmesi sürecini zorlaştırmaktadır. Bu durum RNN türü ağlar için dezavantajlı bir durumdur. Bu aşamada yapılan araştırmalar söz konusu durumu ortadan kaldıracak uzun ve kısa süreli hafıza olan LSTM’i ortaya çıkarmıştır.

Aslında LSTM ağlarının RNN ağlarına çok benzerler. LSTM içerisinde ek olarak hafıza hücreleri bulunmaktadır. Söz konusu hücre önceki durumu ve girdi bilgisini tutmaktadır. Ayrıca bu hücre hangi verinin tutulacağına veya hangi verinin silineceğine karar vermektedir.

Sonraki aşamada ise önceki durumu mevcut bellek ile giriş verisini birleştirilmektedir. Böyle bir yaklaşımla uzun vadeli bağımlılıkların ortadan kaldırılarak veri dizilerinin devam ettirilmesi sağlanmaktadır.

Kısıtlı Boltzmann Makinesi (Restricted Boltzmann Machine)

Kısıtlı Boltzmann makinesi, görünür ve gizli nöral iki katmandan oluşan ağdır. Sınıflandırma, regresyon, boyut azaltma, işbirlikçi filtreleme, öğrenme ve modelleme amaçlı kullanılmaktadır. Ayrıca derin inanç ağlarının temelini oluşturmaktadırlar.

RBM üzerindeki düğümler birbirlerine katmanlar halinde bağlıdırlar.

Aynı katmandaki iki düğüm arasında bağlantı ve iletişim yoktur. Her düğümde veri işlenmekte ve söz konusu veriyi iletme konusunda stokastik kararlar alınmaktadır.

KAYNAKÇA

http://www.alikoker.com.tr/yapay-sinir-aglari

Anderson, J.A.; Pellionisz, A.; and Rosenfeld, E. (Eds) 1990, Neurocomput¬ing 2: Directions for research, The MIT Press.

Chakrapani, J. and Skorin-Kapov, J. 1992, “A connectionist approach to the quadratic assignment problem,” Computers and Operations Research, Vol. 19, №3/4, pp. 287–295.

Dagli, C. H.; Kumara, S. R. T.; and Shin, Y. C. 1991, Intelligent Engineering Systems Through Artificial Neural Networks, ASME Press, Fairfield, NJ.

Damodran, P.S.; Kolli, S.S.; and Alexander, S.M. 1993, “The investigation of new approaches to business data analysis,” Computers and Industrial Engineering, Vol. 25, №1–4, pp. 545–548.

De Ca.valho, Luis A. V. and Barbosa, V. C. 1989, “Towards a stochastic neu¬ral model for combinatorial optimization,” in Proceedings of the IEEE Inter¬national Joint Conf on Neural Networks, Washington D.C., Vol.2, pp.587.

DeSilets, L.; Golden, B.; Kumar, R.; and Wang, Q. 1992, “A neural network model for cell suppression of tabular data,” Working paper, College of Busi¬ness and Management, University of Maryland, College Park, MD.

Glover, F. 1994, “Optimization by ghost image processes in neural networks,” Computers and Operations Research , Vol. 21, №8, pp. 801–822.

Jagota, A. 1996, “An adaptive, multiple restarts neural network algorithm for graph coloring,” European Journal of Operational Research, In Press.

Kavcioğlu Ş. — İstanbul İktisat Dergisi, 2019. Kurumsal Kredi Skorlamasında Klasik Yöntemlerle Yapay Sinir Ağı Karşılaştırması

Keskenler M., Keskenler E. — Takvim-i Vekayî, Geçmişten Günümüze Yapay Sinir Ağları ve Tarihçesi

Lee, B. W. and Sheu, B. J. 1990, “Combinatorial optimization using competi¬tive Hopfield neural networks,” in Proceedings of the IEEE International Joint Conference on Neural Networks, Washington D.C., Vol. 2, pp. 627630.

Lee, J.K. and Jhee, W.C. 1994, “A two-stage neural network approach for ARMA model identification with ESCAF,” Decision Support Systems, Vol. II, №4, pp. 461–479.

Lee, T.H.; White, H.; and Granger, C.W.J. 1993, “Testing for neglected non¬linearity in time series models,” Journal of Econometrics, Vol. 56, pp. 269- 290.

Looi, C. 1992, “Neural network methods in combinatorial optimization,” Computers and Operations Research, Vol. 19, №3/4, pp. 191–208.

Meriç E. — Bursa Uludağ Üniversitesi, 2019. Yapay zekâ yöntemleriyle havalimanlarında personel planlaması

Öztürk K., Şahin M. — Takvim-i Vekayî, 2018. Yapay Sinir Ağları ve Yapay Zekâ’ya Genel Bir Bakış

Ramanujam, J. and Sadayappan, P. 1988, “Optimization by neural networks,” in Proceedings of the IEEE International Conference on Neural Networks, San Diego, CA, Vol. 2, pp. 325332.

Tank, D. W. and Hopfield, J. J. 1986, “Simple ‘neural’ optimization networks: An A/D converter, signal decision circuit, and linear programming circuit,” IEEE Transaction on Circuits and Systems, Vol. CAS33, №5 (May), pp. 533–541.

Yılmaz Ş., Özcan B. 2019 — Uluslararası Sosyal Bilimler Akademi Dergisi, Yapay Sinir Ağı Ve Regresyon İle Satın Alma Gücü Paritesine Göre Kişi Başı Gayrisafi Yurt İçi Hasıla Tahmini

--

--

Yük. Müh. Muhammet Ali Köker

Bilgisayar ve Mekatronik Mühendisi, İçişleri Bakanlığı & Argus, Adli Bilişim & Siber Güvenlik MSc, İşletme BSc, MARMARA GAZİ AKÜ İÜ SAÜ KKÜ, www.alikoker.com.tr