Adaptif rezonans teorisi

Bilimsel teori

Adaptif rezonans teorisi (ART), Stephen Grossberg ve Gail Carpenter tarafından beynin bilgiyi nasıl işlediğini anlamak üzere geliştirilen bir teoridir. Denetimli ve denetimsiz öğrenme yöntemlerini kullanan ve örüntü tanıma ve tahmin gibi sorunları ele alan bir dizi sinir ağı modelini açıklamaktadır.

ART modelinin arkasındaki birincil sezgi, nesne tanımlama ve tanımanın genellikle "yukarıdan aşağıya" gözlemci beklentilerinin "aşağıdan yukarıya" duyusal bilgilerle etkileşiminin bir sonucu olarak ortaya çıkmasıdır. Model, 'yukarıdan aşağıya' beklentilerin, daha sonra duyular tarafından algılanan bir nesnenin gerçek özellikleri ile karşılaştırılan bir bellek şablonu veya prototipi şeklini aldığını varsayar. Bu karşılaştırma, kategori aidiyetinin bir ölçüsüne yol açar. Duyum ve beklenti arasındaki bu fark, 'uyanıklık parametresi' adı verilen belirli bir eşiği aşmadığı sürece, algılanan nesne beklenen sınıfın bir üyesi olarak kabul edilecektir. Böylece sistem, 'esneklik/kararlılık' sorununa, yani artan öğrenme olarak da adlandırılan mevcut bilgiyi bozmadan yeni bilgi edinme sorununa bir çözüm sunar.

Öğrenme modeli değiştir

 
Basit ART iskeleti

Temel ART sistemi, denetimsiz bir öğrenme modelidir. Tipik olarak bir karşılaştırma alanı ve nöronlardan oluşan bir tanıma alanı, bir uyanıklık parametresi (tanıma eşiği) ve bir sıfırlama modülünden oluşur.

  • Karşılaştırma alanı bir girdi vektörü (tek boyutlu bir değerler dizisi) alır ve onu tanıma alanındaki en iyi eşleşmesine aktarır.
    • En iyi eşleşmesi, ağırlıkları (ağırlık vektörü) girdi vektörüyle en yakından eşleşen tek nörondur.
  • Her bir tanıma alanı nöronu, diğer tanıma alanı nöronlarının her birine negatif bir sinyal (bu nöronun giriş vektörüne eşleşme kalitesiyle orantılı olarak) verir ve böylece çıkışlarını engeller.
    • Bu şekilde tanıma alanı yanal inhibisyon sergiler ve içindeki her nöronun girdi vektörlerinin sınıflandırıldığı bir kategoriyi temsil etmesine izin verir.
  • Giriş vektörü sınıflandırıldıktan sonra, sıfırlama modülü, tanıma eşleşmesinin gücünü uyanıklık parametresiyle karşılaştırır.
    • Dikkat parametresinin üstesinden gelinirse (yani giriş vektörü önceki giriş vektörlerinde görülen normal aralık içindeyse), eğitim başlar:
      • Kazanan tanıma nöronunun ağırlıkları, giriş vektörünün özelliklerine göre ayarlanır.
    • Aksi takdirde, eşleşme seviyesi uyanıklık parametresinin altındaysa (yani giriş vektörünün eşleşmesi, o nöron için normal beklenen aralığın dışındaysa), kazanan tanıma nöronu engellenir ve bir arama prosedürü gerçekleştirilir.
      • Bu arama prosedüründe, bir tanıma eşleşmesi tarafından uyanıklık parametresinin üstesinden gelinene kadar, tanıma nöronları sıfırlama işlevi tarafından birer birer devre dışı bırakılır.
        • Özellikle, arama prosedürünün her döngüsünde en aktif tanıma nöronu seçilir ve aktivasyonu uyanıklık parametresinin altındaysa kapatılır (böylece geri kalan tanıma nöronlarını inhibisyonundan serbest bıraktığına dikkat edin).
    • Hiçbir taahhütlü tanıma nöronunun eşleşmesi ihtiyat parametresinin üstesinden gelmezse, taahhüt edilmemiş bir nöron taahhüt edilir ve ağırlıkları giriş vektörünü eşleştirmeye göre ayarlanır.
  • Uyanıklık parametresinin sistem üzerinde önemli bir etkisi vardır: daha yüksek teyakkuz oldukça ayrıntılı anılar (birçok, ince taneli kategoriler) üretirken, daha düşük teyakkuz daha genel anılar (daha az, daha genel kategoriler) ile sonuçlanır.

Eğitim değiştir

ART tabanlı sinir ağlarını eğitmenin iki temel yöntemi vardır: yavaş ve hızlı. Yavaş öğrenme yönteminde, tanıma nöronunun ağırlıklarının giriş vektörüne yönelik eğitim derecesi, diferansiyel denklemlerle sürekli değerlere hesaplanır ve bu nedenle giriş vektörünün sunulma süresinin uzunluğuna bağlıdır. Hızlı öğrenme ile yapılacak ağırlık ayarlamalarının derecesini hesaplamak için cebirsel denklemler kullanılır ve ikili değerler kullanılır. Hızlı öğrenme çeşitli görevler için etkili ve verimli olsa da, yavaş öğrenme yöntemi biyolojik olarak daha makuldür ve sürekli zamanlı ağlarla kullanılabilir (yani girdi vektörü sürekli olarak değişebilir).

Türler değiştir

 
ARTMAP'e genel bakış

ART 1,[1] yalnızca ikili girişleri kabul eden ART ağlarının en basit çeşididir. ART 2,[2] sürekli girişleri desteklemek için ağ yeteneklerini genişletir. ART 2-A, büyük ölçüde hızlandırılmış çalışma süresine sahip modern bir ART-2 formudur ve nitel sonuçların tam ART-2 uygulamasından yalnızca nadiren daha düşük olur. ART 3,[3] sistemin denklemlerine simüle edilmiş sodyum ve kalsiyum iyonu konsantrasyonlarını dahil ederek sinaptik aktivitenin ilkel nörotransmitter düzenlemesini simüle ederek ART-2'yi temel alır, bu da uyumsuzluk sıfırlamalarını tetikleyen kategorileri kısmen engellemenin fizyolojik olarak daha gerçekçi bir yolunu sağlar.

Öngörülü ART olarak da bilinen ARTMAP,[4] hafifçe değiştirilmiş iki ART-1 veya ART-2 birimini, birinci birimin giriş verilerini aldığı denetimli bir öğrenme yapısında birleştirir. İkinci ünite, doğru çıktı verilerini alır, ardından doğru sınıflandırmayı yapmak için birinci ünitedeki uyanıklık parametresinin mümkün olan minimum ayarını yapmak için kullanılır.

Bulanık ART,[5] bulanık mantığı ART'nin örüntü tanımasına uygular, böylece genelleştirilebilirliği artırır. Bulanık ART'nin isteğe bağlı (ve çok kullanışlı) bir özelliği, özelliklerin yokluğunu örüntü sınıflandırmalarına dahil etmenin bir yolu olan tamamlayıcı kodlamadır; Bu, verimsiz ve gereksiz kategori çoğalmasını önlemeye yönelik uzun bir yol kat eder. Uygulanan benzerlik ölçüleri L1 normuna dayanmaktadır. Bulanık ART'ın gürültüye karşı çok hassas olduğu bilinmektedir.

Bulanık ARTMAP,[6] yalnızca bulanık ART birimleri kullanan ARTMAP'tir ve bu da etkinlikte karşılık gelen bir artış sağlar.

Basitleştirilmiş Bulanık ARTMAP (SFAM),[7] sınıflandırma görevlerine adanmış bulanık ARTMAP'ın oldukça basitleştirilmiş bir varyantını oluşturur.

Gauss ART[8] ve Gauss ARTMAP,[8] Gauss aktivasyon fonksiyonlarını ve olasılık teorisine dayalı hesaplamaları kullanır. Bu nedenle Gauss karışım modelleriyle bazı benzerlikleri vardır. Bulanık ART ve bulanık ARTMAP ile karşılaştırıldığında, gürültüye karşı daha az duyarlıdırlar. Ancak öğrenilen temsillerin kararlılığı azalır ve bu da açık uçlu öğrenme görevlerinde kategori çoğalmasına yol açabilir.

Fusion ART ve ilgili ağlar[9] ART ve ARTMAP'i birden çok model kanalına genişletir. Birkaç öğrenme paradigmasını desteklerler.

TopoART,[10] bulanık ART'yi büyüyen sinir gazı gibi topoloji öğrenme ağlarıyla birleştirir. Ayrıca, bir gürültü azaltma mekanizması ekler. TopoART'ı daha ileri öğrenme paradigmalarına genişleten birkaç türetilmiş sinir ağı vardır.

Hypersphere ART[11] ve Hypersphere ARTMAP[12] sırasıyla bulanık ART ve bulanık ARTMAP ile yakından ilişkilidir. Ancak farklı türde bir kategori gösterimi (yani hiper küreler) kullandıkları için girdilerinin [0, 1] aralığına normalleştirilmesini gerektirmezler. L2 normuna dayalı benzerlik ölçüleri uygularlar.

LAPART[13] Yanal Olarak Hazırlanmış Uyarlamalı Rezonans Teorisi (LAPART) sinir ağları, öğrenilmiş ilişkilere dayalı tahminler yapmak için bir mekanizma oluşturmak için iki bulanık ART algoritmasını birleştirir. İki bulanık ART'nin birleştirilmesi, sistemin net bir çözüme doğru hızla yakınsamasını sağlayan benzersiz bir kararlılığa sahiptir. Ek olarak, bulanık ARTMAP'e benzer şekilde mantıksal çıkarım ve denetimli öğrenme gerçekleştirebilir.

Eleştiri değiştir

Bulanık ART ve ART 1 sonuçlarının (yani öğrenilen kategoriler) kritik olarak eğitim verilerinin işlenme sırasına bağlı olduğu not edilmiştir. Etki, daha yavaş bir öğrenme hızı kullanılarak bir dereceye kadar azaltılabilir, ancak girdi veri setinin boyutundan bağımsız olarak mevcuttur. Dolayısıyla bulanık ART ve ART 1 tahminleri, istatistiksel tutarlılık özelliğine sahip değildir.[14] Bu sorun, her iki ağda da kararlı öğrenmeyi sağlayan ilgili mekanizmaların bir yan etkisi olarak düşünülebilir.

Kategorileri kümelere özetleyen TopoART ve Hypersphere TopoART gibi daha gelişmiş ART ağları, kümelerin şekilleri ilişkili kategorilerin oluşturulma sırasına bağlı olmadığından bu sorunu çözebilir.(bakınız, şekil 3(g, h) ve şekil 4,[12])

Kaynakça değiştir

  1. ^ "Dış bağlantı" (PDF). 19 Mayıs 2006 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 27 Haziran 2021. 
  2. ^ "ART 2: Self-organization of stable category recognition codes for analog input patterns" (PDF). 4 Eylül 2006 tarihinde kaynağından (PDF) arşivlendi. 
  3. ^ "Dış bağlantı". 7 Mayıs 2004 tarihinde kaynağından arşivlendi. 
  4. ^ "ARTMAP: Supervised real-time learning and classification of nonstationary data by a self-organizing neural network" (PDF). 30 Mayıs 2005 tarihinde kaynağından (PDF) arşivlendi. 
  5. ^ "Fuzzy ART: Fast stable learning and categorization of analog patterns by an adaptive resonance system" (PDF). 30 Mart 2004 tarihinde kaynağından (PDF) arşivlendi. 
  6. ^ "Fuzzy ARTMAP: A neural network architecture for incremental supervised learning of analog multidimensional maps" (PDF). 30 Mayıs 2005 tarihinde kaynağından (PDF) arşivlendi. 
  7. ^ Mohammad-Taghi Vakil-Baghmisheh and Nikola Pavešić. (2003) A Fast Simplified Fuzzy ARTMAP Network, Neural Processing Letters, 17(3):273–316
  8. ^ a b "Gaussian ARTMAP: A Neural Network for Fast Incremental Learning of Noisy Multidimensional Maps" (PDF). 
  9. ^ "Fusion ARTMAP: an adaptive fuzzy network for multi-channel classification" (PDF). 28 Ekim 2020 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 27 Haziran 2021. 
  10. ^ "TopoART: A Topology Learning Hierarchical ART Network". 26 Ekim 2016 tarihinde kaynağından arşivlendi. 
  11. ^ "Hypersphere ART and ARTMAP for Unsupervised and Supervised Incremental Learning" (PDF). 1 Ağustos 2010 tarihinde kaynağından (PDF) arşivlendi. 
  12. ^ a b "Incremental On-line Clustering with a Topology-Learning Hierarchical ART Neural Network Using Hyperspherical Categories" (PDF). In: Poster and Industry Proceedings of the Industrial Conference on Data Mining (ICDM), 22–34. 16 Kasım 2019 tarihinde kaynağından (PDF) arşivlendi. 
  13. ^ "Lapart-python documentation". 23 Ekim 2017 tarihinde kaynağından arşivlendi. 
  14. ^ "Why Statisticians Should Not FART". 25 Ocak 2004 tarihinde kaynağından arşivlendi.