Method Article
Makine öğrenimi algoritmaları, insanlara sunulan uyaranları "çözmek" için beyin aktivitesi kalıplarını kullanmak üzere eğitilmiştir. Burada, aynı tekniğin iki evcil köpeğin beyninden doğal video içeriğini çözebileceğini gösteriyoruz. Videolardaki eylemlere dayalı kod çözücülerin köpeklerde başarılı olduğunu bulduk.
İnsan ve insan olmayan korteksten gelen görsel uyaranları çözmek için makine öğrenimi ve fonksiyonel manyetik rezonans görüntüleme (fMRI) kullanan son gelişmeler, algının doğasına ilişkin yeni anlayışlarla sonuçlandı. Bununla birlikte, bu yaklaşım henüz primatlar dışındaki hayvanlara büyük ölçüde uygulanmamıştır ve bu da hayvanlar alemindeki bu tür temsillerin doğası hakkında soruları gündeme getirmektedir. Burada, iki evcil köpek ve iki insanda, her biri özel olarak oluşturulmuş köpeğe uygun doğal videoları izlerken elde edilen uyanık fMRI kullandık. Daha sonra, video içeriğini her birinden toplam 90 dakikalık kaydedilmiş beyin aktivitesinden sınıflandırmak için bir sinir ağı (Ivis) eğittik. Hem köpek, insan ve araba gibi kategorileri ayırt etmeye çalışan nesne tabanlı bir sınıflandırıcıyı hem de yemek yeme, koklama ve konuşma gibi kategorileri ayırt etmeye çalışan eylem tabanlı bir sınıflandırıcıyı test ettik. Her iki sınıflandırıcı türünün de şansın çok üzerinde performans gösterdiği iki insan denekle karşılaştırıldığında, köpeklerden gelen video içeriğinin kodunu çözmede yalnızca eyleme dayalı sınıflandırıcılar başarılı oldu. Bu sonuçlar, bir etoburun beyninden doğal videoları çözmek için makine öğreniminin bilinen ilk uygulamasını gösteriyor ve köpeğin dünyaya bakışının bizimkinden oldukça farklı olabileceğini gösteriyor.
İnsanların beyinleri, diğer primatlar gibi, görsel akışın farklı ve iyi bilinen işlevlere sahip dorsal ve ventral yollara parsellenmesini gösterir - nesnelerin "ne" ve "nerede"1. Bu ne/nerede ikilemi, onlarca yıldır yararlı bir sezgisel yöntem olmuştur, ancak anatomik temelinin artık çok daha karmaşık olduğu bilinmektedir ve birçok araştırmacı, eyleme karşı tanımaya dayalı bir parselasyonu tercih etmektedir ("ne" ve "nasıl")2,3,4,5. Ek olarak, primat görsel sisteminin organizasyonu hakkındaki anlayışımız rafine edilmeye ve tartışılmaya devam ederken, diğer memeli türlerinin beyinlerinin görsel bilgiyi nasıl temsil ettiği hakkında çok şey bilinmemektedir. Kısmen, bu lacuna, görsel sinirbilimde bir avuç türe tarihsel odaklanmanın bir sonucudur. Bununla birlikte, beyin görüntülemeye yönelik yeni yaklaşımlar, memeli sinir sisteminin organizasyonu hakkında yeni bilgiler sağlayabilecek olan daha geniş bir hayvan yelpazesinin görsel sistemlerini invaziv olmayan bir şekilde inceleme olasılığını ortaya çıkarmaktadır.
Köpekler (Canis lupus familiaris), primatlardan evrimsel olarak uzak bir türdeki görsel uyaranların temsilini incelemek için zengin bir fırsat sunar, çünkü sedasyon veya kısıtlamalara ihtiyaç duymadan MRG taramasına işbirliği içinde katılmak için eğitilebilecek tek hayvan olabilirler 6,7,8. Son 15.000 yılda insanlarla birlikte evrimleşmeleri nedeniyle, köpekler de çevremizde yaşar ve bir MRI tarayıcısında uyaranları sunmanın tercih edilen yolu olan video ekranları da dahil olmak üzere, insanların günlük olarak karşılaştığı birçok uyarana maruz kalırlar. Öyle olsa bile, köpekler bu ortak çevresel uyaranları insanlardan oldukça farklı şekillerde işleyebilir ve bu da görsel kortekslerinin nasıl organize edildiği sorusunu akla getirir. Bir fovea eksikliği veya bir dikromat olma gibi temel farklılıklar, yalnızca alt düzey görsel algı için değil, aynı zamanda daha üst düzey görsel temsil için de önemli aşağı yönlü sonuçlara sahip olabilir. Köpeklerde yapılan birkaç fMRI çalışması, primatlarda görülen genel dorsal / ventral akış mimarisini takip ediyor gibi görünen hem yüz hem de nesne işleme bölgelerinin varlığını göstermiştir, ancak köpeklerin kendi başına yüz işleme bölgelerine sahip olup olmadığı veya bu bölgelerin başın morfolojisi için seçici olup olmadığı belirsizliğini korumaktadır (örneğin, köpek ve insan)9, 10,11,12,13. Ne olursa olsun, bir köpeğin beyninin çoğu primattan daha küçük olduğu ve daha az modüler olacağı tahmin edilmektedir14, bu nedenle akışlarda bilgi türlerinin daha fazla karışması ve hatta eylemler gibi belirli bilgi türlerinin ayrıcalığı olabilir. Örneğin, hareketin köpek görsel algısında doku veya renkten daha belirgin bir özellik olabileceği öne sürülmüştür15. Ek olarak, köpeklerin dünyayla etkileşime girdiğimiz birincil araçlardan biri olan elleri olmadığından, özellikle nesnelerin görsel olarak işlenmesi, primatlarınkinden oldukça farklı olabilir. Buna paralel olarak, son zamanlarda nesnelerle ağızdan pençeye karşı etkileşimin, köpek beynindeki nesne seçici bölgelerde daha fazla aktivasyonla sonuçlandığına dair kanıtlar bulduk16.
Köpekler ev ortamlarında video ekranlarına alışkın olsalar da, bu, deneysel bir ortamda görüntülere bir insanın yapacağı gibi bakmaya alışkın oldukları anlamına gelmez. Daha doğal uyaranların kullanılması bu soruların bazılarının çözülmesine yardımcı olabilir. Son on yılda, makine öğrenimi algoritmaları, insan beyni aktivitesinden doğal görsel uyaranların kodunu çözmede önemli bir başarı elde etti. İlk başarılar, hem bir bireyin gördüğü uyaran türlerini hem de bu temsilleri kodlayan beyin ağlarını sınıflandırmak için beyin aktivitesini kullanmak için klasik, engellenmiş tasarımları uyarlamaya odaklandı 17,18,19. Daha güçlü algoritmalar, özellikle sinir ağları geliştirildikçe, doğal videolar da dahil olmak üzere daha karmaşık uyaranların kodu çözülebildi20,21. Tipik olarak bu videolara verilen sinirsel tepkiler üzerinde eğitilen bu sınıflandırıcılar, yeni uyaranlara genelleştirerek, fMRI yanıtı sırasında belirli bir deneğin neyi gözlemlediğini belirlemelerine olanak tanır. Örneğin, filmlerdeki zıplama ve dönme gibi belirli eylem türleri insan beyninden doğru bir şekilde çözülebilirken, diğerleri (örneğin sürükleme)22 yapamaz. Benzer şekilde, birçok nesne türü fMRI yanıtlarından çözülebilse de, genel kategoriler daha zor görünmektedir. Beyin kod çözme insanlarla sınırlı değildir ve bilginin diğer türlerin beyinlerinde nasıl organize edildiğini anlamak için güçlü bir araç sağlar. İnsan olmayan primatlarla yapılan benzer fMRI deneyleri, temporal lobda canlılık ve bedensellik/bedensellik boyutları için farklı temsiller bulmuştur, bu da insanlardakine paraleldir23.
Köpeklerin doğal görsel uyaran temsillerini anlamaya yönelik ilk adım olarak, köpeğe uygun videolara verilen kortikal tepkileri ölçmek için MRI konusunda oldukça usta olan iki evcil köpekte uyanık fMRI kullanıldı. Bu çalışmada, bir köpek için potansiyel olarak daha fazla ekolojik geçerlilikleri ve video içeriğini köpek hareketiyle eşleştiren sinir ağları ile gösterdikleri başarı nedeniyle natüralist videolar kullanılmıştır24. Üç ayrı oturumda, her köpeğin 256 benzersiz video klibe verdiği yanıtlardan 90 dakikalık fMRI verileri elde edildi. Karşılaştırma için, aynı prosedür iki insan gönüllü üzerinde de uygulandı. Daha sonra, bir sinir ağı kullanarak, değişen sayıda sınıf kullanarak "nesneleri" (örneğin, insan, köpek, araba) veya "eylemleri" (örneğin, konuşma, yemek yeme, koklama) ayırt etmek için sınıflandırıcıları eğittik ve test ettik. Bu çalışmanın amaçları iki yönlüydü: 1) doğal video uyaranlarının köpek korteksinden çözülüp çözülemeyeceğini belirlemek; ve 2) eğer öyleyse, organizasyonun insanlarınkine benzer olup olmadığına dair bir ilk bakış sağlayın.
Köpek çalışması, Emory Üniversitesi IACUC (PROTO201700572) tarafından onaylandı ve tüm sahipler, köpeklerinin çalışmaya katılımı için yazılı onay verdi. İnsan çalışma prosedürleri Emory Üniversitesi IRB tarafından onaylandı ve tüm katılımcılar taramadan önce yazılı onay verdi (IRB00069592).
1. Katılımcılar
2. Uyaranlar
3. Deneysel tasarım
4. Görüntüleme
5. Uyaran etiketleri
6. fMRI ön işleme
7. Analizler
Makine öğrenimi analizlerinde model performansını değerlendirmek için en yaygın metrikler arasında hassasiyet, doğruluk, geri çağırma ve F1 puanı yer alır. Doğruluk, doğru veriler göz önüne alındığında doğru olan model tahminlerinin genel yüzdesidir. Kesinlik, modelin gerçekten pozitif olan pozitif tahminlerinin yüzdesidir (yani, gerçek pozitif oran), hatırlama ise modelin başarılı bir şekilde tahmin edebildiği orijinal verilerdeki gerçek pozitiflerin yüzdesidir. F1 puanı, hassasiyet ve geri çağırmanın ağırlıklı ortalamasıdır ve sınıf dengesizliğine karşı daha sağlam olan alternatif bir doğruluk ölçüsü görevi görür. Bununla birlikte, Ivis, çıktısının ikili olmaması nedeniyle yaygın olarak kullanılan diğer makine öğrenimi algoritmalarından farklıdır. Belirli bir beyin voksel girdisi verildiğinde, her çıktı elemanı, sınıfların her birine karşılık gelen olasılıkları temsil eder. Bu çıktılar için doğruluk, kesinlik, geri çağırma ve F1'in hesaplanması, bunların "kazanan her şeyi alır" şeklinde ikili hale getirilmesini gerektiriyordu, burada en yüksek olasılığa sahip sınıf, o hacim için tahmin edilen sınıf olarak kabul edildi. Bu yaklaşım, modelin kalitesini değerlendirmekle ilgili olan bu olasılıkların sıralaması hakkında önemli bilgileri ortadan kaldırdı. Bu nedenle, bu geleneksel metrikleri hesaplamaya devam ederken, test setindeki modelin doğruluğunu hesaplamak için birincil metrik olarak Etiket Sıralaması Ortalama Hassasiyet (LRAP) puanını kullandık. Bu metrik, esasen sınıflandırıcının gerçek etiketlere ne ölçüde daha yüksek olasılıklar atadığınıölçer 37.
Farklı derecelerde, sinir ağı sınıflandırıcısı hem insanlar hem de köpekler için başarılı oldu. İnsanlar için algoritma, her ikisi için de ortalama %70'lik bir doğruluk elde eden üç sınıflı modellerle hem nesneleri hem de eylemleri sınıflandırabildi. LRAP skoru, test setindeki modelin doğruluğunu hesaplamak için birincil metrik olarak kullanıldı; Bu metrik, sınıflandırıcının gerçek etiketlere ne ölçüde daha yüksek olasılıklar atadığınıölçer 37. Her iki insan için de medyan LRAP puanları, test edilen tüm modeller için rastgele permütasyona tabi tutulmuş bir etiket setinin 99. yüzdelik diliminden daha büyüktü (Tablo 1; Şekil 2). Köpekler için, yalnızca eylem modeli, her iki katılımcıda da şanstan önemli ölçüde daha yüksek bir medyan LRAP yüzdelik sıralamasına sahipti (Tablo 1; nesneler için p = 0.13 ve eylemler için p < 0.001; köpekler için ortalama üç sınıflı eylem modeli LRAP puanı = 78. yüzdelik dilim). Bu sonuçlar, tüm denekler için ayrı ayrı ve türlere göre gruplandırıldığında doğruydu.
Sınıflandırıcının başarısı göz önüne alındığında, modelin sınırlarını belirlemek için ek sınıflarla eğittik ve test ettik. Bu, Python paketi scipy'nin hiyerarşik kümeleme algoritmasını kullanarak, ikili korelasyon ile tanımlandığı gibi, bir bireyin beyin tepkisinin benzerliğine dayalı olarak sınıfları kümeleyen 52 potansiyel ilgi sınıfının tamamı için farklılık matrislerinin hesaplanmasını içeriyordu. Test edilen ek modellerden, her iki köpekte de en yüksek medyan LRAP yüzdelik sıralamasına sahip modelin beş sınıfı vardı: orijinal "konuşma", "yeme" ve "koklama", artı iki yeni sınıf, "sevişme" ve "oynama" (Şekil 2). Bu model, tüm katılımcılar için şans eseri tahmin edilenden önemli ölçüde daha yüksek bir medyan LRAP yüzdelik sıralamasına sahipti (Tablo 1; p < hem köpekler hem de insanlar için 0.001; köpekler için ortalama beş sınıflı eylem modeli LRAP puanı = 81. yüzdelik dilim).
İlgili beyin atlaslarına geri eşlendiğinde, voksellerin özellik önem puanları, hem köpeklerin hem de insanların oksipital, parietal ve temporal kortekslerinde bir dizi bilgilendirici voksel kümesini ortaya çıkardı (Şekil 3). İnsanlarda, nesne tabanlı ve eylem tabanlı modeller, nesne tabanlı voksellerin ve eylem tabanlı voksellerin uzamsal konumunda küçük farklılıklar olmasına rağmen, köpeklerden ve tipik olarak nesne tanıma ile ilişkili bölgelerden daha odaklı bir model ortaya çıkardı.
Bu tür farklılıklarının, köpeklerin bazı video türlerine diğerlerinden daha fazla hareket etmelerinin görevle ilişkili hareketinin bir sonucu olmadığını kontrol ettik (örneğin, köpekler dışındaki videolar, örneğin arabalar). Altı hareket parametresinin Öklid normunu hesapladık ve R paketi lme4'ü kullanarak, sabit bir etki olarak sınıf ve her köpek için rastgele bir etki olarak çalışma sayısı ile doğrusal bir karma etki modeli uydurduk. Son modellerin her biri için, Daisy (F(2, 2252) = 0.83, nesne tabanlı için p = 0.44 ve F(4, 1235) = 1.87, eylem tabanlı için p = 0.11) veya Bhubo (F(2, 2231) = 1.71, nesne tabanlı için p = 0.18 ve F(4, 1221) = 0.94, eylem tabanlı için p = 0.45) için sınıf türünün hareket üzerinde anlamlı bir etkisi bulamadık.
Şekil 1: MRG deliğinde natüralist videolar ve sunum. (A) Katılımcılara gösterilen video kliplerden örnek kareler. (B) 4 yaşında bir Boxer karışımı olan Bhubo, uyanık fMRI geçirirken video izliyor. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 2: Köpeklerde ve insanlarda model performansı. Boş dağılımlarının yüzdelik sıralamaları olarak sunulan LRAP puanlarının dağılımı, üç sınıflı nesne tabanlı bir model, üç sınıflı eylem tabanlı model ve beş sınıflı eylem tabanlı model için Ivis makine öğrenimi algoritmasının 100'den fazla eğitim ve test yinelemesi, modellerin aracılığıyla elde edilen doğal video uyaranlarına BOLD yanıtlarını sınıflandırmaya çalıştığı beş sınıflı eylem tabanlı model köpeklerde ve insanlarda uyanık fMRI. Puanlar türlere göre toplanır. Çok yüksek bir yüzdelik sıralamaya sahip bir LRAP puanı, modelin bu LRAP puanını şans eseri elde etme olasılığının çok düşük olduğunu gösterir. Şanstan daha iyi performans göstermeyen bir model, ~50 medyan LRAP puanı yüzdelik sıralamasına sahip olacaktır. Kesikli çizgiler, 100 çalıştırmanın tamamında her tür için medyan LRAP puanı yüzdelik sıralamasını temsil eder. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 3: Üç sınıflı nesne ve beş sınıflı eylem modellerinin ayrımı için önemli bölgeler. (A) İnsan ve (B) köpek katılımcıları. Vokseller, modellerin tüm yinelemelerinde ortalaması alınan rastgele bir orman sınıflandırıcısı kullanılarak özellik önemlerine göre sıralandı. Voksellerin ilk %5'i (yani, modelleri eğitmek için kullanılanlar) burada sunulmakta, türlere göre toplanmış ve görselleştirme amacıyla grup alanına dönüştürülmüştür (atlaslar: insanlar34 ve köpekler35). Etiketler, Johnson ve ark.35 tarafından tanımlananlara dayanarak, yüksek özellik önem puanlarına sahip köpek beyin bölgelerini gösterir. Kısaltma: SSM = suprasylvian gyrus. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Model Türü | Eğitim Doğruluğu | Test Doğruluğu | F1 Skoru | Kesinlik | Anımsamak | LRAP puanı medyan yüzdelik dilim | |
İnsan 1 | Nesne (3 sınıf) | 0.98 | 0.69 | 0.48 | 0.52 | 0.49 | >99 |
Eylem (3 sınıf) | 0.98 | 0.72 | 0.51 | 0.54 | 0.54 | >99 | |
Eylem (5 sınıf) | 0.97 | 0.51 | 0.28 | 0.37 | 0.27 | >99 | |
İnsan 2 | Nesne (3 sınıf) | 0.98 | 0.68 | 0.45 | 0.5 | 0.47 | >99 |
Eylem (3 sınıf) | 0.98 | 0.69 | 0.46 | 0.5 | 0.48 | >99 | |
Eylem (5 sınıf) | 0.97 | 0.53 | 0.3 | 0.4 | 0.27 | >99 | |
Bhubo Belediyesi | Nesne (3 sınıf) | 0.99 | 0.61 | 0.38 | 0.41 | 0.39 | 57 |
Eylem (3 sınıf) | 0.98 | 0.63 | 0.38 | 0.4 | 0.4 | 87 | |
Eylem (5 sınıf) | 0.99 | 0.45 | 0.16 | 0.29 | 0.13 | 88 | |
Papatya | Nesne (3 sınıf) | 1 | 0.61 | 0.38 | 0.43 | 0.39 | 43 |
Eylem (3 sınıf) | 0.97 | 0.62 | 0.35 | 0.38 | 0.35 | 60 | |
Eylem (5 sınıf) | 0.99 | 0.44 | 0.16 | 0.27 | 0.13 | 76 |
Tablo 1: Köpeklerde ve insanlarda uyanık fMRI yoluyla elde edilen doğal video uyaranlara BOLD yanıtları üzerinde 100'den fazla eğitim ve test yinelemesi olan Ivis makine öğrenimi algoritmasının toplu ölçümleri. Nesne modellerinin üç hedef sınıfı ("köpek", "insan", "araba") ve eylem modellerinin üç veya beş sınıfı vardı (üç sınıf: "konuşma", "yeme", "koklama"; beş sınıf: "konuşma", "yeme", "koklama", "sevişme", "oynama"). Şanstan önemli ölçüde büyük değerler kalın olarak gösterilir.
Ek Tablo 1: Sınıf etiketleri. Bu dosyayı indirmek için lütfen buraya tıklayın.
Ek Film 1: Örnek video klip. Bu dosyayı indirmek için lütfen buraya tıklayın.
Bu çalışmanın sonuçları, natüralist videoların köpeklerin beyinlerinde, hem insanlarda hem de maymunlarda elde edilen sonuçlara benzer şekilde fMRI ile çözülebilecek kadar çoklu görüntüleme seanslarında yeterince kararlı temsillere neden olduğunu göstermektedir20,23. Köpek görsel sisteminin önceki fMRI çalışmaları, nötr bir arka plana karşı bir yüz veya nesne gibi sadeleştirilmiş uyaranlar sunmuş olsa da, buradaki sonuçlar, birden fazla insan ve nesnenin birbiriyle etkileşime girdiği doğal videoların, köpek korteksinde aktivasyon modellerine neden olduğunu göstermektedir. Bu yaklaşım, köpeğin görsel sisteminin nasıl organize edildiğine dair yeni araştırma yolları açar.
Köpek fMRI alanı hızla büyümüş olsa da, bugüne kadar bu deneyler, nötr arka planlara karşı insan veya nesne resimleri gibi nispeten fakir uyaranlara dayanıyordu 10,12,13. Ek olarak, bu deneyler, yüz işlemede yer alan primat fusiform yüz alanına (FFA) ve nesne işleme için lateral oksipital kortekse (LOC) benzer beyin bölgelerini tanımlamaya başlamış olsa da, köpeklerin primatlarla benzer göze çarpan özelliklere yanıt veren yüz bölgelerine sahip olup olmadığı veya köpekler ve insanlar veya yüzler ve kafalar için ayrı temsilleri olup olmadığı gibi bu temsillerin doğası üzerinde anlaşmazlık devam etmektedir. Örneğin 9,13. Köpekler elbette primat değiller ve bu yapay uyaranları sesler ve kokularla olağan çoklu duyusal bağlamlarından ayrı olarak nasıl yorumladıklarını bilmiyoruz. Bazı kanıtlar, köpeklerin nesnelerin görüntülerini gerçek şeylerin temsilleri olarak ele almadıklarını göstermektedir12. Tarayıcıda gerçek bir çoklu duyusal deneyim yaratmak mümkün olmasa da, natüralist videoların kullanılması, en azından bir köpeğe gerçek dünyayla daha yakından eşleşen dinamik uyaranlar sağlayarak yapaylığın bir kısmını azaltabilir. Aynı nedenlerden ötürü, insan fMRI araştırmalarında natüralist uyaranların kullanımı popülerlik kazanmıştır, örneğin, bir filmdeki olay dizilerinin kortekste birden fazla zaman ölçeğinde temsil edildiğini ve filmlerin güvenilir duygu aktivasyonunu indüklemede etkili olduğunu göstermiştir38. Bu nedenle, natüralist videolar nispeten fakir uyaranlar olarak kalırken, insan sinirbilimindeki başarıları, köpeklerde benzer sonuçların elde edilip edilemeyeceği sorusunu akla getiriyor.
Sonuçlarımız, bir sinir ağı sınıflandırıcısının, köpek beyinlerinden gelen bazı doğal içerik türlerinin kodunu çözmede başarılı olduğunu göstermektedir. Bu başarı, uyaranların karmaşıklığı göz önüne alındığında etkileyici bir başarıdır. Daha da önemlisi, sınıflandırıcı görünmeyen video klipler üzerinde test edildiğinden, kod çözme modeli, tek tek sahnelere özgü özellikler yerine klipler arasında tanımlanabilen geniş kategorileri aldı. Bir makine öğrenimi sınıflandırıcısının performansını ölçmek için birden fazla ölçüm olduğunu unutmamalıyız (Tablo 1). Natüralist videolar, doğaları gereği tüm sınıflar arasında eşit oluşumlara sahip olmayacağından, etiketlerin rastgele permütasyonundan boş bir dağılım oluşturarak ve buna atıfta bulunulan önemi değerlendirerek ihtiyatlı bir yaklaşım benimsedik. Daha sonra, köpek modellerinin başarısının istatistiksel olarak anlamlı olduğunu, 75. - 90. yüzdelik puanlara ulaştığını, ancak yalnızca videoların oyun oynama veya konuşma gibi mevcut eylemlere dayalı olarak kodlandığında bulduk.
Test setleri, eğitim setlerinden farklı olarak, sınıflar arasında dengeli değildi. Verilerin yalnızca %20'sini oluşturan, en küçük sınıf boyutuna yetersiz örnekleme, her sınıf için çok küçük örneklem boyutlarına neden olurdu, öyle ki hesaplanan herhangi bir istatistik güvenilmez olurdu. Bu dengesizlikten kaynaklanan şişirilmiş doğruluk olasılığını önlemek için, LRAP'ın boş dağılımı, her model yinelemesi için sınıfların sırasının 1.000 kez rastgele permütasyona tabi tutulmasıyla hesaplandı. Bu boş dağılım, modelin şans eseri ne kadar iyi performans göstereceğine dair bir referans görevi gördü. Daha sonra, gerçek LRAP daha sonra bu boş dağıtımda yüzdelik bir sıralamaya dönüştürüldü. Çok yüksek bir yüzdelik sıralama, örneğin, %95, bu kadar yüksek bir puanın 1.000 rastgele permütasyonda zamanın yalnızca %5'inde ortaya çıktığını gösterir. Bu nedenle, böyle bir modelin şansın çok üzerinde performans gösterdiği kabul edilebilir. Bu yüzdelik sıralamaların şans eseri beklenenden önemli ölçüde daha büyük olup olmadığını belirlemek için, yani istatistiksel olarak 50. yüzdelik dilim olmak üzere, her model için 100 yinelemenin tamamında medyan LRAP yüzdelik sıralaması hesaplandı ve tek örneklemli bir Wilcoxon işaretli sıra testi yapıldı.
Birincil amaç, köpekler için doğal görsel uyaranların bir kod çözücüsünü geliştirmek olsa da, insanlarla karşılaştırmalar kaçınılmazdır. Burada, iki büyük farka dikkat çekiyoruz: her bir sınıflandırıcı türü için, insan modelleri köpek modellerinden daha iyi performans gösterdi; Ve insan modelleri hem nesne hem de eylem tabanlı modeller için iyi performans gösterirken, köpek modelleri yalnızca eylem tabanlı için performans gösterdi. İnsan modellerinin üstün performansı birkaç faktöre bağlı olabilir. İnsan beyni, köpek beyninden yaklaşık 10 kat daha büyüktür, bu nedenle bir sınıflandırıcı oluşturmayı seçebileceğiniz daha fazla voksel vardır. Modelleri eşit bir temele oturtmak için, aynı sayıda voksel kullanılmalıdır, ancak bu mutlak veya göreceli anlamda olabilir. Nihai model, her beyindeki bilgilendirici voksellerin ilk %5'ine (göreceli bir ölçü) dayanmasına rağmen, sabit sayıda voksel kullanılarak benzer sonuçlar elde edildi. Bu nedenle, performans farklılıklarının insanların ve köpeklerin video uyaranlarını nasıl algıladıklarıyla ilgili olması daha muhtemel görünmektedir. Yukarıda belirtildiği gibi, köpekler ve insanlar algılarında çok duyusal olsa da, uyaranlar bir köpek için bir insandan daha fakir olabilir. Örneğin, boyut ipuçları kaybolabilir ve her şey gerçek dünyanın oyuncak versiyonu gibi görünebilir. Köpeklerin nesneleri şekilden önce boyut ve dokuya göre sınıflandırdığına dair bazı kanıtlar vardır, bu da insanların neredeyse tersidir39. Ek olarak, burada ele alınmayan koku, köpeklerde, özellikle türdeşlerin veya insanların tanımlanmasında, nesne ayrımcılığı için muhtemelen önemli bir bilgi kaynağıdır40,41,42. Bununla birlikte, boyut veya koku ipuçlarının yokluğunda bile, MRI tarayıcısının olağandışı ortamında, sınıflandırıcının hiç çalışmadığı gerçeği, köpeklerle ilgili beyinlerinden kurtarılabilecek bilgilerin hala olduğunu söylüyor. Sadece iki köpek ve iki insanla, tür farklılıkları bireysel farklılıklardan da kaynaklanıyor olabilir. Bununla birlikte, iki köpek, MRI ile eğitilmiş köpeklerin en iyisini temsil ediyordu ve video izlerken hareketsiz durma konusunda mükemmeldi. Daha büyük bir örneklem büyüklüğü, türler arasında daha güvenilir ayrımlar yapılmasına kesinlikle izin verirken, uyanık fMRI yapabilen ve yeterince uzun süre video izleyebilecek az sayıda köpek, tüm köpeklere genellenebilirliği her zaman sınırlayacaktır. Tazı gibi özel ırkların daha ince ayarlanmış görsel beyin tepkilerine sahip olması mümkün olsa da, bireysel mizaç ve eğitimin bir köpeğin beyninden neyin kurtarılabileceğinin ana belirleyicileri olma olasılığının daha yüksek olduğuna inanıyoruz.
Bu tür farklılıkları, köpeklerin videoların hangi yönüne dikkat ettiği sorusunu gündeme getiriyor. Bu soruyu yanıtlamanın bir yaklaşımı, daha basit video uyaranlarına dayanır. Daha sonra, insanların, köpeklerin ve arabaların izole edilmiş görüntülerini kullanarak, hem ayrı ayrı hem de nötr arka planlara karşı, göze çarpan boyutları bir köpeğe tersine çevirebiliriz. Bununla birlikte, bu hem metodolojik olarak verimsizdir hem de gerçek dünyadan gelen uyaranları daha da fakirleştirir. Dikkat sorunu, yalnızca kod çözme yaklaşımıyla, aslında, neyin ilgilenildiğini belirlemek için model performansını kullanarakçözülebilir 43. Bu doğrultuda, buradaki sonuçlar, insanların hem aktörlere hem de eylemlere katılırken, köpeklerin eylemlere daha fazla odaklandığını göstermektedir. Bu, bireylerin yemek yerken oynarken hareket sıklığı gibi düşük seviyeli hareket özelliklerindeki farklılıklardan kaynaklanabilir veya bu aktivitelerin daha yüksek bir seviyede kategorik bir temsilinden kaynaklanıyor olabilir. Bilgilendirici voksellerin köpeğin korteksi boyunca dağılımı, bu temsillerin sadece görsel bölgelerle sınırlı kalacak düşük seviyeli özellikler olmadığını göstermektedir. Daha geniş bir yelpazede video uyaranları kullanılarak yapılan daha fazla çalışma, köpekler tarafından kategori ayrımcılığında hareketin rolünü aydınlatabilir.
Özetle, bu çalışma, insan korteksi için yapıldığı gibi fMRI kullanarak köpek korteksinden doğal görsel bilgilerin kurtarılmasının fizibilitesini göstermiştir. Bu gösteri, ses veya koku olmasa bile, karmaşık sahnelerin göze çarpan boyutlarının köpeklerin video izlemesi tarafından kodlandığını ve bu boyutların beyinlerinden kurtarılabileceğini göstermektedir. İkincisi, bu tür bir görevi yapabilen az sayıda köpeğe dayanarak, bilgi kortekste insanlarda tipik olarak görülenden daha geniş bir şekilde dağıtılabilir ve eylem türleri, aktörlerin veya nesnelerin kimliğinden daha kolay kurtarılabilir gibi görünmektedir. Bu sonuçlar, köpeklerin video ekranları da dahil olmak üzere insanlarla paylaştıkları ortamları nasıl algıladıklarını incelemek için yeni bir yol açıyor ve kendilerinin ve diğer primat olmayan hayvanların dünyayı nasıl "gördüklerini" araştırmak için zengin yollar öneriyor.
Hiç kimse.
Bu analizin geliştirilmesindeki yardımcı görüşleri için Kate Revill, Raveena Chhibber ve Jon King'e, MRI için köpekleri işe alma ve eğitme konusundaki yardımı için Mark Spivak'a ve video oluşturma ve etiketleme konusundaki yardımı için Phyllis Guo'ya teşekkür ederiz. Ayrıca kendini işine adamış köpek sahiplerimiz Rebecca Beasley (Daisy) ve Ashwin Sakhardande'ye (Bhubo) teşekkür ederiz. İnsan çalışmaları, Ulusal Göz Enstitüsü'nden bir hibe ile desteklenmiştir (Grant R01 EY029724 D.D.D.'ye).
Name | Company | Catalog Number | Comments |
3 T MRI Scanner | Siemens | Trio | |
Audio recordings of scanner noise | homemade | none | |
Camera gimbal | Hohem | iSteady PRO 3 | |
Dog-appropriate videos | homemade | none | |
fMRI processing software | AFNI | 20.3.01 | |
Mock scanner components | homemade | none | Mock head coil and scanner tube |
Neural net software | Ivis | 1.7.1 | |
Optical flow software | OpenCV | 4.2.0.34 | |
Projection system for scanner | homemade | none | |
Trophy Cam HD | Bushnell | 119874 | |
Video camera | GoPro | HERO7 | |
Visualization software | ITK-SNAP | 3.6.0 | |
Windows Video Editor | Microsoft | Windows 11 version |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır