Sensitivität höherer Statistiken in natürlichen Vorgängen
Sensitivity to higher-order statistics in natural scenes
Wissenschaftsdisziplinen
Andere Naturwissenschaften (25%); Biologie (25%); Informatik (25%); Medizinisch-theoretische Wissenschaften, Pharmazie (25%)
Keywords
-
Vision,
Natural Scene Statistics,
Neural Coding,
Information Theory,
Neuroscience,
Retina
Visuelle Verarbeitung und Objekterkennung gehören zu den schwierigsten Problemen mit denen Computer Vision konfrontiert ist, gleichzeitig sind dies aber auch Aufgaben, welche unser Gehirn ohne bewusste Anstrengung bewältigt. Welche Berechnungen werden in aufeinanderfolgenden neuronalen Verarbeitungsschichten ausgeführt, wenn die, von der Retina kodierten, Lichtsignale durch den LGN zum primären visuellen Cortex und zu höher geordneten Hirnarealen wie V2, V4 und IT weitergeleitet werden? Dieser Frage hat sich die Neurowissenschaft von zwei Seiten genähert: Experimentell wird die Aktivität individueller Sehnerven gemessen, während sie auf einfache kontrollierte visuelle Stimuli, wie zufällig flackerndes Licht oder driftende Bildraster, reagieren. Der theoretische Zugang basiert auf statistischen Eigenschaften natürlicher Bilder. Theoretische Vorhersagen, wie ein neuronales System Bilder optimal verarbeiten sollte, werden mit den Beobachtungen verglichen. Wenig Forschung wurde an der Schnittstelle zwischen den Zugängen betrieben, indem mit synthetischen, aber naturnahen, Stimuli das visuelle System getestet wird. Das stellt ein Problem dar: Neuronen in höher geordneten Arealen reagieren nicht gut auf einfache Stimuli, aber wir wissen nicht, wie komplexe, naturnahe und parametrierbare Stimuli, auf die diese Neuronen ansprechen, generiert werden. Unsere Fähigkeit abzuleiten, wie das visuelle System Formen, Textur und Raum-Zeit-Strukturen der natürlichen Umgebung verarbeitet, ist dadurch stark limitiert. Hier schlagen wir vor, drei wichtige Aspekte dieses Problems zu behandeln: Erstens werden wir die statistische Struktur höherer Ordnung in natürlichen Szenen untersuchen. Über Leutchtdichtehistogramme und -spektren ist viel bekannt, und im vergangen Jahrzehnt wurde die Struktur "orientierter Kanten" probabilistisch modelliert. Wir werden statistische Modelle von binären Bildstücken und Konturfragmenten - Bausteine geschlossener Konturen, die Reaktionen in Arealen höher als V1 auslösen - erstellen. Zweitens werden wir neue statistische Inferenztechniken entwickeln, um Modelle für das Verhalten von Neuronen in Reaktion auf statistisch komplexe Stimuli zu erstellen. Wir werden die auf generealisierten linearen Modellen und maximal informativen Dimensionen basierenden Methoden erweitern, um nicht-lineare Eigenschaften von Stimuli, die neuronale Reaktionen auslösen, zu extrahieren, und retinale Kodierung mit differenzieller reverser Korrelation zu untersuchen. Drittens werden wir in Zusammenarbeit mit experimentellen Gruppen naturnahe parametrierbare Stimuli entwerfen um das Verhalten von retinalen Ganglienzellen und Neuronen in höher geordneten Arealen des visuellen Cortex zu erforschen. Zusammenfassend ist es unser Ziel, drei ineinandergreifende Fragen über das Sehen zu adressieren: Was sind die statistischen Eigenschaften höherer Ordnung in natürlichen Szenen, die für natürliches Sehen relevant sind? Wie können wir visuelle Signalwege systematisch auf Empfindlichkeit gegenüber diesen Eigenschaften prüfen? Kann die "effiziente Kodierungshypothese" auch auf Statistik höherer Ordnung und zentrale visuelle Verarbeitung ausgeweitet werden?
In diesem Projekt untersuchten wir, wie komplexe visuelle Stimuli von der Retina und darüber hinaus verarbeitet werden. Wir berichten drei Gruppen zusammenhängender Ergebnisse, jede davon brachte den Stand des Gebiets bedeutsam voran. Erstens untersuchten wir gemeinsam mit unseren experimentell arbeitenden KollegInnen die simultanen Aktivitätsmuster, welche die retinalen Ganglionzellen erzeugen, wenn die Retina von naturalistischen Filmen stimuliert wird. Retinale Ganglionzellen sind die Output-Zellen der Retina, die visuelle Information an das Gehirn senden. Wir bestätigten zwei zuvor aufgestellte Hypothesen: Erstens, dass der Code retinaler Neuronen höchst kollektiv ist, und die Aktivitätsmuster in Cluster oder Modi organisiert sind, die den externen Stimuli gut entsprechen. Zweitens, dass der Code Kritikalität aufweist. Kritikalität ist eine besondere Eigenschaft, die durch die statistische Physik formal als der Punkt definiert wird, an dem die Code-Kapazität maximiert werden kann. Wir haben auch probabilistische mathematische Modelle entwickelt, die diese Eigenschaften vollständig beschreiben. Wir zeigten, dass sie eine exzellente Darstellung der retinalen Aktivität bieten. In Summe beweist diese Arbeit, wie wichtig es ist, neuronales Verhalten in einem mathematischen Rahmen zu untersuchen, der gleichzeitig das präzise Verhalten einzelner Neuronen und die emergente, kollektive Dynamik erfasst. Dieses Ergebnis ist höchst relevant für den neuronalen Code auch über die Retina hinaus (tatsächlich wurde es, angeregt durch unsere Arbeit, auch an anderen Gehirnregionen angewendet), und eröffnet neue Fragen zu den funktionalen Gründen einer solchen Organisation. Zweitens fragten wir, wie der retinale Code dekodiert werden kann. Beim Dekodieren suchen wir ein mathematisches Modell, dass die Antworten der retinalen Neuronen als Input nimmt und vorhersagen kann, welches Bild oder welche Filmsequenz die Retina gesehen hat. Zuvor wurde eine solche Dekodierung nur bei sehr einfachen Stimuli angewendet. Hier haben wir zum ersten Mal erfolgreich einen komplexen, sich zufällig bewegenden Stimulus dekodiert. In weiterführender Arbeit dekodierten wir zum ersten Mal Pixel-für-Pixel einen hoch-dimensionalen Film. Dekodieren lehrt uns, wie Information aus dem neuronalen Code extrahiert werden kann. Wir beobachten, dass, obwohl neuronale Antworten streng nichtlinear sind, das Inputbild durch lineare Operationen ausgehend vom neuronalen Output sehr gut rekonstruiert werden kann. Diese Leistung kann verbessert werden, indem anspruchsvollere, nicht-lineare Techniken verwendet werden, was wir auch intensiv untersuchten. Drittens erweiterten wir in zwei theoretischen Artikeln die Theorie des effizienten Codings wesentlich. Effizientes Coding postuliert, dass Neuronen beschränkte Ressourcen nutzen, um die meiste Information über die Inputstimuli zu übertragen. Es ist möglich, diese Aussage im Kontext der Informationstheorie mathematisch zu formalisieren. Im ersten Artikel formulierten und testeten wir zum ersten Mal ein effizientes Coding-Prinzip, das für statistische Strukturen höherer Ordnung in Bildern gilt und daher die Verarbeitung über die Retina hinaus, im visuellen Kortex, betrifft. Wir zeigten, dass dies die menschlichen Antworten in Wahrnehmungstests gut vorhersagt. Im zweiten Artikel bieten wir ein mathematisches, vereinendes Gerüst, das die drei Theorien des neuronalen Coding (effizientes, sparse und prädiktives Coding) konsistent zusammenbringt. Wir sehen das als wichtiges theoretisches Ergebnis, das manche scheinbaren Paradoxa in diesem Gebiet löst, und das die Theorie des neuronalen Coding auf neue Systeme erweitert. Diese Arbeit ist relevant für die sensorische Verarbeitung in der Retina und darüber hinaus, und Bemühungen, die Vorhersagen der Theorie zu testen, sind im Gange. In Summe waren die Fortschritte, die in diesem Projekt erreicht wurden, möglich, indem wir von der Verwendung traditioneller, einfacher Stimuli abwichen und die Retina unter reicherer, naturalistischerer aber immer noch experimentell gut kontrollierter Stimulation untersuchten. Das hat sich als ein leistungsfähiger Ansatz erwiesen, den wir weiterverfolgen möchten. Wir sind der Überzeugung, dass er sehr nützlich ist auch für die sensorische Verarbeitung im Kortex.
- Olivier Marre, Institut de la Vision - Frankreich
- Vijay Balasubramanian, University of Pennsylvania - Vereinigte Staaten von Amerika
Research Output
- 897 Zitationen
- 19 Publikationen
- 1 Datasets & Models
-
2016
Titel Multiplexed computations in retinal ganglion cells of a single type DOI 10.1101/080135 Typ Preprint Autor Deny S Seiten 080135 Link Publikation -
2016
Titel Error-Robust Modes of the Retinal Population Code DOI 10.1371/journal.pcbi.1005148 Typ Journal Article Autor Prentice J Journal PLOS Computational Biology Link Publikation -
2016
Titel Relevant sparse codes with variational information bottleneck. Typ Conference Proceeding Abstract Autor Chalk M Konferenz NIPS '16 -
2016
Titel Nonlinear decoding of a complex movie from the mammalian retina DOI 10.48550/arxiv.1605.03373 Typ Preprint Autor Botella-Soler V -
2015
Titel Thermodynamics and signatures of criticality in a network of neurons DOI 10.1073/pnas.1514188112 Typ Journal Article Autor Tkacik G Journal Proceedings of the National Academy of Sciences Seiten 11508-11513 Link Publikation -
2015
Titel High Accuracy Decoding of Dynamical Motion from a Large Retinal Population DOI 10.1371/journal.pcbi.1004304 Typ Journal Article Autor Marre O Journal PLOS Computational Biology Link Publikation -
2017
Titel Toward a unified theory of efficient, predictive, and sparse coding DOI 10.1073/pnas.1711114115 Typ Journal Article Autor Chalk M Journal Proceedings of the National Academy of Sciences Seiten 186-191 Link Publikation -
2017
Titel Multiplexed computations in retinal ganglion cells of a single type DOI 10.1038/s41467-017-02159-y Typ Journal Article Autor Deny S Journal Nature Communications Seiten 1964 Link Publikation -
2017
Titel Probabilistic models for neural populations that naturally capture global coupling and criticality DOI 10.1371/journal.pcbi.1005763 Typ Journal Article Autor Humplik J Journal PLOS Computational Biology Link Publikation -
2017
Titel Towards a unified theory of efficient, predictive and sparse coding DOI 10.1101/152660 Typ Preprint Autor Chalk M Seiten 152660 Link Publikation -
2016
Titel Information Processing in Living Systems DOI 10.1146/annurev-conmatphys-031214-014803 Typ Journal Article Autor Bialek W Journal Annual Review of Condensed Matter Physics -
2018
Titel Nonlinear decoding of a complex movie from the mammalian retina DOI 10.1371/journal.pcbi.1006057 Typ Journal Article Autor Botella-Soler V Journal PLOS Computational Biology Link Publikation -
2014
Titel Variance predicts salience in central sensory processing DOI 10.7554/elife.03722 Typ Journal Article Autor Hermundstad A Journal eLife Link Publikation -
2014
Titel High accuracy decoding of dynamical motion from a large retinal population DOI 10.48550/arxiv.1408.3028 Typ Preprint Autor Marre O -
2014
Titel Searching for Collective Behavior in a Large Network of Sensory Neurons DOI 10.1371/journal.pcbi.1003408 Typ Journal Article Autor Tkacik G Journal PLoS Computational Biology Link Publikation -
2016
Titel Semiparametric energy-based probabilistic models DOI 10.48550/arxiv.1605.07371 Typ Preprint Autor Humplik J -
2014
Titel Thermodynamics for a network of neurons: Signatures of criticality DOI 10.48550/arxiv.1407.5946 Typ Preprint Autor Tkacik G -
2014
Titel Information processing in living systems DOI 10.48550/arxiv.1412.8752 Typ Preprint Autor Tkacik G -
0
Titel Nonlinear decoding of a complex movie from the mammalian Retina. Typ Other Autor Botella-Soler V
-
2017
Link
Titel Data from: Error-robust modes of the retinal population code DOI 10.5061/dryad.1f1rc Typ Database/Collection of data Öffentlich zugänglich Link Link