David Marr
David Courtnay Marr (Woodford, 1945. január 19. – Cambridge, 1980. november 17.) brit pszichológus, a komputációs idegtudomány atyja.
David Marr | |
Született | 1945. január 19.[1] Woodford |
Elhunyt | 1980. november 17. (35 évesen)[2] Cambridge |
Állampolgársága | brit |
Foglalkozása |
|
Iskolái |
|
Kitüntetései | IJCAI Computers and Thought Award (1979) |
Halál oka | rák |
Sablon • Wikidata • Segítség |
Tanulmányait a neves angol bentlakásos iskolában, a Rugbyban kezdte, majd a cambridge-i Trinity College-ban folytatta, ahol matematikából mesterfokozatot szerzett. Ezt követően PhD hallgatóként az idegtudomány szakirodalmát tanulmányozta, majd megírta doktori disszertációját az emlősök agyműködése témában. 1971-ben érdeklődése a látás felé fordult, 1973-tól a Massachusettsi Műegyetem (MIT) mesterséges intelligencia laboratóriumában dolgozott, 1980-ban pszichológia professzorrá nevezték ki. 1978 telén leukémiát diagnosztizáltak a szervezetében, két évvel később, 1980. november 17-én hunyt el a massachusettsi Cambridge-ben.
Az emberi és a számítógépes látásról szóló nagyszabású műve 1982-ben jelent meg Vision: A Computational Investigation into the Human Representation and Processing of Visual Information címmel.
A kognitív folyamatok leírási szintjei
szerkesztésA kognitív (megismerő) folyamatok három különböző szinten írhatók le. A komputációs szint a legáltalánosabb, és egyben a legmagasabb szintű leírás, míg a hardver szint a legkonkrétabb, legalacsonyabb szintet jelenti. A leírási szintek alkalmazható természetesen a látásra is.
Komputációs szint
szerkesztésA megismerés céljához kapcsolódik. Vizuális észlelés esetében az a cél, hogy a fénymintázat-bemenetet olyan kimenetté alakítsuk, mely információt szolgáltat a külvilág tárgyairól.
Algoritmikus szint
szerkesztésA megismerésben lényeges folyamatok részleteivel foglalkozik: mi a bemenet reprezentációja, és mi az átalakítás algoritmusa.
Hardver szint
szerkesztésA hardver szint az agy, mely korlátokat szab annak, hogy milyen reprezentációkat és algoritmusokat lehet alkalmazni.
A látás komputációs elmélete
szerkesztésMarr szerint a látásban szerepet játszó folyamatok reprezentációk sorozatát hozzák létre. Három fajta reprezentációt különböztetett meg: az első vázlatot, a 2,5 D vázlatot és a 3 D modellt.
Az első vázlat
szerkesztésAz első vázlat a vizuális bemenetet a megfigyelő szempontjából írja le. Két változata van: a nyers első vázlat és a teljes első vázlat. A nyers első vázlat a vizuális kép fényintenzitás-változásairól ad információt, míg a teljes első vázlat úgy jön létre, hogy ezt az információt felhasználjuk a tárgyak számának és alakjának azonosításában.
2,5 D vázlat
szerkesztésAz első vázlatból a 2,5 D vázlatba való átmenet során olyan információt is figyelembe veszünk, mint az árnyék, a mozgás, a textúra, az alak vagy a binokuláris diszparitás. Emiatt a kép már nem 2 dimenziós, de még nem is teljesen 3 dimenziós – innen ered az átmeneti, 2,5 D vázlat elnevezés. Annak érdekében, hogy a két szemből származó információ megfelelően illeszkedjen, Marr és Poggio az alábbi három szabályt fogalmazta meg:
- binokuláris kombinációs szabály: csak akkor lehet összevetni az első vázlat elemeit, ha azok kompatibilisek, például egyforma a színük.
- binokuláris kombinációs szabály: minden elem csak egyetlen másik elemhez illeszkedhet.
- binokuláris kombinációs szabály: az egymáshoz közeli pontok feltehetően ugyanakkora távolságra vannak a megfigyelőtől, és a diszparitás információ figyelembe veszi a távolságot.
3 D modell
szerkesztésA 3 D modell a tárgyak nézőfüggetlen, háromdimenziós leírását adja. Marr és Nishihara három kritériumot írt le a modell reprezentációjához:
- Hozzáférhetőség – azt jelenti, hogy milyen könnyen lehet létrehozni a reprezentációt.
- Hatókör és egyediség – a hatókör arra utal, hogy a reprezentációt mennyire lehet alkalmazni egy adott kategóriába tartozó tárgyakra; egyediségen pedig azt értjük, hogy egy tárgy minden egyes nézete ugyanazt a reprezentációt hozza létre.
- Stabilitás és érzékenység – a reprezentáció magában foglalja a tárgyak közötti hasonlóságot és különbséget is.
Marr és Nishihara szerint a tárgyak leírására szolgáló primitív egységek hengerek, melyek hierarchikusan szerveződnek: a magasabb szintű egységek a tárgy alakjáról, az alacsonyabb szintű egységek pedig a tárgy részleteiről nyújtanak információt.
Irodalom
szerkesztésEysenck, Michael W., & Keane, Mark T. (1997). Kognitív pszichológia. Budapest: Nemzeti Tankönyvkiadó.
Jegyzetek
szerkesztés- ↑ BnF-források (francia nyelven)
- ↑ Representation and recognition of the movements of shapes