A kognitív nézőpont megjelenése a filmelméletben egyidős a film megszületésével, lévén hogy a mozi, illetve annak történetileg megelőző válfajai a mozgás illúziójának előállításán alapulnak. A film sajátos művészeti médium, amennyiben az illúziókeltés, érzékszerveink megtévesztése elengedhetetlen ábrázoló funkciójának működéséhez. Természetesen illúziókeltő elemek előfordultak/nak más művészeti ágakban is (mint a különféle perspektívák alkalmazása a festészetben, de ilyenek például a hangutánzó szavak a költészetben, a térnövelő geometriai formák az építészetben, vagy a hegedű pengetett hangjainak esőidéző jellege a Négy évszakban), azonban a mű egésze nem hagy kétséget önálló – ábrázoló – státusát illetően. Más szóval, a megtévesztő elemek – például a képi mélység – érzékelése együtt jár a megtévesztettség tudatával. Szokás ennek kapcsán a filmnézéskor kettős tudatról, vagy médiumtudatosságról beszélni, amikor is az ábrázolt jelenet tudata összefonódik az ábrázoló sík (vászon, szövet/g) tudatával. Az ábrázolt jelenetet ekkor a képben látjuk, vagyis a képfelszín alapján konstituáljuk. Maga a megtévesztés viszont az ábrázoláson belül mint kompozicionális elem (vizuálisan) lokalizálható-analizálható.Kivéve az úgynevezett szemfényfesztő képek (trompe l’oeil) esetében, amikor a kép egészét látjuk térbeli jelenetként, vagyis másként, mint felületet; ezért merülhet fel ez utóbbival kapcsolatban, ahogyan Richard Wollheimnél olvasható, az aspektuslátás. Maga a reprezentációs viszony azonban nem redukálható a szóban forgó "megtévesztő" aspektusra, vagy legalábbis emellett próbálunk érvelni a későbbiekben.1 A film esetében azonban nem így van. Mégpedig két különböző okból.
Az egyik ok a kép ontológiai transzparenciájával kapcsolatos, mely szerint – Wollheim kifejezéseivel éve – a moziban a filmezett világot nem a filmben, hanem a filmen keresztül látjuk. Ekkor a filmet a látásjavító – prosztetikus – eszközökhöz hasonlítjuk, mintegy meghosszabbított érzékszervként kezeljük. Ezért lehet reproduktív, illetve projektív illúzió forrása, amikor is a filmképen keresztül az aktuális, illetve a virtuális valóságot látjuk. A másik ok a mozgásillúzió megvalósulása a kivetített állóképek mozgása révén. Mivelhogy e kétféle illúzió elválaszthatatlan a filmtől, a filmet a születésétől fogva, de Münsterbergtől (1915) mindenképpen végigkísérik a különféle kognitív-pszichológiai magyarázatok. Itt nem térhetünk ki a kognitív tudományok szerteágazó, interdiszciplináris jellegére, de érdemes a jelenlegi általános felfogás szerint előzetesen megkülönböztetnünk háromféle szintet, ahol a filmi befogadás legfontosabb aspektusai megragadhatók: a) a képi érzékelést, az érzékszervi befogadás alacsony szintjét, ahová a mozgás- és a reproduktív illúzió sorolható; b) a képi ábrázolás, vagyis a reprezentáció megértésének magasabb szintjét; és c) az absztrakt gondolkodás szintjét, ahol sajátos értelemben a kép metaforikusságának, általában pedig egy vizuális filmi retorikának a lehetőségei felvethetők. Egy kognitív filmelmélettől nemcsak azt várnánk, hogy leírja a filmi befogadást ezeken a szinteken, hanem hogy rámutasson a szintek egymásra épülésére vagy kölcsönös függésére. Ezzel szemben nem hogy nem létezik ilyetén egységes kognitív filmelmélet, de még az egyes szintek leírása is igen hézagos.
De vegyük sorra egy kicsit részletesebben az egyes leírási szinteket. A legtöbbet talán a mozgókép érzékeléséről tudhatunk, elsősorban Julian Hochberg, Barbara és Joseph Anderson munkáiból. Ám a hozzájuk hasonló felfogások James Gibson ökológiai látáselméletén alapulnak, s ezért napjainkban inkább a film ökológiai megközelítését kínálják. Anélkül, hogy részletekbe bocsátkoznánk, az ökológiai felfogásról elmondható, hogy sokkal kevesebb terhet ró a kognitív folyamatokra, amennyiben a virtuális/fiktív világ felépítését az aktuális érzékeléssel analóg módon és ugyanazon forrásból, az optikai információból kiindulva képzeli el. Ily módon elutasítja a szimbolikus reprezentációt mint önálló kognitív szintet, és úgy tartja, hogy a projektív illúzió kényszerítő ereje abból fakad, hogy a mozgókép érzékelésekor az elme az aktuális világra vonatkozó információ feldolgozása szerint jár el, következésképpen felesleges egy magasabb sui generis reprezentációs szintet tételezni. Ezzel a megközelítéssel az a baj, hogy nem képes különbséget tenni a filmezett valóság, vagyis a színész, a díszlet stb. és az ábrázolt fiktív világ között. Más szóval azon elemek között, amelyeket a kognitív filmelmélet egyik központi alakja, Noël Carroll a filmi ábrázolás "fizikális" és "nominális" formáinak nevez. Azt mondhatnánk, hogy az ökológiai elmélet a filmi reprezentáció lehetőségi feltételeit adja meg, míg a kognitív megközelítés, miként például Richard Allen projektív illúziója, a reprezentáció formáival és azok beágyazottságaival is el kíván számolni. A látszólagos mozgás érzékelése szemünk tehetetlenségén alapszik. Ez valódi illúzió abban az értelemben, hogy a mozgást háromféle manipuláció: kamera(mozgás), vágás és a vetítőgép (mozgása) eredményeképpen érzékeljük. Ami itt számunkra az ökológiai megközelítésből fontos, az az, hogy a látszólagos filmi mozgás érzékelése ugyanazon idegi mechanizmusok révén történik, mint a valóságos mozgásé. Ez a tény ugyanis azt látszik erősíteni, hogy a filmi mozgás észlelése nem egyszerűen elkerülhetetlen, hanem elsődleges forrása a filmi valóság – a keresztüllátás [//seeing-through//] fogalmával meghatározott – illúziójának.
Ami viszont annyit jelent, hogy a keresztüllátás nem elsősorban a képrögzítési technika közvetlen oksági értelmében forrása a reproduktív illúziónak. Ha így volna, akkor a film valóban hasonlatos lenne a fotográfiához. A film és fotó ilyetén transzparenciáját nevezi viszont Allen reproduktív illúziónak akkor, ha hamis vélekedést kelt a nézőben az ábrázolt világ valóságosságát illetően: amikor a (film)képeken keresztül látunk, azt hisszük, hogy egy rögzített valóságot látunk, miközben a filmezett világ csupán díszlet, a valóság látszata. Vegyük észre azonban, hogy ebben az esetben valójában egy perceptuális és egy tudati tény kettősségéről, illetve összemosásáról van szó: a hamis vélekedést egyaránt kiválthatja közvetlenül a látott képek "valószerűsége", és közvetve a képrögzítés tudata. Az illúzió, a hamis vélekedés létrejöhet a valóságnak fényképek által történő érzékelése és a képen látott világ konstruálása révén: egy tárgy fényképe lehet megtévesztésig hasonló magához a tárgyhoz, és lehet olyannyira manipulált, hogy nem a puszta látvány, hanem csupán a rögzítés módjának tudata hozza létre az illúziót. Az első esetben a látvány nyújt megtévesztő információkat valóságosságát illetően, míg a második esetben az előfeltevéseink hibáztathatók. Csak ez utóbbi esetben "léphet közbe" a médiumtudatosság. Mivel az érzékelési és a következtetési mechanizmusaink egyaránt felelősek lehetnek a fotó és a filmkép transzparenciájáért, vitatható Allen ama felfogása, hogy fénykép révén nem jöhet létre szemfényvesztő hatás (trompe l’oeil): egy "tökéletes" fényképet láthatok úgy, mint valóságos tárgyat; de még akkor is, ha tudom, hogy fénykép, "tárgyszerűségének" érzékelése létrehozhatja bennem a fényképen keresztül látott tárgy valóságosságának tudatát. Ha viszont a filmi reproduktív illúzió elsődleges forrása nem a filmkép keletkezésének oksági története, hanem a mozgásillúzió, akkor egyrészt ezért sem vethető össze a fotóval, másrészt a filmi valóság megtévesztő ereje továbbra is perceptuális alapú marad.
Ezért sorolható a valamiként-látás [//seeing-as//] alá, és mint ilyen, jobban hasonlít a tükörillúzióhoz, mint a tojástartó homorú/domború képének váltogatásához. A tükörillúzióval kapcsolatban kérdéses továbbá, hogy a szemfényvesztő festménnyel szemben miért ne beszélhetnénk valamiként-látásról, hiszen a tükörkép esetében is úgy győződünk meg az illúzióról, hogy a tükör felületét – még ha nem is feltétlenül vizuálisan – megtapasztaljuk. A problémát véleményünk szerint az okozza, hogy Allen összemossa a reprezentáció szemiotikai viszonyát (valami valami helyett áll) a valamiként-látás fenomenológiájával, jóllehet különbséget tesz a festmény ábrázoló státusa és a fotón keresztül ábrázolt világ státusa között. Az ábrázolás mikéntje azonban nem keverendő össze az ábrázolt ontológiai státusával, még akkor sem, ha bizonyos esetekben, mint a fotó vagy a film esetében, a rögzítés módja evidencia lehet az ábrázolt világ valóságosságára nézve. Amikor valamit (valami mást) ábrázolóként látunk, vagyis mint olyat, ami valami más helyett áll, akkor azt valamiként látjuk, de magát az ábrázoltat nem látjuk valóságosként vagy fiktívként: a valóságosság nem aspektus, miként a létezés sem predikátum. Ha van váltogatás, mint a nyúl-kacsa ábra esetében, az nem a valóságos vagy fiktív nyúl vagy kacsa között adódik. Valamit nem abban az értelemben látunk valóságosnak vagy fiktívnek, mint ahogyan nyúlnak vagy kacsának vagy bármi másnak látjuk.
Talán még világosabbá válik mindez, ha különbséget teszünk a tárgyfelismerést és a valóságosságot alátámasztó minőségek, illetve ismeretek alkalmazása között. A keresztül-látás és a belőle fakadó reproduktív illúzió azt a határesetet jelöli, amikor az ábrázolás módjának tapasztalata nem része szükségképpen az ábrázolt tárgy tapasztalásának. Igen kétségesnek tűnik számunkra, hogy e két tapasztalat elkülönítése fenntartható azokban az – Allen által is említett – esetekben, amikor a filmre történő rögzítés módja manipulált, akár azt is mondhatnánk, festményszerű. (Van egyáltalában nem manipulált rögzítési mód?) De még ha így is volna, éppen mert ábrázoló és ábrázolt kauzális viszonya önmagában nem látható, legföljebb a technikai hatások (szemcsésség, fényhatások, textúra stb.) azok, a tárgy valóságosságára csupán következtethetünk, de nem láthatjuk. A keresztül-látás önmagában nem hordoz erősebb evidenciát az ábrázolt tárgy valóságosságát illetően, mint egy portré esetében ama tény, hogy egy valóságos személy szolgált modellként. Amikor egy (film)képen látott tárgyat valóságosként érzékelünk, valójában meghatározott konvenciók vagy tanult mechanizmusok szerint járunk el. A korabeli mozdony látványa azért válthatott ki riadalmat, mert bizonyos kiugró aspektusok (mozgás, alak stb.) érzékelése igencsak hasonlított a valóságos tárgy (mozdony) érzékeléséhez. Mihelyst az ember felismert más aspektusokat (tér-idő) is, a látvány valóságosságába vetett hit meggyengült.Gondoljunk csak a dokumentarista konvenciók megváltozására: egészen más feltételek mellett tekintünk egy II. világháborús filmet, illetve napjainkban egy híradófilmet dokumentumértékűnek, miközben mindkét esetben elmondható, hogy a filmen keresztül látjuk az eseményeket.A neorealista vagy dokumentarista filmművészet például előszeretettel alkalmaz amatőr színészeket, akik úgymond önmagukat vannak hivatva megjeleníteni (lásd szereplő – fizikális szint – és figura – nominális szint – névazonossága). Azonban éppen az amatőr játékmód "sutasága"– a megjelenítés módja – hívja fel a néző figyelmét a látvány nemvalóságosságára, míg hasonló "játékmód" másképp hat, ha dokumentumfilmben fordul elő. Fikciós és dokumentumfilm különbsége viszont műfaji, azaz " konvencionális" kérdés, vagyis csupán következtetünk rá. (Köszönet Mánfai Alice-nak, hogy e játékmódra felhívta a figyelmemet.)2 Éppen ezért nehéz lenne azt állítani, hogy a film esetében a megjelenítés módja sohasem része a megjelenített tárgy tapasztalatának. A filmi keresztül-látás fogalmában tehát összekeverednek a látvány és a tudat elemei. Amikor a filmezett jelenetet valóságosnak tartjuk, nem egyszerűen annak látjuk, hanem következtetünk rá. Látvány és ábrázolt különbsége éppen abban van, hogy azt, amit látunk, nem valami(lyen)ként, hanem valami helyett állóként fogjuk fel. Vitathatatlan, hogy a mozi jelenlévővé, azaz láthatóvá tesz egy ábrázolt világot, Metz szavaival, azonosulásra késztet. Mégis, ki kell mondanunk: maga az ábrázolt világ, annak valóságossága vagy fiktivitása sohasem válhat láthatóvá, így aspektus sem lehet. Tehát a film ábrázolóképessége, a reprezentáció perceptuális eredetű, de maga az ábrázolt – a szó nominális értelmében – nem az.
A keresztül-látásból fakadó reproduktív illúzióba tehát beleértjük a film által előidézett mozgásillúziót, mely, mint láttuk, alacsony szintű kognitív folyamat, s így nem tudjuk befolyásolni: nem tudjuk nem látni. A reproduktív illúzió tapasztalata azonban Allen szerint felfüggeszthető, amennyiben az ábrázolt világ fiktív jellegéről értesülünk. Ha azonban igaz az, hogy ez utóbbi nem látható, akkor felmerül a kérdés: mi az, amit mozogni látunk a filmen? Mintha a mozgás látása elkülönülne attól, amit látunk; mintha a mozgás tulajdonított és nem velejáró tulajdonsága lenne a látottnak; gondoljunk csak az animációs filmekre, mozogni láthatunk tárgyakat vagy akár vonalakat, ábrákat is. Ennek oka könnyen lehet az, hogy a mozgás érzékelése neurálisan a forma, az alak, a szín, vagyis a tárgy érzékelésétől eltérő úton halad. Másfelől, a valóságos és a látszólagos filmi mozgás érzékelésének egyneműsége erős érv lehet a reproduktív illúzió mellett: a mozgó képeket szinte automatikusan a mozgás képeivé alakítjuk. Olyannyira, hogy a reproduktív illúzió sohasem függesztődik fel: amikor egy jelenet dramatizált jellegéről értesülünk, akkor csupán a "nominális" értelemben ábrázolt világ valóságosságába vetett hitünket függesztjük fel, s nem a "fizikális" ábrázolásét: továbbra is egy mozgó valóságos ember, a színész Robert de Niro képét látjuk. Eszerint minden film dokumentumfilm, legalábbis "fizikális" szinten. Minden film nézhető úgy, mint valóságos emberek mesterkedése egy fikció megjelenítésre. Ez teszi lehetővé, hogy nominálisan egy virtuális valóság projektív illúziója legyen, jóllehet ahhoz, hogy a mozgóképet virtuális valóságként lássuk, el kell tekintenünk attól, hogy bárminek is "fizikális" reprodukciója lenne. Allennek a projektív illúzió fogalmára van szüksége ahhoz, hogy a médiumtudatosságot összeegyeztesse a filmi nominális ábrázolással. Kérdés azonban, hogy a filmet valóban láthatjuk-e projektív illúzióként, s nem csupán konstruáljuk a virtuális világot annak alapján, amit látunk, vagyis a filmnek mint "fizikális" reprodukciónak az érzékelése révén. Vajon valóban elmosódik a különbség nominális és fizikális ábrázolás között és Robert de Nirót mint Jake La Mottát látjuk? Vitathatatlan, hogy fennáll az illúzió lehetősége, mint ahogyan meg is valósul, amikor valaki, mondjuk a 22-es csapdáját nem fikciónak, hanem a II. világháborút bemutató filmnek tekinti. Azonban éppen mivel illúzió, pontosabb lenne úgy fogalmazni, hogy de Nirót mint La Motta megszemélyesítőjét látjuk és – az azonosulás bizonyos szintjén – de Niróról azt hisszük, hogy Jake La Motta, vagy azt hisszük, hogy mint La Mottát látjuk.
E különbségtétellel a hangsúlyt a rendezés (mise en scène) felé toljuk el. Ha "a filmben minden a rendezés művészete", akkor a film a színházhoz, s nem a képzőművészethez közelít. A különböző filmes technikák előtérbe helyezése, maga a szerzői film ezt a felfogást látszik alátámasztani; míg a hollywoodi filmkészítés, a sztárkultusz a projektív illúzió felé mutat. Úgy véljük, a fenti különbségtétel jelentőségére utal James Peterson is, amikor az avantgárd film kognitív megközelítését javasolja, mégpedig a problémamegoldó gondolkodás és az inferenciális feldolgozási modell alapján. Nem véletlen, hogy épp azokat a határeseteket tematizálja, amelyeket Allen a túlzott médiumtudatosság miatt kívül rekeszt a projektív illúzió körén. A következtetésalapú megközelítés szerint a filmképek racionális értelmezésre várnak, mely lehet narratív vagy másmilyen, de mindenképpen egy reprezentáció megértése, s ennyiben nem puszta látvány. A szemiotikai értelemben vett reprezentáció mindig közvetett, közvetlenül nem látható, hacsak nem paradoxális, mint az óceánt ábrázoló festményből kiömlő víz. Ahogyan az ilyen víz sem látható, csupán egy másik képen ábrázolható, a projektív illúzió sem az érzékszerveket, hanem a magasabb kognitív műveleteket végző elmét téveszti meg. Az, hogy az illúzió lehetséges, persze a "fizikális" ábrázolás függvénye; az azonban, hogy Robert de Nirót mint Jake La Mottát látjuk, nem pusztán a látásunknak, hanem egy heurisztika alkalmazásának az eredménye, mely ez esetben egy narratíva megértését optimalizálja. Máskor viszont a következtetési mechanizmusok nem narratív jelentéseket eredményeznek.
Ennélfogva a reprezentációs elméletekkel az a probléma, hogy elvitatják a filmtől, vagy túlságosan korlátozzák azt a lehetőséget, hogy absztrakt, következésképpen metaforikus jelentést hordozzon. Van ugyan magának Carrollnak is egy metaforameghatározása, azonban a metaforát csak a narrativitás ellenében engedi meg: csak olyan elemek értelmezhetők metaforikusan, amelyek inkongruensek, azaz nem illeszthetők az elbeszélésbe. Következésképpen, minél kevésbé narratív egy film, annál metaforikusabb. Ennek oka, hogy Carroll magát a filmképet, s nem annak – literális – jelentését akarja metaforaként definiálni, vagyis a metaforát a filmben látja. Ezt viszont a néző csak akkor tehetné meg, ha "nem keresztüllátna" az adott filmképen. Szerencsésebb a metaforát és más fogalmi lehetőséget nem a reprezentáció szintjéhez, hanem egy különálló feldolgozási szinthez kötni, ahol mindenekelőtt következtetési stratégiáinkat alkalmazzuk. Véleményünk szerint a metafora sohasem látható, hanem kikövetkeztethető. Igaz, hogy könnyebben következtethetünk rá olyankor, amikor a filmképek narratív értelmezése mint heurisztika kudarcot vall, ez azonban még nem jelenti azt, hogy máskülönben narratív elemek nem kaphatnak metaforikus értelmezést. Amikor Carroll a filmi metafora egyik feltételéül szabja a fizikai összeegyeztethetetlenséget (a komposszibilitás hiányát), ezt perceptuálisan – a fizikai világunk perceptuálisan megnyilvánuló törvényszerűségei szerint – érti; azonban a legtöbb esetben, például az úgynevezett belső montázsnál az egymás mellé került – egyébként narratív – elemek össze nem illése csak a fogalmi eltávolítás révén válik észrevehetővé. De hasonlóképpen, a grafikai össze nem illés vagy egyszerűen a grafikai–kompozicionális ellentét is beindíthatja a metaforikus értelmezést. Általánosságban elmondhatjuk, hogy az elemek össze nem illése mindig csak kontextuálisan és egy adott absztrakciós szinten értelmezhető. A vizuális metafora lehetősége tehát attól függ, hogy milyen törvény-, illetve szabályszerűségeket tekintünk relevánsnak az adott filmképet illetően; a skála igen széles: a logikai és fizikai törvényektől a kulturális és konvencionális szabályokig terjed. Persze ez nemcsak a filmre, hanem a fotóra is igaz, amennyiben minden konkrétsága ellenére a fotó is képes típus kifejezésére, vagyis a kategorialitásra.
A következtetésen alapuló feldolgozási modell természetesen nem csak a harmadik, legmagasabb szinten alkalmazható. Számos (többek között Gombrich és Gregory nevével fémjelzett) elmélet szól arról, hogy már maga az érzékelés is hipotézistesztelés révén történik. Bordwell Elbeszélés a játékfilmben című munkájában pedig konstruktivista alapokon érvel amellett, hogy a történet megértése során a "befogadó […] »arra köt fogadást«, amit a legvalószínűbb hipotézisnek tekint".Bordwell, David: Elbeszélés a játékfilmben. (ford.: Pócsik Andrea) Budapest: MFI: 1996. p. 44.3 A hipotézisek megalkotását az érzékelés, az előzetes tudásból és tapasztalatból származó sémák, valamint a film anyagát illető konvenciók befolyásolják. A valódi kérdés persze nem maga a sémahasználat, hanem hogy a látottakból mire alkalmazzuk azokat; vagyis hogyan szelektálunk az elérhető információk közül. Annál is inkább, mivel mint Peterson az avantgárd filmet illetően kifejti, az embernek általában rosszul megfogalmazott problémákkal kell szembenéznie, amelyekre "hiányos és kétértelmű információk" alapján eleve csak "félmegoldásokat" találhat. Az egyik – mindenekelőtt a kognitív nyelvészetben – uralkodó nézet szerint az elérhető megoldások arányban vannak kognitív erőfeszítéseinkkel: mindig a lehető legkisebb erőfeszítéssel a lehető legnagyobb eredményt próbáljuk elérni. Ez az evolúcióelméleti megközelítés azonban egyértelműen csak az alacsonyabb szintű kognitív működésekre vonatkoztatható; a kulturálisan és transzkulturálisan vezérelt kognitív stratégiák racionalitása, ha egyáltalában, akkor csak kontextuálisan állapítható meg. Míg az életfunkciók esetében többé-kevésbé meghatározható, mely viselkedési stratégiák számítanak jövedelmezőnek vagy optimálisnak, a művészet esetében, s így a film nézésekor nehezen lehetne megmondani, hogy valaki miért fektet plusz energiát például a Bordwell értelmében vett stílus feltérképezésébe. Egyáltalában, hogyan lehetne "mérhető" a kognitív erőfeszítés önmagában, az előzetes elvárások, érzelmi motivációk nélkül? És hogyan mérhető az elért megoldások "színvonala", bonyolultsága? Ha a stratégiaválasztást nem a túlélés, hanem például az élvezni akarás határozza meg, akkor könnyen lehetséges, hogy valaki nem az előzetes sémák alapján választ, hanem éppen azokat kívánja elkerülni. "Miért csináljuk egyszerűen, ha lehet bonyolultan is" – mondta egy bécsi matematikus. Kétségtelen, hogy az új befogadása csak a már ismertre vonatkoztatva mehet végbe. De hogy ez utóbbiból mit és mennyit használunk fel, éppen annyira bizonytalan, mint az elénk táruló információk szelektálása. A biológiai motivációk kiterjesztése a magasabb tudati tevékenységre az egyedi helyzetek félreismerésével vagy elkendőzésével jár.
Éppen ezért, arra a kérdésre, hogy miért merülünk el bizonyos problémák megoldásába inkább, mint másokéba, annál nehezebb válaszolni, minél magasabb kognitív tevékenységek forognak kockán. Nem véletlen, hogy a kognitív megközelítés bőbeszédű apostola, Noël Carroll az "eseti elméletalkotást" szorgalmazza. Vagyis szembehelyezkedik minden, általa esszencialistának nevezett megközelítéssel, mely a mozit egy meghatározott tulajdonságra (médium, jelszerűség, struktúra) vagy elvre (marxizmus, pszichoanalízis) akarja visszavezetni.Carroll nézeteiről részletesebben, illetve azok kritikájához ld. Tarnay László: Hátsó bejárat az esszencializmushoz. Metropolis 2 (1998) no. 2. pp. 132–139.4 De mit ajánl Carroll cserébe? Kontextuálisan motivált kérdésfeltevést és problémamegoldást, melynek viszonylatában az egyes rivalizáló válaszok összemérhetők. De vajon mennyiben kognitív egy efféle felfogás? Kár lenne tagadni, hogy a kognitív tudományok módszertana lényegesen különbözik Carroll felfogásától, aki sokkal inkább tekinthető empiristának, mint kognitivistának. Hacsak nem tekintjük az irodalomelméletben régóta divatos, a befogadást középpontba állító recepcióesztétikát is a kognitivizmus egyik válfajának. Persze Carroll szívesen hivatkozik perceptuális univerzálékra (a figyelem fókuszálása, kiugró jelleg, az erős ingerek keltette ijedtség), azoknak a használata azonban korántsem zárt sub specie aeternitatis. Az ugyanis, hogy ezek az "univerzálék" egy-egy esetben mekkora magyarázó erővel bírnak, empirikus kérdés. Az viszont, hogy a filmi befogadás kulturálisan vagy esetleg transzkulturálisan a sémahasználatban érhető tetten, már jóval túl van a Carroll-féle eseti elméletalkotáson. Mikor és mi dönti el például, hogy egy képen mire fókuszálunk? Természetesen – hangzik Carroll és Bordwell válasza – a néző által előzetesen megfogalmazott alapkérdés (Ki a gyilkos? Valóban a gyanúsított tette? Sikerül-e elmenekülni a hősnek az üldözők elől? stb.); ám mi történik akkor, ha a film aláássa a válaszkeresését? Vajon újrafogalmazzuk-e kérdéseinket? És ha igen, miért?
Egy másik idevágó probléma a következtetésalapú megközelítéssel a film esetében az, hogy nem tud elszámolni látott és következtetett, a Mit látunk? és a Mit tudunk? különbségével. Hiszen már maga a látott is következtetések eredménye. (A sémák vagy sablonok maguk ugyanis nem láthatók!) Éppen ebben rejlik az egyik alapvető különbség a nyelvi és nem nyelvi megközelítés között. Ha nem létezik filmnyelv, mint a legtöbb filmkognitivista vallja, akkor a képmegértési folyamatnak radikálisan különböznie kell a verbális szövegmegértéstől. Van-e értelme ugyanis a látott "literális" jelentéséről beszélni? Márpedig ennek hiányában következtetési folyamataink be sem indulhatnak. Filmnyelv nélkül semmilyen vizuális retorika nem megalapozható, s így nem véletlen, hogy a képi metafora kérdése oly szűkre szabott helyet és érvényességet kap Carroll, Bordwell és más kognitivisták írásaiban.
Összefoglalásképpen elmondhatjuk, hogy a film kognitív megközelítése egy dilemmát foglal magában: vagy a szűkebb értelemben vett mozgóképre, a láthatóra összpontosít, és magát a mozgásillúziót és esetleg a film reproduktív természetét igyekszik magyarázni, vagy a film kompozíciós elveiből (beállítás, keretezés, vágás) kiindulva a nem látható (re-)konstruálását célozza. Az első esetben a filmi folyamatosság, a másodikban a megszakítottság az uralkodó tényező. A folyamatosság a filmi érzékelést a valóság érzékeléséhez közelíti, a megszakítottság egy metafizikai dimenziót nyit meg, melyet a nézői befogadó tevékenység áthidalni próbál. A következtetés alapú elméletek paradoxonja, hogy a filmkép feldolgozását a valóságban való tájékozódás mintájára képzelik el; a valóságban az ember mindig viszonylag zárt életszituációkban találja magát, illetve ezekben kell döntéseket hoznia. De legalábbis a túlélés szempontjából arra kell törekednie, hogy a szituációit zárt döntéshelyzetekként konstruálja meg. Az első lukat e kognitív zártságon a nyelv üti. A másodikat pedig, úgy véljük, a mozgókép. Az ember vagy egy folytonos teret képzel el a képek "mögött" s ennek alapján konstruálja meg a nem láthatót, vagy bajban van, ami irracionális reakciót eredményez(het). Mintha a filmkép mozgásszerűségét és képszerűséget nem lehetne összeegyeztetni. Nem azt állítjuk, hogy e kétféle jelleg, folytonosság és megszakítottság egységes magyarázatára nem lenne példa (maga Bordwell is javasol egyet, amikor a vágás ambivalenciájáról ír); csupán azt gondoljuk, hogy a mozgókép pszichológiája és a diszkurzív, problémaközpontú gondolkodás összeötvözése még várat magára. Ez utóbbi érdekében azonban a filmelméletnek vagy vissza kellene térnie kép és nyelv lehetséges – vagyis szűkebb értelemben kognitív és korántsem erőltetett – analógiáihoz (ha egyáltalában valaha lemondott volna róla teljesen!), vagy a mozgóképnek gyökeresen új – a mindennapi látás pszichológiájától és a diszkurzív gondolkodástól eltérő – feldolgozási modelljével kellene előállnia. Eleddig, úgy tűnik, egyik út sem tűnt járhatónak. Ám az is lehet, hogy egy efféle modell mégsem a kognitív tudományokon belül keresendő.