Catégorisation rapide des scènes naturelles : l'objet, le contexte, et leurs interactions
Institution:
Toulouse 3Disciplines:
Directors:
Abstract EN:
In a world governed by physical laws, our brain is able to extract some invariants and to generate expectations to precise our visual percept. However, as soon as we turn on the light of a dark room, as soon as we zap to a new tv channel, we understand nearly instantaneously the content of these new complex scenes. How rapidly are we able to extract the gist of natural scenes? Which influence has the context on the recognition of relevant object ? What are the necessary visual informations and the underlying visual processing ? The two first papers of this thesis show our capacity to recognize context superordinate categories of natural scenes in less than 400 ms while the access to basic categories need about 50 ms of additional processing. They reveal also that the presence of salient objects interfere with rapid context categorization. These short processing times that are very similar to those obtained in object categorization tasks suggest a global and parallel processing of the whole scene. The third paper show that the context congruency with the object influe immediately on object categorization processing and the last one analyse the necessary visual information in context processing. Based on such data, I support the idea of early crossed interactions between parallel bottom-up visual processings of object and context. A final study aimed at determining the minimal latency for such interactions by using ocular response rather than manual response. The implications of these fundamental results are discussed in the perspective of future researchs.
Abstract FR:
Dans un monde régi par les lois physiques, notre cerveau est capable d'extraire des invariants et de générer des attentes pour préciser notre percept visuel. Pourtant, en éclairant une pièce, ou en naviguant à travers les chaînes de télévision, nous comprenons quasi-instantanément l'essence de ces nouvelles scènes naturelles. A quelle vitesse peut-on extraire une représentation sémantique globale des scènes? Quelle est l'influence du contexte sur la reconnaissance de l'objet d'intérêt? Quelles sont les informations visuelles nécessaires et la nature des traitements sous-jacents? Les deux premiers articles démontrent notre capacité à reconnaître la catégorie superordonnée du contexte d'une scène en moins de 400 ms tandis que l'accès au niveau basique nécessite 50 ms de traitement additionnel. Ils démontrent aussi que la présence d'objets saillants interfère sur la catégorisation rapide du contexte. Ces temps de traitements très similaires à ceux enregistrés dans la catégorisation rapide d'objets suggèrent un traitement global et parallèle de l'ensemble de la scène. Le troisième article montre que la congruence (incongruence) du contexte avec l'objet influence immédiatement le traitement de l'objet et le dernier précise les informations visuelles à la base de l'analyse du contexte. Je défends ainsi l'idée d'interactions bidirectionnelles précoces entre les traitements visuels ascendants et parallèles de l'objet et du contexte et recherche dans une dernière étude la latence minimale de ces interactions en remplaçant réponse manuelle par réponse oculaire. L'implication de ces résultats fondamentaux est discutée dans la perspective des recherches à venir.