知覚心理学講義ノート[1]

2011/4/4 光藤宏行

 

1. オリエンテーション

 

おはようございます。光藤と申します。知覚心理学を半期担当します。よろしくお願いします。この講義では、知覚のうち主に視覚について話します。視覚は、簡単に言えば見ることで、私たちは日常意識せずに行っています。今日学校に来るまでに、目を見開いて、道を外さないように歩いてこれますよね。視覚のおかげでこのように安全に行動することができている訳です。他にも、視覚なくしては行うことが困難なことが数多くあります。例えば、目の前にいるのは誰ですか。ここはどこですか。この文字は何ですか。というようなことです。このような視覚は、突き詰めて言えば、外界を正しく認識するためにあります。多くの人はこれらのことを行うのに、特段の努力を意識することはありません。この講義では、心理学の立場から「見る」仕組みについて考えます。

 

出来て当たり前のことというのは、見過ごされがちですが、きわめて重要です。例えばサッカーに例えてみましょう。主に守備を担当する選手、ディフェンダーは相手を防いで当たり前と見なされ、失敗すると文句を言われる。ワールドカップでもそうでしたよね。そう思う人は分かっていない、ディフェンスは責任重大で大変なんです。それに対して攻撃やフォワードは、うまく行くことはほとんどなく、たまに点が入るとちやほやされます。納得がいかない点もありますが、視覚はディフェンダーのようなもので、外界を正しく認識して当たり前と見なされます。

 

フォワードは何だろう。視覚がないとできないものですよね。たとえば一目惚れとか。ゲームとか。おしゃれとか。スポーツとか。読書とか。こういうのは別に失敗しても大したことはないですよね。失敗によって命に関わることはめったにない。

 

では、人間の視覚には、何が必要なのでしょうか。一言で言えば、眼と脳です。眼と、脳の中の視覚に関わる部分は何をしているのか。大雑把に言えば、様々な視覚の情報、つまり色や形や奥行きや動きなどを個別に分析しています。そしてそれらをまとめることで、私たちそれぞれがもつ主観的な世界が作りだされています。この講義でつかんでほしいことを突き詰めれば、この一点になります。私たちが外界を見ているのは、眼と脳のおかげなのです。この講義では、そのような事柄について、色や形や奥行き動きなど、それぞれの視覚的な特徴について分けて話します。

 

私たちがいとも簡単にやっているように思われる視覚ですが、実はこれは脳の神経細胞による、かなり複雑な機能です。例えば、私たちが持つ視覚機能を、機械に持たせることはできるでしょうか。例えば自動車の運転を考えてみましょう。自動車を運転する際には、視覚は明らかに重要ですよね。運転免許を有する人ならば、それほど大変な課題とはみなされていません。しかしこれを人間がせずに、ロボットで実装しようとすると大変です。まず、道とそうでないところを区別しないといけない。また道の中でも正しい道を選択し、また安全にも配慮しないといけない。例えば、2004年に砂漠で無人の自動車による、自動走行レースが初めて行われました[2]。主催はアメリカの国防総省の研究機関DARPAでした。その優勝賞金は200万ドルでした。ちなみに平均時速は30kmでした。人間の場合には、別に自動車の運転に特化した機能を有する訳でもないにも関わらず、そのような能力を有していることは実は驚くべきことです。

 

この授業の内容をスライド6に示しています。同じものが配布資料にもあります。例えば第3回目の講義では、「眼と視覚情報処理」について話します。この回では眼の構造や、光を神経細胞の活動に変換する視細胞について話します。これは視覚の一番最初の過程です。第4-5回の色覚の講義では、色を見る仕組みについて話します。色覚異常の人が日本人の場合男性は約5%が色覚異常であると言われています[3]。これは色を処理する神経細胞を考えると理解しやすくなります。第6−7回では形の知覚を取り上げます。例えば画面右に、人間が階段を上ろうとしているのが見えます。では画面下には小さな人、小人が階段を上ろうとしているのが見えます。これらは、画面上での大きさは同じです。この錯覚は大きさの知覚、形の一つです。これは、見かけの大きさは網膜上に映った大きさで決まるのではなくて、脳が、視覚系が大きさを自動的に推測している働きの現れであると考えられています。

 

9回では、両眼立体視、つまり二つの目を使って、遠くや近くを判断する働きについて話します。スライド10図のような図を見たことがありますか。この紙を目と水平にして、遠くを見る気分になってください。その状態で紙を頭に近づけると像が二重になって、うまいことすると二重の像が重なる位置があります。そうすると、今までは見えていなかった模様が見えてきます。見るコツは、目をキョロキョロさせないこと、紙と両目の方向をきちんと揃えることです。この原理を応用しているのが今はやりの3Dですね。

 

10回では、動きを見る働き、運動視について話します。例えばこのように、点が散らばっている図形を見ます。何が見えますか。止まっていると何かは分かりにくいですが、動くとすぐに分かる。人間ですね。そして止めるとまた分からなくなる。このデモンストレーションが示すのは、物体が何であるかを知るためには模様だけでなく動きの情報も重要であるということです。

 

このような例は、広い意味ではすべて錯視(視覚の錯覚)です。錯視は数限りなく発見されていますが、第12回では錯視について説明をします。例えば、白黒のまだら模様があります。ではこれを特定の背景のもとで見るとどのようになるでしょうか。今度は、左側は円は黒く、右側では円は白く見えます。これは明るさの錯視で、物体の明るさはそれを取り囲むもの、文脈とも言いますがその効果が大きいということを意味しています。

 

色々見てきましたが、これらは一体何なのか。錯覚は単に勘違いやオカルトなのか。それともこの講義が朝早いので、寝ぼけているだけなのか。違います。このような錯視現象を理解する心理学の枠組みがあります。単純化したものがスライド13です。簡単に言えば、外界から入ってきた情報は五感と呼ばれる感覚器官で処理され、その後そのことを覚えたり、考えたりして、行動に移ります。このような枠組みを、人間の情報処理的理解と言い、心理学の基本的な考え方を成しています。

 

来週は、視覚の話に入る前に、心理学の予備知識について話したいと思います。心理学にも色々な分野があり、動物・知覚・認知・社会・臨床・発達などが有名です。それぞれはゆるやかに関係していますが、心理学以外の学問とも関わりが深いです。視覚は知覚のうちの一つですが、知覚心理学は生物学、芸術学、哲学、脳神経科学、物理学、数学などの知識を必要に応じて利用します。

 

授業の進め方はこのようなスライドを映して進めます。次回から、講義の最後に、質問を書いて記入する紙を配りますので、書きたい人は書いて出して下さい。必須ではありませんが、成績評価に加味します。名前は書きたい人は書いて下さい。

 

2. 心理学

 

おはようございます。今日は知覚心理学の2回目ですね。今日は、視覚というより、心理学の解説をしたいと思います。一つは、科学的な心理学とはどういうものか、ということです。もう一つは、心理学の研究方法にはどのようなものがあるか、ということです。

 

この授業の進め方ですが、授業の半分で、5分程度の休憩をします。今日は真面目な話が多いですが、どうぞ集中してください。笑ってもいいですが、近くの人と話すのは止めて下さい。5分の休憩の時に、コメントカードを配ります。授業の感想、質問、要望など自由に書いて構いません。必ずしも提出しなくても構いません。重要な指摘をした人には、成績評価の際に加点します。また、多い質問については次回の最初に取り上げて、解説をしたいと思います。

 

心理学は一言で言えば、心の科学です。心とは何でしょう。心持ってますか?何かははっきり言えないが、持っていることは分かる。辞書による「心」という言葉の意味をスライドに示します。心の意味はとても広いです。簡単に言えば、物質ではなくて、人に関係しているものである、としておきます。

 

「の」は何でしょう。辞書によれば、五十音図ナ行の第五音です。意味は格助詞で、ここでは「対象」という意味です。科学は?簡単に言えば認識活動、知ることが科学ということです。つまり心を知る学問が心理学ということです。

 

では心を、どのようにして知るのか?そこで、研究の方法、やり方が重要です。心理学を含めた科学で、一番重要な研究方法は、実験です。実験では、調べたいことを調べられる場面を人工的に作り出します。そして、そこで何が起こるかを観察します。つまり、試してみて、心はどういう仕組みで働いているのかを推測します。

 

歴史を簡単に言えば、古代ギリシアで哲学や生理学ができました。それらが19世紀に、心理学ができました。生理学というのは生物学の一部で、動物の身体の機能を考える学問です。心が身体からどのように作り出されているかを考える学問として、心理学ができました。ドイツのライプツィヒ大学に心理学実験室を作ったのがヴントで、1879年です。これが心理学の始まりとされています。[4]

 

心理学の実験というのは、テレビなどで見かける「心理テスト」とは少し異なります。例えば、一つの質問に答えると、本当の自分を教えてくれる。冷静に考えてそんなことはありえないし、科学的な視点からも妥当な方法とはいえません。質問が一つというのは無理がある。そして、英語のテストを勧められたりする。これは、科学的な心理学とは異なります。

 

昔の心理学の実験風景があります[5]。ちょうど100年前ですね。知覚心理学の場合の実験はこのように、人が刺激と呼ばれる入力を得て、それを実験参加者、被験者が見て、反応をするというのが基本です。この機器ではドラムが回転するように出来ていて、画像を一瞬だけ見せることができます。原理は今もそんなに変わりはないです。私が使っている実験室では、このようなPCの画面と、鏡を組み合わせて、二つの眼に別々の画像を見せる装置があります。反応は普通のPCで取得するような装置です。実験参加者が何を見えたかを報告することで、視覚がどのような仕組みで成り立っているのかを調べます。

 

人間を相手に実験といっても、相手が人間ですから、色々な配慮が必要になります。解剖とか、できませんよね。普通に捕まります。簡単に言えば、人権に配慮して実験を行うということです。代表的な原則は4つあります。最小限のリスク、説明・同意、事後説明、プライバシーの権利です[6]

 

心理学の研究方法を、簡単に図示します。実験は観察法の一種で、調べたい事柄や状況を作り出し、そこで何が起こったかを記録します。高校の理科で、つまり物理や化学、生物で実験をしたと思います。それらと概念的には同じです。理科の場合には観察の対象が自然現象で、心理学の場合には、調べる対象が人間になる。

 

心は直接は見えないので、代わりに行動を観察します。例えば赤ちゃん、乳児を対象とした実験を取り上げます。視力を測る場合には、このような縞を見せて、そちらを向くかどうかを調べます。赤ちゃんは、複雑なものに視線を向けるという傾向を持っているので、それを利用しています。縞を見せる場所をランダムして、そちらに赤ちゃんが向けば、その模様は見えているとみなせます。ではこの縞をどんどん細かくしていけば、赤ちゃんは次第にそちらを向かなくなることが予測されます。視線がそちらに向くか向かないかのぎりぎりの縞の細さを、視力として測ることができます。この方法は専門用語では「選好注視法」と呼ばれています。このような、人間の行動を調べることはスライドの行動計測に入ります。またこのような赤ちゃんを対象とする研究分野は「発達心理学」と呼ばれています。行動計測の他の例は、反応時間などがあります。

 

行動計測の他の実験手法として、生理計測があります。生理計測も数多くあります。心拍数、皮膚温度、発汗、唾液分泌、瞬目、瞳孔径変化、脳波など。緊張すると汗をかく、などと言いますよね。緊張する場面を作り出して、どれくらい汗をかいたかを測定する、ということです。

 

神経科学的方法というのは、脳活動を何らかの方法で測定することを言います。動物に対しては、頭蓋骨を開いて、電極という金属の針のようなものを刺して、神経細胞の活動を記録するやり方があります。人間に対して適用できる神経科学的な方法に、機能的磁気共鳴画像法というものがあります。略すとfMRIです。これは脳を流れる血液の変化を捉えることで、脳のどこが活動するかを明らかにすることができます。MRI入ったことがある人いますか。スライドを見て下さい。40cmぐらいの狭いスペースに閉じ込められます。そして、測定するときはすごい音がします。ズンチャ、ズンチャ、ズンチャ、という音がずっとしています。その上、測定が始まるとカカカカカ・・・という感じの轟音です。これはかなり辛いのですが、人体への影響は無いので、今は脳の機能を調べるための重要な方法となっています。得られた画像の例をスライドに示します。ちなみにこの原理を見つけたのは物理学者の小川誠二という方です。1990年ですのでそんなに昔ではない。

 

心理学で他に良く用いるのは、質問紙調査です。簡単に言えばアンケートです。質問項目があり、それにたいして「まったく当てはまる」から「全然当てはまらない」などのような感じで、5段階で回答するというようなものです。評定尺度法、SDsemantic differential)法などがあります。

 

今日の話のまとめを最後のスライドに示しています。心理学はまず第一に、心の科学であるということ。また、実験を重視します。そして、心理学の研究方法は一つではないということです。行動測定、質問紙調査など、様々な研究方法があります。

 

次回からは、視覚の話です。基本的な事柄である、眼について主に話します。コメントカードを書いた人は、提出してください。それでは授業を終わります。

 

3. 眼と視覚情報処理

 

今日は知覚心理学の3回目です。資料を中央付近に置いているので取って下さい。A3サイズの用紙が2枚です。先週書いてもらったコメントカードの回答も記載していますので、読んでおいて下さい。

 

前の回では、心理学とは、心を知る、理解する科学的な活動なのだということを解説しました。では、この講義の主題の視覚、つまり見ることを理解するというのは、具体的にはどういうことなのでしょうか。視覚を理解するとはどういうことなのか、について今日は最初に見ていきます。その後、今日は眼の構造について話します。眼の話は半分ぐらいは高校生物の復習です。そして、視覚の基本的な事柄である視角と視力の定義を述べます。

 

視覚、見ることは普段何気なくできるので、見ることも私たちが持つ能力であるというのは実感がないと思います。たまに見間違いもします。星までの距離を視覚で認識はできないし、物質の構成要素である原子や電子などを肉眼で見ることはできない。つまり、視覚の能力は完全ではないが、どれぐらい不完全なのかも想像しづらい。そこで、ここでは仮に超能力を考えましょう。超能力をもつ人がいると噂を聞いたとします。その能力はテレパシーかもしれないし、未来を予言できるのかもしれない。念力を使える可能性もある。そのとき、何をしますか。その人の脳を調べたいと思うかもしれないですね。前の回で話した、fMRIなどを使って。しかし、それより重要なのは、その人が超能力をどのような場面で使うか、それは何が出来るのかを知りたいと思うでしょう。予知能力を持つ可能性を調べたいとします。そのときどうしますか。例えば明日の出来事を質問して、それが実際に起こるかを調べることができるでしょう。また、念力を使える可能性がある場合にはどうしますか。その人の前にものを置いて、動くかどうかを観察することができます。つまり、これは「どのように、どうやって超能力を使うのか」という問いに対して答えることになります。

 

ここで、超能力ではなくて、視覚に置き換えてみましょう。その場合には、見えているものが何であるか、何かを見分ける能力がどれくらいかを調べることになります。少し考えると、視覚の能力は完全ではないことが分かりますから、私たちが持つ視覚の能力はどのようなものかを調べることには意味があるはずです。これが視覚の理解の仕方の一つです。心理学的理解と呼びます。

 

例えば、オリエンテーションの時にランダムドットステレオグラムについて話しました。あれは、視覚の能力がちょうど良く発揮できる場面を作り出しています。見えない人は、見えた人に「何が見えたか」を質問しますよね。このような方法は、生理学や解剖学の方法ではなく心理学なわけです。専門的に言えば、見せた画像は、刺激で、反応というのは見えた対象です。心理学的な理解というのは、このような両眼でわずかに異なる画像を見た時には、そのずれを自動的に計算するのだ、と考えるということです。

 

それに対して、異なる問いを考えることができます。それは、「何を使って見ているのか?」という問いです。言い換えると、見るために私たちは身体の何を使っているのか、ということです。これは簡単に言えば、眼と脳の神経細胞を使っています。これについては、生理学や解剖学の知識で答えることができます。外界から来る光を眼、具体的には網膜が受け取り、その情報が脳の各部位に伝わります。この視覚の経路を大まかに示す図をスライド4の右の図に示しています。

 

情報の流れというのは、神経細胞を伝わる電気的な信号です。これはたとえると、ウェブカメラをパソコンにつないでいるようなものです。この場合、カメラが皆さんそれぞれの眼、ケーブルが視神経、CPUが脳に対応します。PCの中にも配線がありますよね。それらが神経細胞に対応すると考えて下さい。スライド5に示しているのは神経細胞、ニューロンです。情報は、イオン濃度が変化することによって、樹状突起から軸索に向けて伝わります。軸索の端は他の神経細胞の樹状突起に連絡があり、どんどん伝わってゆくというわけです。脳の情報処理というのは、この繰り返しです。脳の中でも、視覚を含む情報処理に関わりが深い部位の名称をスライド3に示しています。

 

今日は眼球について、簡単に見ていきます。これは視覚の生理学的理解、つまりはハードウェア的理解について話します。第一段階は眼、眼球です。眼はカメラに例えると理解しやすいです。カメラは知っていますよね、レンズ、フィルム、絞りなどの部品から成ります。眼とカメラは似ていますが、異なる所も多くあります。レンズは水晶体と角膜、絞りは虹彩、フィルムは網膜に対応しています。カメラのレンズのピントを調節することで、画像は鮮明になりますよね。レンズは、水晶体に対応します。透明な細胞で、タマネギのように層になっています[7]。水晶という形容詞であるけど身体の中に水晶があるわけではないですよ。この水晶体に筋肉が円周方向に配置されていています。その筋が収縮すると水晶体の厚みが大きくなります。同時に角膜という眼の表面の膜も曲がり、近くのものにピントが合うというわけです。歳を重ねるとこの水晶体がどんどん固くなって、変形しにくくなります。その結果として、近くのものがぼけて見えなくなります。眼の内部は、硝子体(しょうしたい)と呼ばれるゼリー状の組織で満たされています。

 

眼の網膜はカメラのフィルム、または感光部に対応しています。特に今のデジカメや携帯についているカメラは液晶に像がリアルタイムで表示されていますが、人間の網膜の場合も同じく眼が開いている限りは情報は絶えず更新されています。網膜もまた厳密にはフィルムとは異なる点があります。まず、フィルムもしくは画素はカメラでは平面上に均質に並んでいますが、人間の場合は一部分だけ密度が高くて、端に行くにしたがってまばらになっていきます。また、網膜の感度は環境の明かりの強さに依存して感度を変えることができます。暗い部屋に突然入ったり、閉じ込められたりすると最初は何も見えませんが徐々に、見えるようになってきます。いわゆる「暗闇に眼が慣れてくる」状態です。これを心理学や生理学では、「暗順応」と呼びます。もったいぶった言い方ですが。暗いところに入るのではなくて明るいところに入ると最初はまぶしいと感じますが、それも徐々に慣れてくるということも体験したことがあると思います。これは「明順応」と呼びます。

 

またカメラは撮影、印刷すれば終わりですが、視覚の場合には、網膜像の2次元の模様を解釈する、という最も重要な課題が残っています。最近テクノロジーが進んで、機械による顔認識などが結構行われています。これには通常コンピュータに画像を読み込んで、計算をするということが必要です。脳の多くはこの網膜像という画像の解釈を常に行うようにできています。画像を解釈するためには当然配線が必要で、脳の場合をおおざっぱにいうと網膜から神経細胞の束が一カ所から出て、脳につながっています。つなぎかえは何回も行われていて、網膜では錐体・桿体、そして水平細胞、次に神経節細胞というようにつなぎかえが起こります。その後も外側膝状体を経て第一次視覚野というほぼ頭の後ろの部分の神経細胞につながっています。

 

網膜の外側にある視細胞は、光が当たると電気的な活動を生じます。視細胞は網膜上に1億ぐらいあり、2次元の平面上に配置されています。視細胞とは錐体と桿体のことです。その活動は網膜の内側の方の層に向かって進みます。そして、視神経とよばれる細胞の軸索が束ねられ、網膜上の一カ所から脳に向かって軸索が出ています。この神経細胞の束が眼球から出る場所が、盲点(盲斑)です。盲点の上には光を感じる神経細胞はないので、その場所は光を感じることは出来ません。その代わりに、脳が埋め合わせていることが知られています。今日配布した資料のもう一枚、コメントカードの回答の反対側を見て下さい。網掛した長方形が、その周囲の情報によって埋め合わされることが分かります。

 

最初の神経細胞、物理的な光を電気的な信号に変換する錐体と桿体については、次回の色覚の回に詳しく説明します。その基本的な特性として、変化に対して鋭く反応するということが知られています。例えて言えば、電気をつけっぱなしだと大して気にならないが、電気を消したりつけたりするとそれが気になるようなものです。

 

フィルムと網膜の違うところとして、鮮明な像を得るためにはカメラを固定することが重要ですが、網膜の場合に眼をしっかり固定すると、何も見えなくなるということが知られています。眼は自然状態ではじっとしているように見えても小刻みにブルブル震えています。

 

これに関係して、網膜は構造上光に直接反応する錐体・杆体(桿体)は、網膜の一番底にあり、網膜という自分自身を通過したものを見ていることが知られています。日常場面でも、特殊な状況では網膜の血管を見ることができます。

 

一つは暗闇で、眼の横の方から豆電球等を照らして、動かすと黒い太い影が見えます。二つ目は小さい穴や隙間を覗き、ゆっくり動かすと網の目のような細かな模様が見えます[8]。これから、専用の特殊器具で見てもらいますので、3人で一つずつぐらいで共有してください。器具の中央に、小さな穴があります。その穴を眼に出来るだけ近づけて、明るい壁や電灯を見て下さい。穴が塞がっている場合は、シャープペンシルの芯を通すなどして、小さな円が見えるように整えて下さい。柄まで通してはいけません。そして、眼に紙を近づけた状態で、ゆっくり揺すってください。なるべくゆっくり動かすことがコツです。良く見ると、円から見える景色に重なるように、止まった模様が見えることがあります。そうすると、稲妻のような血管や、小さなつぶつぶとした細かな模様が見えます。隙間を作ると光の方向が制限されるので、網膜の前にある構造が見えるのだと考えられます。

 

眼からの情報は、視神経とよばれる、神経細胞の軸索の束が脳に繋がっています。その後、大脳、頭の後の方に送られ、形や奥行きなど、ある程度別々に処理がなされ、意識に上ります。この最後の部分、電気的な信号がどのように意識のような、物質ではないものを作り出すのかは、よく分かっていません。

 

眼に関連して、今日は最後に二つの基礎的な事柄を解説しておきます。一つは、網膜に映る像を記述する時に最も重要になる概念です。それは、網膜像の大きさで、「視角」と言います。見る対象の大きさを角度で表したものです。およそ視角一度は、57cm前にある1cmの物体の大きさになります。英語だとvisual angleです。

 

もう一つ、日常場面でも重要である視力について話します。これは、視覚的に判別可能な最小の大きさを、視角で表現したものです。Cのようなマークが有名ですね。専門用語で「ランドルトC」または「ランドルト環」と言います[9]。直径は隙間の五倍、隙間は正方形、Cの太さは隙間と同じ幅とするという取り決めがあります。ランドルトCを使った視力測定は、隙間が見えるか見えないかの境目の時の環の幅の逆数を視力と定義します。

 

コメントカードを書いた人は提出してください。来週は色覚、色の知覚の話をします。授業を終わります。

 

4. 色覚I

 

今日は知覚心理学の第4回です。A3A4の紙を一枚ずつ置いています。前の回からのやり方と同じく、45分ぐらいで休憩します。

 

私たちの世界は色が鮮やかに見えます。色は日常生活でも、多くの意味で重要です。白黒テレビや白黒液晶の携帯電話は味気ない。服や髪の色なども、お洒落を気にする人にとっては重要でしょう。また花の色は緑色の草の背景から目立ちますし、交通標識を識別するのも色に意味がある。何億円も価値があるとされる画家の絵も、突き詰めて言えば色をどのように塗ったかということです。

 

私たちは色は物の性質・特性である、と思いがちです。ですがそれは錯覚です。色は脳が作り出して、言わばそれを外界の表象に貼付けた結果です。これを端的に表すのが、「光線には色はついていない」というニュートンの言葉です[10]。今日の授業の目標はこれについて理解を深めます。

 

光は電磁波の一種で、眼に届いた光に対して網膜の視細胞が神経活動に変換します。電磁波の速さは真空中で秒速30kmの、あの電磁波です。自然界で色が見える一番簡単な図式から説明しましょう。太陽の光は、色々な長さの波長を含んでいて、地上の物体に光が降り注ぎます。プリズムの実験で、太陽光を虹色に分解する実験などありませんでしたか。世界が色とりどりに見えるのは、それぞれの物体の反射の特性が異なり、異なる波長の光が眼に届くから。これが単純な考え方です。

 

波長というのが分かりにくい人は、ピアノの鍵盤を想像してください。高い音は波長が短く、低い音は波長が長い。波長の変化は、ピアノで言えば音階に対応します。ドレミファソラシドという変化は、波長が異なっています。音の強さが電磁波の振幅に対応します。ギターでも同じですよね。太陽光は、鍵盤を同時にジャーンと鳴らしているようなものです。鍵盤を一つたたくと、特定の高さの音が聞こえます。これは、虹の中の特定の色が見えることに対応します。音の強さは、電磁波の振幅に対応しています。電磁波の特定の波長のものが可視光線と呼ばれるものです。具体的な波長は380-780nmあたりです。1ナノメートルは1/1,000マイクロメートル、1/1,000,000ミリメートル、1/1,000,000,000メートルです。

 

ある種の生物は、人間が見える範囲以外の色を見ることができます。鳥および昆虫の中には紫外線に反応する視細胞を持つ生物もいます(スライド18)。花によっては紫外線の反射特性が異なるものもあり、ミツバチは、人間には見えない模様、スライド4のようなものが見えていると考えられています。紫外線は可視光線より波長が短いですが、赤外線は波長が長い方で、ヘビは赤外線に反応する視細胞を持っているものもいるそうです[11]

 

色は色々ある訳ですが、無数に変化する色を、私たちの視覚はどのように見分けているのか?色覚の理論が答えようとしているのは、この問いに尽きます。心理学では三色説と反対色説という有名な二つの理論があり、生理学的には、どちらも部分的に正しいと考えられています。少ない原理で多くのことを説明できるのは、理論的に美しいことです。

 

三色説から紹介します。光の持つ波長の成分が何であれ、一様の色の光を、視野全体に投影するとします。このとき、網膜上のそれぞれの場所で、3つの異なる種類の神経細胞(錐体)を考えます。実際の分布のイメージとしては、3種類の錐体がモザイク上に、平面に並んでいると考えてください。前のスライド(13)に示します。ある錐体について、横軸に波長、縦軸に反応強度のグラフを考えてみましょう。異なる波長の光を当てると、この細胞の反応の量が変わり、反応の特性カーブを得ることができます。ここで、このような反応の仕方として、すべての錐体を調べると、3種類の反応に分類できるとします。三色説の説明では、私たちの視覚システムはこの3種類の錐体について、近いもの同士の組み合わせを使って色を見分けている、と考えます。三種類の錐体は、S錐体、M錐体、L錐体と呼びます。アルファベットは、短波長/中波長/長波長の頭文字です。S, M, L錐体の反応が最大となる波長は、およそ420530555nmです。

 

三色説を支持する事柄として、混色と色覚異常が挙げられます。混色とは、数種類の色を組み合わせて、様々な色を表現できることです。美術の時間で、絵の具を混ぜて微妙な色合いを出すことができましたよね。他には、パソコンや携帯画面は赤青緑の画素から出来ていますが、無数の色を見ることができます。これは画素の並びが網膜上の視細胞の分布より細かいために、色が混じって見えます。これは空間解像度の限界を利用した混色ですが、時間解像度の限界を利用した混色もコンピュータを使うと可能です。デモンストレーションをお見せします。赤、緑、青で描いた画像を交互に呈示します。これはゆっくり点滅しているように見えると思います。この交替の速さを変えると、いかがでしょう。カラーになると思います。これは、錐体の反応は刺激が消えても数十ミリ秒は続くので、それらを統合する際に混色が起こるからと考えられています。

 

絵の具の混色はもう少し複雑です。点描の場合の混色の原理はパソコン画面と同じです。それに対し、絵の具を混ぜる場合には、層の重なりによって色を表現しています。減法混色ですね。色フィルターを通して見る場合と同じです。絵の具も、良く見ると半透明で、背景の明るさを減らす働きをしています。

 

もう一つ三色説を支持する現象に、色覚異常があります。日本人では成人男性の4.5%、女性では0.6%が色覚異常であると言われています[12]。多くの色覚異常の人は、緑と赤の区別がつきにくいという人です。これは、錐体のうち中波長および長波長光に対して強い応答を示す錐体がない、またはその働きが弱いということから説明できます。

 

男女で色覚異常の割合が異なるのは、染色体の違いによります[13]。男性はX染色体とY染色体から成り立ち、女性は二つのX染色体があります。これは高校で生物を履修した人は覚えているかもしれません。遺伝子研究によって、色覚は性染色体と関係していて、特にM錐体とL錐体を作り出す遺伝子はX染色体にあることが知られています。S錐体と桿体をコードする遺伝子はそれぞれ7番染色体と3番染色体にあります。(22対の常染色体と、2つの性染色体)L錐体は2種類あり、ピークがわずかにずれて(47nm)います。両方のタイプを持つ女性は、計4種類の錐体をもつことになります。

 

歴史的に言うと、三色説の他には反対色説という理論があります。これも、少ない基本特性から色々な色が見えることを説明しようとしていますが、三色説とは捉え方が少し違います。具体的には、色は基本的に2つの軸、赤と緑を対にした軸と青と黄色を対にした軸があり、色をそれらの軸で捉えることで様々な色が見えるのだ、という風に説明します。

 

反対色説は間違っているわけではなくて、網膜の水平細胞あたりで、赤と緑を組合せ、青と黄の反応を組み合わせるような処理がなされていることが分かっています。したがって、三色説と反対色説はどちらも正しいというのが現在の色覚の現状です。

 

今日の講義をまとめると、色は、私たちの視覚的な能力の表れであるということ。外界の物質の特性ではない、ということです。また、人間の場合、色の知覚は3種類の錐体の反応の組合せで決まっているということです。次回も色覚の話をします。

 

5. 色覚II

 

知覚心理学の5回目です。先週は色の基礎の話でした。今回は色の応用的な側面について主に話します。主な話題は3つです。一つは、色を体系的に数字で表すということについて。もう一つは色を組み合わせた時に何が起こるか、ということ。また色の認識は、人間の他の側面、例えば感情や言語とどのように関係しているのかということを話したいと思います。

 

前の回では三色説に注目して話しました。ここで「3」という数字は重要です。色の色相、明度、彩度というものがありました。中学や高校の美術、色彩学の授業で習ったと思います。簡単に言えば、色には三つの特性があるということです。色相・明度・彩度はマンセル表色系と呼ばれるものと関係しています。例えば、赤の色相は例えば100段階で5Rで、明度は10段階で例えば8で、彩度は10段階程度で14、というような表記をします。これはまさに3つの変数となっています。マンセルは画家で、1915年に最初の色体系を発表しています。

 

前回紹介した三色説でも、単色はRGBの三つの割合を変えることですべての色を表現できるということです。反対色説では赤-緑、青-黄、黒-白という3つの軸を考えます。このような、色を表す方法を表色系と言います。表色系は色の言語です。例えば、同じ事柄でも、国や地域によって言葉が違います。表色系も同じで、同じ色をいくつもの方法で指し示します。表色系がいくつもある理由は、色の表現を行う媒体(テレビ、印刷媒体、車の塗装など)で、色を表現する物質の特性が異なるからです。例えば、テレビやPCの画面では鮮やかな緑色は表現できるけれど、印刷物の場合には難しいことがあります。つまり印刷の場合には使える塗料の特性に限界があるということ。他にもいろいろな要因があります。マンセル表色系は日本工業規格(JIS)でも使われています。

 

マンセルの表色系を使って、色と言語の関係を調べた研究があります。私たちは普通に赤、青、黄、などと色を示すために使います。他の民族では色と言語の対応はどうなっているのか。色を表す言葉を98の言語について調べた研究があります[14]。それぞれの言語について、色を示す言葉と、それを最も良く表すと色を選んでもらいました。色が11ある20の言語を選び、それをマンセル表色系で示したものがスライド5です。明度と色相の2次元の表になっています。そうすると、異なる言語であるにも関わらず、ある色を典型的に示す色票はかなり似ていることが分かります。つまり、言語が色を決めるのではない。はっきりした色があって、それに基づいて言語表現が決まる、ということです。

 

視覚の研究でよく使うのはCIEXYZ表色系です。これは計算のしやすさを最優先しています。例えば、マンセル表色系やRGB表色系で、色の混色というのは、数字などを組み合わせても厳密にはできません。例えば、赤と黄色を同程度混ぜたらオレンジになるかというと、そう言う訳ではない。それが成り立つように表色系をいじったのが、CIEXYZ表色系です。CIEというのは国際照明委員会の略語で、1931年に最初に制定されています。

 

今までの色は単色の話でした。日常場面では、色はその組み合わせとして表現されています。第一の例は色の錯覚です。色は、その周囲の色の影響を受けます。例えばスライド7を見て下さい。中央のリングの色は上下では同じですが、縞模様の組合せによって色が異なって見えます。これはまわりの色に近づいて見えるので、色の同化と呼ばれます。XYZ表色形の色度図で考えると理解できます。

 

また、透明や金色は単色では表現できない色です。スライド8の左側の図では、真ん中に半透明な円があるように見えます。それぞれの領域は単に濃さの違う灰色であって、それは分離するとはっきり分かります。心理学では、このように透明ではない領域を組み合わせて透明に見えることを透明視と言います。また、光沢のある対象、例えば金色というのも単色では表現することは出来ません。右側の図は写真ですが、拡大すると黄土色や黒色に塗り分けられていることが分かります。鉛筆の金色も同じで、微妙に異なる色の組み合わせが必要です。

 

色は感情と関係があることが日常的には推測できる。私たちも服のコーディネートには気を遣う場合が多いですよね。それは色が直接何か知覚的な情報処理に影響を与えているのか、それとも単に連想のように、慣習で引き継がれているものなのだろうか。実はこの問題は難しい。色が感情にどのような影響を及ぼすかを調べた研究を一つ紹介します。

 

単色のパッチを見せて、それがどのような印象を与えるかを質問紙調査で調べた研究があります[15]。ここで用いられた質問紙調査は、第2回目に説明したSD法です。ここで扱う印象は、感情と呼んでいて、三つの要素「快適・覚醒・優勢」を仮定しています。研究では具体的には色のパッチの色相・明度・彩度を変化させて、それが質問項目の評価値にどのような効果を与えるかを調べています。結果の要約をスライド9に示しています。彩度と明度は定量的に示していて、色相の効果は大小のみを書いています。

 

印象、感情ではなくて、色によって実際に何かの成績に影響があるのかどうか?この問題について、アテネオリンピックで格闘系の競技の勝敗を調べた研究があります[16]。動物の場合には、赤色というのは相手を威嚇する効果があります。赤と青の場合で成績が変わるのかどうかを調べた研究があります。その結果、赤をつけた選手はわずかに勝率が高いことが分かりました。勝率の違いはわずかで、理論値からは5%ほどです。例えば、赤は動物の世界では他を威圧するということが知られています。しかし、柔道の結果を調べた場合、青と白でも勝率にわずかに差があることが分かりました[17]。これは、白だと背景から目立つので、文字通り視覚的に相手に捉えられやすかったのかもしれません。

 

今日は3つの話をしました。一つは色を数字で表すという話。二番目は色の組み合わせによる知覚の話。三番目は色が感情や競技の課題などに影響を与える場合があるという話をしました。今日の講義はこれまでです。来週は形の知覚の話をします。コメントカードを書いた人は前に提出して下さい。

 

6. 形の知覚

 

前回までは色の話をしました。今回は形の話です。形が見えることは、色が見えることと同じく、普段の生活では私たちが意識することは殆どありません。しかし、これまでの授業で解説してきた通り、形が見えることもまた、脳が入力情報である網膜像を解釈した結果なのです。解釈っていうのは擬人的な言い方ですが、実際にその通りで、脳(正確に言うと、視覚系)は与えられた情報を、ただ受け取るだけではなくて、能動的に処理、加工をしています。

 

まず、それを示す例を紹介します。スライド3のこの白黒の図には何が描かれているか、分かりますか?類似の図形を見たことがある人は、繰り返しですみません。

 

どうでしょうか。最初は意味のない模様に見えます。しかししばらくすると意味のある模様に見えてきます。これらの例が意味することは、何なのでしょう。重要な点は、意味のある模様が見えている場合、いない場合でも、与えられている網膜像は同じであるということです。つまり、見えが変わったのは私たち問題で、つまり文字通り見方が変わったということです。

 

この「見え方」が変わるというのは、つまり何を意味しているのでしょう。これは、知覚心理学の専門用語でいう「知覚的体制化」と関係しています。簡単に言えば、要素のまとまり方が変化した、ということです(殆ど同語反復ですが)。

 

要素、というのは何なのでしょう。最小の要素は、前回話した、錐体や桿体といった、個別の視細胞に与えられる情報です。PCで言えばほぼ、ピクセルに当たるような、2次元のどこかに与えられる点のことです。つまり、視細胞の数だけ、視覚系が処理すべき要素は存在します。錐体の数はおよそ600万個、桿体は一億二千万あると言われています。視神経の数はそれぞれの眼につき120万本程度です。つまり、網膜の段階でも受け取った要素的な情報をある程度まとめているということです。

 

まとめて見る、ということはどういうことか言い換えると、複数の要素を比較できる、ということです。例えば、単純な視覚世界として、黒・灰色・白からなる世界を考えましょう[18]。私たちはこのような画像を見て、ああ、白い行と黒い行が並んでいる、とすぐ分かります。このような判断ができるのは、私たちが、与えられた画像の異なる領域の明るさを比較できるからです。例えば、一人が一点のみの情報しか与えられず、それぞれの明るさは別々の人によって処理される、と考えてみましょう。そうすると、隣の人がどのような明るさを受け取っているのか、それはすぐには分かりません。甲子園の人文字を思い出してください。ちょうど視神経や視細胞は一人一人に対応します。少し想像すると分かると思いますが、それぞれの人は、見取り図なしには、全体としてどのような模様が出来上がるのかは分かりませんよね。全体で何が出来ているかを理解するためには、要素の情報を統合することが必要です。私たちは脳の中に一人ずついますので、そのような不便なことはなく、このような画像を見て、どのような要素が含まれて、並びがどうだ、などを判断出来るわけです。スライド3に戻れば、白黒の絵の見方が変わるということは、要素のつなぎ方、明るさの解釈が変化しているという訳です。

 

スライド6は、複数の要素がどのように結びつく傾向があるかを示した図です。専門用語で、まとまりやすさを規定する要因をまとめて、群化の法則といいます。左の一番上の図を見て下さい。点が8個、等間隔に並んでいます。下の近接の図では、点が二つずつ、近い距離で並んでいます。そうするとまとまりができて、計4個のまとまりとなります。近くにあるものはまとまって見える、という当たり前のことを言い換えたのが近接の要因となります。

 

その下3つでは、2つずつ似たものになるように配置してあります。そうすると、上のものと同じで、8個のものが計4個のまとまりとして知覚されるようになります。これらは類同の要因と呼ばれます。共通運命というのは要素が同じ方向に動く場合です。対称というのは、左右対称になっている曲線がまとまるということを意味しています。並行は同じ幅のものがまとまる傾向にある、ということです。良い連続は線が滑らかに繋がっていることで要素がまとまることを指します。閉合は閉じたものがまとまりやすいということです。他にも色々ありますが、まとめて群化の法則、あるいはゲシュタルト要因という言い方をすることもあります。ゲシュタルトは「形」を意味するドイツ語で、ゲシュタルト心理学は20世紀初頭では有力な心理学の学派でした。ゲシュタルト崩壊という言葉もありますが、鏡に向かってお前はどうこう、というのとは少し違います。ゲシュタルト崩壊は次週取り上げます。

 

知覚的体制化は色々あり、また単に要素を結びつける(群化)だけではありません。要素がまとまった結果、本来存在しない視覚的属性も現れることがあります。左の図を見て下さい。素朴に見れば、真ん中に白い三角形がある、というでしょう。しかし物理的には白い三角形は存在しておらず、三角形の存在を示唆する要素が置かれているのみです。この図を考案したのはカニッツァというイタリアの心理学者です[19]。また、この欠けた円盤はパックマンと言います、正確には複数あるのでパックメンです、論文にもそのように書きます、ってどうでも良い情報ですね。

 

右の図は知覚的体制化の他の例で、透明視とよばれている視覚現象です。色の回でも説明したものです。スライド7の右の図形を素朴に観察すれば、二色に塗り分けられた背景があって、その上に半透明な円盤が載っているように見えます。しかし、この図は、要素だけを取り出せば、このように透明な要素はどこにもありません。透明に見えるのは、私たちの脳が、要素をうまくまとめた結果なのです。アニメーションを作っていますので、見て下さい。また、透明視を体験する器具を作ってきました。その器具を回しますので、十字になるようにするとちょうど透明に見えるようになると思います。

 

形が見える、と話して来ましたが、実は視野の中には、形を持たないものがあります。それは、地、または背景です。知覚心理学では、地と対立する概念は図で、形を持つものは「図」となっている、とみなされます。例えば、何もない背景上に、正方形が一つある状況を考えて下さい。この場合、正方形と名付けている領域が「図」であり、背景は「地」となります。一番自然な解釈は、「白い背景の上に黒い正方形が乗っている」というものですよね。これを言い換えると、地は、図の背後でつながってみえ、特定の形をもつとは限らないという特徴があることが分かります。しかし、ここでなぜ図になったり地になったりするかは、実は曖昧です。なぜなら、図も地も視野のある部分を占める領域であるという意味では変わらないからです。例えば、視野が二つに塗り分けられているだけならどうなりますか。どちらが図となり、どちらが地となるかは曖昧となります。

 

そこで、図のなりやすさを決める要因というものが知られています。スライド9にそれをリストアップしたものを示します。面積の要因、明るさの要因、色の要因、凸領域の要因、などです。図と地の要因が拮抗するときには、図と地の反転という現象が起きます。スライド8の左の図は有名な、ルビンの盃です[20]。この応用の例は天神コアです。

 

では、図と地の分化が起きて、群化してみえたとして、個々の要素はどのように見えるのでしょうか。例えば、物体には大きさと色があります。形と色は別々に考えていてよいのかというと、厳密には形と色は別々に考えることはできません。見える形によって、色が変わるのが色対比や色同化でした。どのようにまとまるかによって、見かけの明るさも変化することが知られています。

 

別の言い方をすると、形の知覚と色の知覚は、厳密には分けて考えることができない、ということです。有名なのはHermann grid錯視です、スライド10の上の図です。黒く塗り分けられた領域があるとして、その交点が黒ずんで見える、という錯視です。これもまた有名な錯視ですよね。透明視に関する明るさの錯視もあります、それがスライド10の下にあります。

 

最後に、少し違った話題です。図と地の入れ替わりは、個人によって反転するタイミングが異なりますが、その反転が個人の性格と関係があるかを調べた研究を紹介します[21]。この実験はとても簡単で、いくつかの種類の図地反転図形を用意します。そして、被験者(観察者)は黒い領域と白い領域のどちらが手前に見えるかを答えます。そして、反転のタイミングを集計します。それとは別に、性格を測る検査を質問紙によって実施して被験者を分類し、性格ごとに反転の回数に違いが生じるかを調べています。その結果、内向的な人と外向的な人では、反転の回数にわずかに差が生じることが分かったという。明らかなのは、内向的な人は反転が少ない、つまり一つの見え方が持続しやすいというそうです。ですから、性格が見え方に関係しているといっても、悪く言うと影響はあるがごくわずか、ということが出来ると思います。

 

次週は、形の知覚の続きです。コメントカードを書いた人は提出してください。それでは授業を終わります。

 

7. 形の知覚II

 

今回は形の知覚の2回目です。前回は、形の知覚の基本原理は、網膜に与えられた要素をまとめる働きである、と解説しました。その働きの原理として群化の法則、また透明視の例を解説しました。今回の話は、より複雑な模様の知覚、例えば顔や文字の認識などの話をします。前回の基本原理で話したとおり、いくら複雑な模様であっても、形の知覚の原理は、部分的な要素をまとめあげて、全体的なものを作り出すということです。あとは空間周波数、加えて大きさの知覚の話題もします。

 

まわりの人が誰なのか、またその人の気分は、どのようにして知ることができますか?明らかに、その人の顔を見ることが一番常識的ですよね。加えて、もちろん声の質なども、個人の識別や感情の推測に役立ちます。心理学でもこのような常識通り、顔の認識が、他者の社会生活を送る上でとても重要な働きをしているとみなします。言い換えると、テレパシーは使えないということですね。

 

さまざまな表情の認識は、本当に顔の一部の微妙な変化を捉えているということを意味しています。では、目や口のような要素があれば十分なのでしょうか?まず、この図をこのまま見て下さい。左右の写真に、明らかな違いがありますか?対して違いがないように見えると思います。この人は、世界史が好きな人ならご存知とは思いますが、イギリスの元首相のサッチャーです。「鉄の女」という愛称で?、不況を乗り切る舵取りをした人として有名ですね。では、紙を反転させて見てみましょう。

 

ぎょっとしませんか。右のサッチャーさんは穏やかに笑っていますが、左のサッチャーさんは凄いことになっています[22]。怒っていますよね。この図の作り方は、目と口を切り取って、逆さまにくっつけたというだけなのです。つまり、表情認識には、目や口といった要素の配置の方向を含めた、全体の形状がとても大切であるということです。これはサッチャー錯視と呼ばれています。

 

表情は、いくつかの種類、カテゴリに分けて考えることができます。スライド3では6つの基本表情というものを紹介します。それぞれから、表情を読み取ることが出来ますよね。これは、つまり、何の働きによるものでしょう。簡単に言えば、顔の部分が然るべき形状になったときに、特定の表情が知覚されます。ほとんど当たり前ですが。もう少し丁寧に言えば、眉が少し歪んでいたり、目が開いたり、口が微妙に曲がったり、というとてもわずかな顔の変化が、さまざまに異なる種類の表情を作り出しています。このような微妙な違いを処理する、専門の部位を脳は有していると考えられています。神経科学的な方法を用いた研究によれば、顔を処理する領域は、脳の中心から見て右後方やや下の直径2センチ程度の部分に存在していると言われています[23]

 

以上の例で、顔の知覚には全体的な処理が必要であることを見てきました。他の複雑な模様、例えば文字についても全体的な認識の重要性を示す例があります。スライド5を見て下さい。どれかの単語、たとえば「かくじつ」おの真ん中あたりを、20秒ぐらい見続けてみてください。どうでしょうか?単語の意味が分からなくなり、本当にこの「かくじつ」という字がこれであっていたか、分からなくなる。これは、ゲシュタルト崩壊と呼ばれる知覚的現象です。

 

ゲシュタルト崩壊は、学問的にはどのような意味があるのでしょうか。まず、同じ模様をずっと見続けることを、専門用語で順応と言います。色覚で少し説明した、明順応・暗順応の「順応」と同じです。複雑な模様について順応すると、全体的な認識がしづらくなります。言い換えると、認識が要素の部分、へんやつくりだけにとどまっているのです。これはつまり、要素の群化は永続的なものではなくて、同じ模様を見続けると、順応によって、群化したものが今度は離れてしまう、ということを示しています。

 

「知覚的体制化」や「群化の法則」は、法則といっても、質的な記述にとどまっています。現在は、形の処理は、空間周波数解析と呼ばれる、網膜像を統合・分析する方法が用いられることが多いです。要素を全体に統合して、最終的な認識に至る際の模式図をスライド7に示します。入力が左に示してあり、要素を解析によって取り出し、それを記憶と比較する、ということです。この、私たちが記憶に持っている表象を、鋳型、に例えることもあります。群化の法則の欠点は、連続的に変化する画像や要素については、どのように考えるのか難しいという点があります。顔などのパーツは連続的なので、群化といってもどの程度まとまりをなす傾向があるのか、また連続的に変化する模様についてどのように扱えば良いのか、扱いにくいですよね。

 

空間周波数は、普通の時間周波数とは概念的には近いです。周波数というのは通常は時間を単位で考えますね。しかし空間周波数というのは、字が示す通り、空間の次元で周波数ということを考えます。変化するのは、明るさ、つまり輝度です。周波数が高いというのは波の繰り返しが多いということです。ですから、空間周波数が高い、ということは細かい模様が多いということを意味します。逆に周波数が低い、というのは繰り返しが少ないということです。つまり、空間周波数が低いということは、模様の持つ変化が緩やかであることを意味します。空間周波数の単位はcycle/deg(サイクル・パー・デグリー)で、視角一度あたりに波が何回繰り返されるかをもって測ります。視角一度は、およそ手を伸ばして1cmの大きさが一度でした。周波数解析の良いところは、繰り返しのない2次元画像であっても、繰り返しを持つ波の足し合わせによって、どのような画像でも再現できるというところにあります。これは数学的にはフーリエ解析と呼ばれる手法です。

 

空間周波数については、いくつか重要な点があります。人間はすべての周波数を平等に処理できるわけではないということです。まず最初に、人間が見ることが出来る最大の空間周波数はおよそ60cycle/degであると言われています。これは言い換えると視力の限界、ということです。この図の横軸では空間周波数が連続的に変化しており、縦軸は空間周波数のコントラストが一様に連続的に変化しています[24]。これを見ると、縞模様が見える境目は、山なりのようになって見えませんか?この図は、着席している場所によって、山のピークが変わって見えるはずです。恐らく、後ろの方の人はすとん、と下がっているように見えて、前の人はなだらかに減るように見えるはずです。物理的には、コントラストは横方向で同じですので、山形に見えたとすれば、コントラストの見やすさは空間周波数によって異なるということです。言い換えると、人間が処理できる空間周波数には偏りがあるということです。

 

これを応用した例があります[25]。普通に見ると、有名なアインシュタインが見えます。では、この図を少し離れてみてみましょう。いかがでしょうか、今度はアインシュタインがいなくなります。代わりに、マリリン・モンローが現れます。これはハイブリッド画像とよばれるものであり、それぞれの顔の空間周波数を取り出して合成して作られています。観察距離が変わると網膜上で空間周波数が変わるので、距離に応じて見える模様が異なるということです。これも空間周波数解析の重要性を示す例です。

 

次に話題を変えて、形の知覚の一つである大きさの知覚の解説をします。大きさについては、色のときの話と良く似ています。色の時は、色は判断対象の領域の波長では決まらない、ということでした。大きさの場合も同じで、ある領域の大きさはその網膜像の大きさでは決まらない、ということです。

 

日常場面での知覚される大きさを考える上で最も大切な要因は、判断する物体までの距離が、見た目の大きさに大きく影響する、ということです。一番簡単な例は、例えばほぼ同じ大きさの人が異なる距離にいる場合、遠くの人の像は、網膜像上では小さくなっています。これは2回目の視角の説明の時に話した通りです。それにも関わらず、普段は距離が離れていても知覚される大きさはほとんど変わりません。これは、大きさの恒常性、と呼ばれている知覚現象です。これを別の側面から見ますと、網膜像上で一定の大きさのものは、その大きさが定位する距離にしたがって見た目の大きさが変化するということです。これは残像の場合で明らかで、エンメルトの法則と呼ばれています[26]。カメラのストロボ光などの残像でこれを試すと明らかですが、繰り返したり、太陽でやると眼を痛めますので気をつけてください。残像を手のひらに映すと残像は小さくなり、壁を見ると残像は大きく見えます。これを利用した錯視がスライド10にあります。つまり、距離が変われば、大きさが変わって見えるということです。月の大きさが位置によって変わって見えるのも、この距離の要因が大きいと考えられています。

 

大きさの知覚は、もまた、というべきかも知れませんが、色々よく分かっていないことが多いです。スライド11はすべて、大きさ錯視の例です。例えば、描く図形の明るさによって見かけの大きさが変化することを示すのが左上の図です。右上の図は、真ん中の円は同じ大きさですが、取り囲む円の大きさによって見かけの大きさが変化するという例です。真ん中の円は小さい円に取り囲まれると大きく見えますので、大きさの対比が起こっている、という言い方もできます。これは発見者の名をとってエビングハウス錯視という名前がついています。

 

下二つはまた、別の錯視です。遮蔽拡大錯視とは、部分的に覆われた図形は、単独の要素に比べて大きく見えるというものです[27]。半円の大きさが、左の方が大きく見えます。その一方、覆われる部分が両側にあると、逆に全体としては縮小して見える、という現象もあります[28]。この辺りのことは、本当に基本的な感じのする話ですが、なぜ拡大したり縮んだりするのか、その根本原理を説明するというのはまだ誰も成功していません。

 

今日の話は二つの要点がありました。一つは、視覚システムは要素を統合する際に、空間周波数解析をしている、ということです。もう一つは、ある領域の大きさの知覚は、奥行きや周りの形状の影響を大きく受ける、ということです。2番面の点に関しては、色や明るさの話と似ていて、大きさの判断というのはそれ単独、つまり網膜像の大きさのみで判断することはできないということです。どのようなものに取り囲まれているかも重要な役割を果たしているということです。

 

来週からは数回、奥行き知覚、つまり距離を認識する仕組み、について話します。

 

空間周波数の補足説明:幅の異なる縞模様を考えてみましょう。空間周波数が高いとは、縞模様が細かいことを意味します。空間周波数が低いとは逆に、縞が荒い、大まかであることを意味しています。つまり、見ている模様の複雑さ、細かさを記述する方法として、空間周波数という、規則的な繰り返し模様を単位として使えそうであるということが分かります。縞模様だけを分析して何が嬉しいの?と思うかもしれません。それには良いこと、ご利益があることが数学の定理として知られていて、任意の2次元の模様であっても、規則的な波であるサイン波の組み合わせによって表現できるということが知られているのです。それは数学的にはフーリエ解析と呼ばれる方法で、理系では基礎的な数学の技法です。つまり、与えられた画像について、低空間周波数の成分が多いならば大まかな模様であることを意味し、高空間周波数の成分が多いならば細かな模様であるということを意味しているわけです。ちなみに、このフーリエは200年前の数学者で、元々は物理学の分野で利用された方法が、応用されています。基礎的な学問はいつどこで役に立つか分からないので、今知覚心理学で学んでいる事柄も、思いもよらぬ方法でいつか役に立つ日が来る可能性があります。

 

8.単眼性手がかりによる奥行き視

 

今回から数回は、奥行きを知覚する視覚システムの働きについて解説します。奥行き知覚は形を知覚するメカニズムの一部と考えることもできます。つまり、網膜像に与えられた要素を、特定の方法でまとめ上げるということです。その処理はとても複雑で、研究も多くあります。今日のテーマ、単眼性手がかりによる奥行き視は、前回の形の知覚の2回目の大きさ知覚で話したものと関連があります。それは距離によって、見かけの大きさが変化するということでした。では距離の知覚は一体何によるものなのでしょうか、ということです。

 

基本的な問題設定はスライド2を見て下さい。網膜像は、さんざん繰り返していますが、2次元です。平べったい、ということです。それに対し私たちを取り巻く環境というのは3次元、立体的です。つまり、一次元足りないわけですね。一次元はつまり奥行きの次元、見ている方向について距離が定まれば、3次元となります。それを視覚システムがどのように復元しているかは、端的に言えば、脳が種々の仮定を用いて、3次元の解釈を行おうとしている、ということになります。種々の仮定とは、画像に含まれる手がかりを利用する、ということです。

 

手がかりというのは、岩を上る時に手をかける、というのが元の意味ですね。つまり、出発点は網膜像で、外界はまだ得られておらず、手がかりを使うことで、見かけの3次元解釈に到達する、というイメージです。手がかりは色々あり、今回はそのうちの一部、単眼性手がかりについて話します。次回は両眼性の奥行き手がかり、また運動による奥行き手がかりもあります。眼球運動性の奥行き手がかりもあり、それらは近々解説します。

 

単眼性、という言葉ですが、これは、片眼の網膜像にすでに含まれる、という意味で単眼性、という名前がついています。単眼性の奥行き手がかり(monocular cues to depth)は、絵画的奥行き手がかり(pictorial depth cues)とも呼ばれます。通常は静止していても利用可能な手がかりです。それに対し、両眼の情報は両眼性手がかり、運動によって得られる場合は運動手がかりです。一覧にしたのがスライド3です。

 

単眼性の奥行き手がかりは、色々な種類に分類できることが知られています。スライド4を見て下さい。まず最初に、線遠近法手がかりから解説します。スライド5を見て下さい。高校などの美術で、建物などの図を書くときに、このように一点やいくつかの点に収束するように描くと、本物らしい絵が描ける、と習ったと思います。パースペクティブという言い方をしたり、透視図法、という言い方をしたりもします。それを知覚心理学も流用していて、それは三次元空間内で平行な線は、遠くに行くにつれて狭まる、ということを脳が知っているからである、という理屈です。線遠近法手がかりは、具体的には、平行線や、このようなY型の矢型の接合部分(接点と言います)が奥行き知覚の手がかりとなる、ということになります。

 

線遠近法による奥行き知覚を分かりやすく示す例に、マッハの本Mach's book)というものがあります[29]。マッハの本はプリントの付録につけています。上手に折り曲げて、切り離して下さい。そして、それをおよそ60度に折り曲げて下さい。これがマッハの本です。それを、折り曲げた面を下にして机の上に置いて下さい。それを片目でしばらく見てもらえますか。ぼんやり見ていると、マッハの本が立ち上がります。頭を動かさないようにして、試してみましょう。面白いことに、立ち上がって見えた時は、面の明るさが変わって、発光しているようにも見えます。安定して立ち上がって見えたならば、少し頭を動かしてみましょう。うまくすると、頭を動かしたらその方向に、立ち上がったままついてきます。これも面白いので、ぜひ試して下さい。Y型の部分を90°として解釈しようとすると考えると理解できます。

 

エイムズの部屋とは、アメリカの心理学者のエイムズが作成した遠近法を利用した錯覚です。スライド6を見て下さい。体験できる現象としては、このエイムズの部屋に入ると事物の大きさが変になって見える、というものです。仕掛けは、部屋が実際には歪んでいる部屋で、一点から見ると線遠近法にしたがって見えるように作られています。大きさが変わって見えるからくりは、遠近法により距離を誤って判断してしまうということに起因します。エイムズの部屋を上から見るとこのような台形をしていて、人は奥の角に位置しています。見かけの奥行きは長方形の部屋になりますので、距離を誤って判断してしまい、このように小人と大きな人に見えてしまうという訳です。文学部心理学研究室にも、エイムズの部屋の模型がありますので興味のある人は見にきて下さい。

 

次の手がかりの説明に移ります、スライド7を見て下さい。明らかに、奥行き方向に傾いた面が見えますね。肌理(きめ、テクスチャ)の勾配とは、このように要素の密度が異なっていることによって、奥行き感を生じさせるというものです。線遠近法と原理はとても良く似ています。要素の密度が高い方が奥に、要素の密度が低い方が手前に位置します。

 

今説明しているのは、スライド4でいうと単眼性手がかりです。単眼性の奥行き手がかりもまだまだあります。大気遠近法の手がかりについて説明します。スライド8の写真を見てみましょう。遠くに山が見えます、山には木々がありますね。このように手前にも木々があります。遠くのものはコントラストが低く、明るく、かつ青く見えるということが、大気の物理的な特性から知られています。カラーメータで見てみましょうか。全体的に遠くのものの方がRGBの値が大きく、またその差が少なくなっていることが分かります。これは、大気中の分子が光を反射するときには、可視光線の波長の短いものを良く反射するという特性があることに由来します。絵画でも、このようなことを利用して絵を描くと、遠近感のある絵を書くことができます。

 

このような遠近法を利用した絵画を見てみましょう。西洋の絵画を紹介したウェブページを紹介します[30]。これらの絵を、奥行き感の有無、という視点から見てみましょうか。ロマン主義についてのページです。例えばこの絵は写実的ですが、奥行き感があまりありません。それは何に起因しているかというと、背景を明るく描いていない、つまり大気遠近法を利用していないからであるからですね。逆にこのように奥行き感がある絵は、背景は白っぽく、また青みがかっています。これは大気遠近法をうまく利用しているからです。

 

遠近法の例は、遠くのものは小さくなる、という現実世界に関する仮定を視覚システムが利用しているから、ということが出来ます。逆に、日常場面で遠くのものが大きいと、奥行きをうまく感じることが出来なくなることが予測できますね。これは風車の写真ですが、どの程度の距離にあり、どの程度の大きさか分かります。どれくらいの大きさがあると思いますか。高さは100m、回転部分であるローターの直径は80m(または92m)です。これは、文字通り遠近感が狂って見えます。これは風力発電の風車で、実物を見ると遠近感が狂って感じられて、とても貴重な体験ができます。

 

陰影とは、照明に関わる物理的な制約条件と関係しています。光源に近い方が明るく、光源に対して遠い方が暗くなる、という制約です。この場合光源の位置が重要となるわけですが、心理学によれば光源の位置は上という仮定のもとで奥行きを復元していると考えられています。

 

次のスライドは線遠近法とも関係があるもので、面のつながり・重なりに関するものです。スライド10を見て下さい。異なる面が3面交わるとY型の接点(Y-junction)や矢型の接点が出来て、また奥行きの異なる面が存在しているときには、T型接点が出来ます。それらが意味することは単純で、Yや矢型の接点ならば、それらは3次元環境では直角に交わっている、と視覚システムが仮定する傾向にあります。

 

これらは遮蔽(occlusion)の奥行き手がかりと呼ばれています。私たちはこのような画像を見ると、不可避的に奥行きを感じます。それは局所的な、TYなどの形を処理しているということになる訳です。透明視、第6回目で解説しましたが、透明視の手がかりも接点で考えることができて、それはX型接点と呼ばれます。

 

これらの手がかりで重要なのは、それぞれは局所的な、つまり要素的な画像特徴である、ということです。騙し絵の一種に描けるけれども作ることが出来ない不可能図形、というものがありますが、それはこのような奥行き手がかりをいわば「応用」して描かれています。つまり、局所的にはあり得るけれども全体的にはあり得ない、という訳です。

 

エッシャーの「滝」(1961)や「物見の塔」(1958)は、このような局所的な奥行き手がかりを利用した例です。ちなみにエッシャーのこの絵「昼と夜」(1938)も有名ですが、これは、形の知覚で出てきた「図地反転」を利用しています。そういえば二回前の授業で、水平垂直の要因は、縦横が図に見えるのかどうかについて調べてくるということを言っていました。調べましたが、やはり斜め方向より水平垂直に広がる領域が図になりやすいという傾向があるということでした[31]

 

知覚心理学ではこのような現象をどのように考えているかを解説します。局所的な奥行き手がかりの処理は自動的に行われるけれども、全体的な処理は大変で、完全には行われないのではないか、という説が有力です。どのように、部分の処理を調べるかについては、最後の2回の視覚情報処理の回で説明したいと思っています。

 

次週は奥行き知覚の続きです。特に、両目で世界を見たときに立体的に見える仕組みを解説する予定です。

 

9.両眼立体視

 

前回は、片眼の網膜像に含まれる奥行き手がかり、単眼性奥行き手がかりについて話しました。遠近法や、陰影によって、3次元的な印象が生じるというものでした。今日は、単眼ではなく、両眼性の奥行き手がかりについて話します。今年、テレビを見ていると、今年は3D映画だ、というような宣伝がありますね。映画館に3Dのための設備が普及してきた、ということらしいですね。先日も、NHKのサイエンスゼロという科学番組をやっていたらその解説がありました。今日の話は、いわゆる3Dの基礎となる話、心理学の言葉で言えば両眼立体視(stereopsis)という話をします。

 

単眼性の奥行き手がかりは、前回の授業で、色々な種類があるということを話しました。両眼性の奥行き手がかりでも基本的には同じで、両眼性手がかりも複数あります。しかし、単眼性手がかりの場合と異なる点もあります。両眼性手がかりの場合には、特に重要な手がかりがあります。それは両眼網膜像差(binocular retinal disparity)、またの名を両眼視差といいます。

 

両眼網膜像差は、名前は堅苦しいですが、原理は簡単な幾何学です。最初に、3次元空間内で奥行きの異なる場面から考えてみましょう。奥行きが異なるというのは、観察している人に対して、距離が異なるということです。そのような場面をスライド2の下の方に描いています。この場面を、両眼、二つの眼で見る場合に形成される網膜像の模式図を下に描いています。良く見ると、わずかながら、二つの眼の間の網膜像に違いがあることが分かります。黒い点を注視、固視しているとします。そうすると、赤い点の網膜像は、右目から見たときにわずかながら黒い方に寄っているはずです。このずれが、両眼網膜像差です。この場合、両眼間のずれを利用して、三次元的な空間を推定する、というのが奥行きを知覚することの本質です。

 

この網膜像差についての補足ですが、「水平」という形容がつく場合もあります。水平網膜像差という場合もあります。その意味は、このような幾何学的な関係を考えると、ずれは水平方向で顕著である、ということに由来します。

 

もう一つの代表的な両眼性の奥行き手がかりは、両眼間非対応要素というものです。こちらも堅苦しい言い方ですみませんが、なるべく正しく表現しようとするとこのようになります。しかし、意味することは難しくないです。字面の通り、両眼間で対応が取れない要素に基づいて、奥行きが知覚される場合がある、という話です。

 

では、網膜像差から解説をします。スライド3を見て下さい。このような図は、一見ランダムに見えるわけですが、二つの画像を、両目を離れ目や寄り目にしたりして見たときに、意味のある形が見えます。上の図が、ランダムドットステレオグラムと呼ばれるものです。試してみましょう。紙を机の上におき、眼の真下になるように置きます。そして、紙の向きが二つの眼の方向と平行になるようにします。その頭を紙に近づけて、遠くを見る気分になると、図形がずれて、うまくすると3つになる状態が作り出せます。真ん中の、重なった図形に意識を集中すると、形が見えます。この場合、真ん中に正方形が見えます。コツは、眼をキョロキョロ動かさず、じわーと図形をずらしていき、ちょうど図形が重なって見えるところを探してみてください。二つの図形を重ねて見ることを、専門用語で両眼融合と言います。

 

下の図は上のランダムドットの説明図です。外側の部分のドットは全く同じで、白い部分は水平方向にわずかにずれています。このずれが、像差です。ランダムドットで正方形が見えるというのは、突き詰めて言えば、奥行きの違いだけで形が見える、ということになります。(紙の上に描かれた通常の形は、明るさによって定義されている、ということになります。)

 

スライド4と5は、水平網膜像差の原理を利用して作られた図形です。見方はスライド3のものと同じですが、図形の上の方にある二つの点PQが重なるように眼を動かしていくと、奇麗に融合して見えるはずです。一般的に、両眼融合して形が見えるように作られた図版のことを、ステレオグラム(stereogram)と言います。通常のステレオグラムは二つ一組ですが、一枚でつくられているものはオートステレオグラムと言います。オートと言っても自動的という意味はなく、寄り目か離れ目にしないと見えないので、注意してください。

 

網膜像差の概念的な説明はスライド2がすべてで、像差をもとに、3次元世界を復元することが出来る、ということを意味しています。大雑把に言えば、像差は凝視している場所で0、それより大きければ近いまたは遠いことを意味します。では人間は、どのような像差の範囲を処理して奥行きを復元することが出来るかというと、およそ視角で、大きくても2-3°ぐらいの両眼像差までしか処理できないということが知られています。実験結果の一例をスライド4に示します。この実験では、このようなステレオグラムをPCの画面に呈示します。実験を受ける人は、見かけの奥行きを、調節する図形を呈示して再生する、という方法をとります。

 

ランダムドットステレオグラムの学術的な意義は、両眼融合した時にのみ、意味のある形が見える、という点にあります。通常の3次元世界は、前回話した通り、単眼性、絵画的奥行き手がかりをふんだんに含んでいる訳です。ですから、このような刺激を使って実験を行うと、見えの奥行きが両眼網膜像差の処理によるものなのか、単眼手がかりによるものなのかが区別できません。

 

冒頭で3Dがはやっている、ということを言いましたが、映画館ではこのような寄り目や離れ目は要求されていませんよね。それには、両眼に異なる画像を呈示する別の技術が用いられているからです。方法の名称の一覧をスライド7に示します。昔のものは赤緑眼鏡を使うものでした。これは専門用語でアナグリフ法と呼ばれる手法で、雑誌の付録などにもありましたね。原理は、混色に近いものです。赤いものを、緑のフィルタを通してみると暗く見え、赤いフィルタを通してみると明るく見えます。緑のものの場合は逆になります。黄色いものは、いずれのフィルタからでも明るく見え、黒いものはいずれのフィルタを通した場合でも黒く見えます。

他の方法には、偏光フィルタを用いるものがあります。まずスクリーンに、右眼用の画像と左眼用の画像をそれぞれ方向が90°異なる偏光成分のみで描きます。偏光フィルタをそれぞれの眼の前に置いて見ると、右眼と左眼に別々の画像を表示することができます。他にも色々あります。

 

これまでの話は、基礎的な水平網膜像差の話でした。ここからは、比較的新しい話題を話します。一つは垂直像差、もう一つは両眼間非対応要素による立体視です。

 

両眼像差が、水平でない場合にはどうなるのか、という疑問が単純に生じると思います。状況は、スライド2のそれぞれの網膜像を、90°回転させると、垂直像差が発生します。ここ20年ぐらいの研究によって、垂直像差は特殊な条件でのみ、奥行き知覚を生み出すということが知られています。スライド8の左の図を見て下さい。その一つが垂直大きさ像差と呼ばれるもので、片眼に呈示した画像を、もう片眼には縦方向に拡大したものを呈示します。幾何学的に考えれば、縦に引き延ばしても奥行きは生じないのですが、刺激が大きい場合には、この刺激の場合には垂直軸回りに傾いて見えることが知られています。どれくらい大きければ良いかというと、刺激の大きさがおよそ縦横が20x20°以上だと、垂直像差から奥行きを知覚することができると言われています。

 

次の話は、そもそも像差を生み出さないような両眼の画像から奥行きを知覚することができるのか、ということについて話します。またここ20年ぐらいは、両眼で対応が無い要素からでも、奥行きが知覚される場合があるということが知られています。典型的にはスライド9の上の図形です。このステレオグラムも、紙に眼を近づけて見てみてください。黒い棒が、白い長方形の右についていますが、これは長方形の奥に感じられませんか。この黒い棒は、左眼には無く、対応が生じない、つまり両眼網膜像差を定義できないことが分かります。それにも関わらず、黒い棒は奥に見えるので、両眼間で対応が無い要素であっても、奥行きを作り出すことが出来る、というわけです。

 

スライド9のその下の例も、両眼間非対応要素による立体視の例です。両眼融合しつつ、中央の十字を見ると、どこかの領域が手前に見えます。具体的には、白い、ぼんやりした面が右上の領域に見えれば成功しています。融合を外してこの部分を見ると、片方の画像で、棒が切れていることが分かります。切れているということはすなわち、両眼間で対応を取れないということです。その場合でも奥行きを感じるということは、両眼間で対応を取れない要素も、奥行き知覚の手がかりになっているということです。

 

今までは、奥行き手がかりを個別に見てきましたが、手がかりが組み合わされた場合には、組合せ特有の効果が起こる場合があることも知られています。スライド10の上の図を見て下さい。これは三つあるタイプのステレオグラムで、隣り合う図形を融合するようにデザインされています。両端の図形は全く同じです。うまく融合すると、二つの立体図形が見えるはずです。上の場合、長方形が円を部分的に遮るように描かれています。長方形が手前に見えるときには、融合しない場合と似たような見えになりますが、長方形が奥にあるときにはどう見えるでしょうか?この場合、円に、透明感が生じます。

 

その下は、主観的輪郭と両眼網膜像差を組み合わせた例です。主観的輪郭は、形の知覚の時に話しました。この場合には、融合した図形は融合する画像が左右に入れ替わるだけであるにも関わらず、見えるものが全く違います。つまり、四角い主観的物体が手前にあるときには白い円筒状のものが、平たいパックマンに乗っているように見えます。融合する図形が逆になる場合には、パックマンは今度は穴のようになり、穴を覗いて白い物体を見ている、というような見え方になります。

 

色々話してきましたが、これらのことを情報処理的な流れ図として書けば、スライド11の図になります。左が入力で、右に行くに従って処理が進む、という図になっています。まず、両眼の網膜像があって、それらを比較する機構があり、その後いろいろな取り出し方を経て三次元的な構造が脳の中に表現される、という図式となります。

 

今日の話をまとめると、視覚システムは左右の眼に映る像のわずかな違いを利用して、正確な奥行きを復元しているというのが第一点です。もう一点は、ほとんどのステレオグラムの原理は水平網膜像差と呼ばれる手がかりである、ということです。

 

10. 運動視

 

コメントカードの回答です。プリントのステレオグラムが見えなかったという人が多かったです。見えない一番の原因は、眼を回転させる筋肉の制御の制御に慣れていないことだと思います。ちなみに私の学部の時の先生も、ステレオグラムはうまく見えない、と文句を言っていました。実際に実験室で行う場合には、鏡を使ってより融合しやすい装置を使います。

 

では今日の話に入ります。今回は運動視の話です。知覚心理学で扱う運動というのは、視覚的運動、つまり見かけの動き、ということです。入力としては網膜に映る像が、時間的に変化するということです。時間的に変化する情報から、何らかの意味のあるものを取り出すということが、運動知覚の本質です。形の知覚や、立体視の場合と概念的には類似しています。形の場合は、網膜上の異なる位置に映った要素を統合する、というのが形の知覚の本質である、という話をしました。立体視の場合には、左右の像を統合して、像差を計算しそれから奥行きを作り出す、という話でした。運動視は、統合すべき要素は、異なる時間に呈示される、というのが一番の違いとなります。

 

この、異なる時間に渡る対応づけが運動を見る働きの本質であることを明快に示すのが、仮現運動(apparent motion)と呼ばれる現象です(スライド3)。これは、一番簡単な形式では、静止した2つのフレームを時間的に入れ替えることによって実現できます。具体例を見てみましょう。

 

この画像はどのように動いて見えますか?(スライド14)見方は、中央の十字を見つつ、丸がどのように動いているかを判断して下さい。あきらかに、上下に往復運動をしているように見えると思います。次はいかがでしょうか。横に往復して動いているように見えると思います。次はいかがでしょうか。縦に動いて見える人は手を上げて下さい。横に見える人はどれくらい?意見が分かれていますが、意見が分かれるのには理由があります。それは、仮現運動の原理と関係しています。それは最近傍対応の原理と呼ばれていて、要素の時間的な対応は、網膜上の近い位置をもとになされる、というものです。前の例にもどって考えましょう。要素の距離が異なるタイプの動きで、横に動いて見えるのは、距離が近いからそのように見えるわけです。距離が長い方には動いてみえませんよね。

 

この、4つの要素が等間隔に置かれる図形[32]は、面白い見え方をします。見続けていると、横に動いていたものが縦に動き出すことがあります。このように等間隔に図形が置かれている場合には最近傍対応の原理が働かないので、見えは曖昧となり、切り替わります。良く見ていると、回転しているようにも見えてきます。このような見えは、人間がもつ運動の知覚の仕組みを良く示していています。つまり、人間の視覚は、時間的に変化する要素をまとめる、統合する働きが備わっているということを意味しています。このような働きは、自動的なものです。映画やアニメ、PCの画面は、ご存知とは思いますが静止画を連続的に呈示しています。より複雑な仮現運動が生じている事態と考えることができます。映画の場合には一秒間に24コマ、PCのディスプレイの場合には最低でも60フレームが高速に切り替わっています。

 

この最近傍対応の原理が関係しているものに、映画の中で回転している車のタイヤ(正確にはホイール)は、たまに逆回転して見えるというものがあります。この現象は、最近傍対応の原理が関係しています。簡単に言えば、現実の場面をビデオカメラで撮影する場合には、24とか60フレームごとに撮影しています。そこで、高速な物体を撮影する場合には、一フレーム内での移動量が増えて、それがタイヤのような繰り返しのある模様の場合には対応関係が前後逆になる、という訳です。

 

このように、運動が見えるというのは、主観的な現象です。このことを別の点から示すものに、止まって見えるものが動いて見える、という現象があります。一つ目は、運動残効[33]と呼ばれるものです。特定の運動模様を見続けた後に静止した刺激を見ると、見続けた刺激とは逆方向に動いて見えるという現象です。体験してみましょう。8個のパタンがあって、どの図形でも良いですが中央の白い点を見ていてください。上は左向きに動き、下の領域は右向きに動いています。10秒ぐらい見て、刺激を止めてみましょう。いかがでしょうか、それぞれの図形の上の領域は右向きに、下の領域は左向きに、じわっと動いて見えます。これは、人間の視覚システムがもつ下位機構、運動だけを専門に処理する機構が疲労して、一時的に不具合を起こしていると考えられています。

 

運動が主観的な現象であることを示す他の例は、運動の錯視です。その例は、静止画がそのまま動いて見える錯視です。最近ですが、立命館大学の北岡明佳先生という知覚心理学を研究されている方がおられ、その先生がインターネット上で多くの楽しい錯視図形を公開しています。「蛇の錯視」という作品があります[34]。静止図形がぐるぐる回って見える、というやつですね。2冊本を回しますので、そちらを見てください。肝心の、どうして動いて見えるのか、ということですが、今のところよく分かっていません。

 

運動の錯覚は、止まっているものが見えるだけではなくて、運動の方向が変化して見えるという錯視があります。一番有名なのは、バーバーポール錯視と呼ばれるもので、床屋さんの前に、青・白・赤の斜めの模様が回転している円柱がありますね。ご存知ですよね。あれは、回転しているのですが、見かけの運動方向が円柱の軸の方向になり、無いところから帯が生じて無いところへ消えていくように見えるというものです。これは、運動方向の錯覚の一種です。前のスライド(16)を見て下さい。このままでみると、斜め方向の縞が左上に上昇するように見えます。見えますよね。では、この模様を、両手で細い隙間を作って、片目で見てみましょう。どうでしょうか、隙間の方向に動いて見えるようになりませんか。これは、運動の方向は、それを見るの方向に影響を受けるということを示しています。

 

また、運動から、形や奥行きを見るという能力も人間に備わっています。前回、ランダムドットステレオグラムというのを見てもらいましたが、その運動バージョンが運動視の研究では使われます。有名なものに、運動からの構造復元(structure from motion)と呼ばれるものがあります。考案した研究者の名をとって、ウルマンの円筒(Ullman's cylinder)とも呼ばれます[35]。ウルマンの円筒で面白いのは、奥行きの方向が、見方によって反転するという点です。円筒の回転方向が、突如逆になって見えます。バレリーナが回って見える影絵、silhouette illusion[36]はその応用と考えることができます。

 

奥行きの量と、奥行きの方向が決まる例はいくつかあります。一つに運動視差と呼ばれる刺激があります。これは、前の画面を見て下さい。中央の白い点を見ると、上と下の領域でドットが行ったり来たりしていることが分かります。ただそのまま見ると動きだけが分かります。では、上の白い点の動きに合わせて、画面中心の白いリングを見ながら、頭を振ってみてください。白い点を見つめる必要はなく、頭を揺らす際の目安にしてください。すると、恐らく屋根のような形をしているような、奥行きが見えると思います。これが、運動視差からの奥行き知覚と呼ばれるものです。屋根のような形が見えたら、逆に白い四角の動きと逆になるように動かしてみて下さい。そうすると、今度は手前に倒れかかってくる方向の、逆方向の奥行きが見えます。前の構造からの奥行き復元と違うのは、奥行きの量は一定だけれども、奥行きの方向は、眼の動きによって決定するという所が重要です。これは、近年の研究から、眼の動きの角度の情報が、奥行きを決める際にも使われていることが重要であることが分かってきています。

 

色々お見せしましたが、最後に一つ。運動は奥行きを知覚するために役立つだけでなく、運動の情報だけから、形を復元することができることも知られています。色々知られていて、一つは初回にも説明したバイオロジカルモーションというものです。生物学的運動とも呼ばれます。

 

この授業のオリエンテーション時にも説明しましたが、止まっている点だけだと何がいるかは分かりませんが、動き出すと明瞭に分かります。人ですよね。これらは、網膜に与えられた運動の情報だけから、形を認識する能力を私たちは有していることを示しています。運動視のデモは楽しくて、紹介し始めるときりがないのでこれぐらいで済ませたいと思います。最後はスリット視というもので、これを見て下さい。細い幅の領域に、ある模様が呈示されます。最初はこれです。平仮名一文字が呈示されていますが、分かりますか。難しいですよね。では、通過時間を速くしてみましょう。分かります?みみみみみと流れていくのが分かります。もっと速いとどうでしょうか。分かりますよね。これは、スクリーン上で呈示されているのは、このようなごくわずかな幅の領域です。それでも、動きが速い場合には、より幅広い場所に呈示されるのと同じように、模様全体を認識することが出来ます。これは、スリット視と呼ばれるもので、視覚システムが運動情報のみから形を認識することが出来ることを示すものです。

 

最後に少し違う話題ですが、このような運動を知覚する能力は、特定の種類の障害と関係している可能性が指摘されています。他者と関わることが苦手な、自閉症という障害があります。例えば人と見つめ合うことが苦手だったり、言語的なやり取りが苦手という障害があります。そのような人に実験をお願いして、バイオロジカルモーションの刺激を見せると、運動を認識しづらい、ということを示す実験結果があります[37]。定型発達児、つまり特定の障害がない児童の認識能力がどれほどかということと、自閉症児が行った場合の結果を比較します。Blakeらは、バイオロジカルモーションではなく、普通の動いていない模様から形を知覚する能力を測定するテストも行っています。そうすると、自閉症児と定型発達児は線画の形を認識する能力には差はなく、自閉症の人がバイオロジカルモーションを知覚することが困難であることが分かります。したがって、自閉症が他者と関わることが苦手なのは、視覚的運動の情報の一部を正しく処理できないことが関係している可能性があるということです。

 

今日の講義のまとめは、以下の二点になります。一点目は知覚される運動も、形や立体視と同じく、脳が作り出したものであるということ。二点目は、運動に関する錯覚は、運動を解釈する視覚メカニズムの誤動作である、というものです。

 

11. 眼球運動

 

これまでの話は、基本的には網膜に映った像をどのように処理するか、という話でした。情報処理の流れ図として書けば、スライド2のような図になります。左端が右目と左目からの入力像を示しています。まず最初に網膜像からいろいろな種類の手がかりや視覚特徴を取り出して、それをもとに外界の3次元構造を作り出す、という枠組みです。そして最終的に、意識に上る、ということになります。これは知覚心理学で広く合意が得られている枠組みです。

 

なぜこのような流れを考えなくてはならないのでしょう。簡単に言えば、人間の視覚というのは、素朴に考えると日常意識される世界というのは外界のコピーと考えることは不適切だからです。

 

このモデルの特徴は、自然場面の入力画像は処理されるべき奥行手がかりを含み、視覚システムはこれを別々に取り出すということです。それを明快に示すのは、今までさんざん紹介してきた錯視、視覚の錯覚です。まだ紹介していない錯視などについては、来週話します。

 

処理された視覚情報が意識に上るさいに重要と考えられているものに、注意と呼ばれる機能があります。注意を向ける、払うという言い方があります。この辺りの話は、最後の2回で話したいと思います。視野の中のある物体に注意を向けると、ほぼ自動的に眼がそちらに向きます。つまり、意識によって、眼を向けるための神経回路が作動して、眼を回転させる筋肉が動き、網膜像がそれによってまた変化するということになります。今日の話は、この眼球運動に関することです。

 

スライド3を見て下さい。眼球運動(eye movements)とは、日常の言葉で言えば、視線の動きということです。専門的に言えば、眼がさまざまな方向へ回転することです。眼球運動は、分類の仕方がいろいろあります。眼球運動でないものには、瞼の動き、瞳孔の収縮、瞬きがあります。

 

そもそもなぜ眼が動くかと言えば、一番大きな理由は、良く知りたい対象を見るために、網膜の中心の視細胞の多い部分を使うためです。スライド4は網膜像の模式図です。中止している部分は視細胞が多いので、細かな構造が見えますが、周辺になると視細胞が少ないので、細かな情報は表現できません。したがって、眼を動かすことで良く見たい対象に眼を向けることには意味があるはずです。

 

眼を回転させるのは、眼球と頭蓋骨をつなぐ筋肉である眼筋が役割を担っています。スライド5を見て下さい。眼筋は6本あり、眼球の3次元的に動かします。きちんと述べると、水平・垂直方向の運動に加えて、回旋(torsion)と呼ばれる3次元の回転になります。回旋は旋回の誤字ではありません。視線方向周りの眼球の回転です。その動きを制御する筋肉を含めて、3x26つの筋肉がそれぞれの眼についています。それぞれの筋肉の動きを、アニメーションで見てみましょう。回旋の動きは、実際の画像で見てみましょう。虹彩、瞳孔の回りの放射状の模様を見ると、回転していることが分かります。

 

次に、眼の動き方の種類を具体的に見てみましょう。スライド3でいうと、運動の時空間特性による分類のところです。まず、一番重要なものは、サッカードsaccade)と呼ばれる、高速な眼球運動です。サッカードは1秒間に2, 3回生じます。普通の文章を読むときは、ほとんどサッカードです。文章を読むときは、サッカードと停留を繰り返します。

 

サッカードに関連して、サッカード抑制という現象があります。眼を動かすと網膜像が動きますが、その動きは意識に上りません。そのような像の動きを意識から消すための機構を視覚メカニズムは有していて、実際にサッカード中の情報処理は入力をシャットアウトしていると考えられています。

 

停留中も、実は眼は少しずつ動いていることが知られています。どれくらい動いているかというと、視角で以内ぐらいでは、普通はゆらゆら動いています。それを体験することができることが知られていて、それは残像を利用したものです。黒い点をじっと20秒見て、その後白い点を見て下さい。残像が無くなったら、また黒い点を見ます。そうすると、斜め線の残像が見えてきて、それがふらふらするように見えます[38]。そのふらふらが、停留中の眼の動き、固視微動です。文字や顔を見るとき、特に静止しているものを見るときには、上で話したサッカードと停留を繰り返します。

 

サッカードは両眼が同じ方向に動きますが、逆方向に動く運動もあります。専門用語では輻輳眼球運動と言います。一番良く知られているのが水平方向の輻輳眼球運動で、遠くの事物を注視して、その後近くの事物を注視するときに生じます。逆でも同じです。輻輳の場合に特徴的なのは、人間はこのような両眼の逆方向の回転は、サッカードに比べてとても遅いということです。ちなみに、カメレオンはサッカードを両眼独立に行うことができます[39]

 

一般的に低速なタイプの眼球運動に、追従眼球運動があります。これは、滑らかに動く対象を眼で追う場合に生じます。頭が動く場合にも類似の眼球運動が生じます。頭を動かすと、視覚刺激の有無に関わらず眼は頭と逆方向に回転し、同じところを見続けるような働きをします。

 

以上は眼の動き方のとても基礎的なところですが、具体的に人に関わる場面に関連した話をしておきましょう。私たちが向き合っている、対面している場面を考えて下さい。そこで、片方の人がもう片方の人に質問をするとします。そうすると、考える時には眼を逸らす、という場合が良くあります。人によって右だったり左だったり、ということです。この機能は上で話して来たような、はっきりとした目的のある機能ではありません。例えば眼が右に向くからといって、答えが右に書いているわけではないですよね。

 

その一件無意味な眼の動きは、何かを反映しているのかを、調べた研究があります。その中で、質問の種類によって動く方向が違うという仮説がありました。綴り、定義、音韻に関することなどの言語的な質問と、視覚化出来るような質問では、眼の向く方向が異なるという仮説があります。言語的な質問とは、「3つの音節を持つ単語は?」、「アルはサムより賢く、あるはリックより鈍い。誰が一番賢い?」などです。右半球を必要とする質問は、「千円札の野口英世の顔は彼から見て右を向いている?」、「立方体には縁は何本ある?」、「ある人が朝日に向かっている場合、南はその人に対してどこ?」、などの空間関係を尋ねる質問や、ピアノのメロディーを同定する課題などが使われてきたようです[40]

 

これは、大脳半球差仮説というものと関係があるとされました。言語に関わる領域はにあります。また右視野の情報も左半球で処理されます。そこで、連想によって、言語の課題を出すと右視野を見るのではないかということが考えられるわけです。また、一般的に顔認識は脳の半球の一部で行われるとされます。空間的な課題というのも右半球にありそうです。この問題に関しては明快な答えは得られていないようです。

 

今日の話のまとめを、スライド12に載せています。まず第一に、視線の動きというのは眼球の回転であるということです。第二に、眼が動くのは網膜の中心で対象を捉えるためであるということです。第三に、眼の動き方は一種類でもなく、ランダムでもなく、さまざまな分類が可能であるということです。

 

12. 錯視

 

今回はA3の大きさのプリントを二枚配布しています。コメントカードの解説を書いてある方を出して下さい。前回は、視線の動き、つまり眼球運動について解説しました。

 

多かった質問は、サッカードと停留はなぜ生じるというものでした。補足しますと、視覚情報の取得は眼が止まっている時に最も効率よくできますよね。カメラで考えれば当たり前で、カメラを止めていないと何が映っているか分かりませんよね。これは人間で言えば停留に相当しているわけです。考えてほしいのは、停留の時間を長くするためには、眼が回転する時間は最小限にする必要がある。そういう視点からサッカード、つまり高速な眼球運動を考えてみると、とても合理的で、動くときは一瞬にすることで、停留の時間を増やすことができるわけです。

 

また多かったのは、2番目の質問、なぜ二つの眼は同期して同じ方向に動くのか、ということでした。これは、両眼立体視の視点からすると合理的で、二つの眼が同じ方向を向いていると立体視が容易に出来ます。立体視が出来る時間を同じく最大限にしようとすればサッカードは同時に、同方向に起こるのが一番合理的というわけです。

 

あと、固視微動が分かりにくかったということでしたので、補足します。固視微動は、停留中のわずかな眼の動きです。それを体験するためのデモンストレーションが前回のスライド8というわけでした。これは、残像を利用しています。残像は網膜上の同じ位置に作られます。残像が作られた状態で別の場所を見ると、残像と実際の風景の間に運動が見えるという仕組みでした。

 

今日の話は、錯視の話題です。錯視は視覚的錯覚(visual illusion)です。目の錯覚とも言います。ちなみに、錯覚のかくは角度の角ではないので気をつけて下さい。一般的な定義は、物理的な状態と見かけの状態が異なること、です。錯視も色々な種類があります。

 

この講義では、テーマごとに回を分けて話してきました。錯視についても似たような分類ができます。つまり、色や形、奥行きなどです。視覚のいろいろな属性ごとに分類することが出来ます。今日は、それぞれについて、授業中に紹介したこと、それに加えてまだ授業中に紹介していないものを中心に話します。

 

その次に、錯視の説明にはどのようなものがあるのかをお話しします。つまり、錯視が生じる理由です。ここでは、錯視が起こる視覚システムの仕組みについて話します。脳をコンピュータのような情報処理システムとして考えます。錯視が生じるということは、錯視図形が入力情報として与えられた場合に、錯視図形は正しく処理出来ない、ということになります。

 

注意してほしいのは、錯視が起こることに生存上の、生きていく上で何のメリットがあるのか、ということです。このような問いは重要ですが、現在の科学ではうまく答えることが出来ません。これは、少し話は変わりますが、例えば「人はなぜ生きるのか」というような問いには科学的な視点からはそう簡単に明快な答えは出ないのと同じです。

 

では、復習を交えて、錯視を見ていきましょう。3, 4回目は錯視の話でした。色の同化や対比というような話をしました。ある色に囲まれるとそれに影響を受けるという話です。他にも、ネオンカラー効果、水彩効果など色々あります(スライド7)。ネオンカラー効果とは、このように色をつけた十字を、黒背景に埋め込むと色がしみ出して、また光っているようにも見えるという錯視です。この、薄く色がついた円盤の部分は、色はついていません。水彩効果(watercolor effect)とは、色で縁取られた領域が色みがかって見えるけれど、実際には色はついていないというものです[41]。こちらは輪郭部分のみに色がついていて、それが内側と外側で違う色というわけです。これらの効果が示すのは、私たちの色認識というのは輪郭に重点を置いた処理をしているということです。

 

講義の4, 5回では形の知覚について話しました。幾何学的錯視というのは、単純な図形を組み合わせると、実際とは異なるように見えるというものです。最初のはミュラー・リヤー錯視で、これは水平の線分は実際には同じ長さだけれど、くの字型の矢羽根が加わると傾いて見えるということです。次のこれはツェルナー錯視と呼ばれるもので、平行線に小さな傾いた線分をつけると全体が傾いて見えるというものです。このような感じで、多くの幾何学的錯視があります[42]。錯視の部分の呼び方ですが、錯視を生じさせる側の要素を誘導図形と言います。多くの錯視は、19世紀後半の心理学者や物理学者などが発見したもので、基本的には発見者の名前がついていることが多いです。厳密な分類方法や、登録がなされる訳ではありません。数は数百ぐらい。幾何学的錯視の登録の基準はなく、慣例的に呼んでいるだけです。

 

この講義のその後は奥行きを話しましたが、ここでは新しくは話しません。具体的には、同じ大きさのものが異なる奥行きになると異なる大きさに見える、などの話をしました。線遠近法で描かれた背景に異なる大きさの物体を配置すると見かけの大きさが異なって見えるというものなどでした。エイムズの部屋、などがその例でした。

 

運動の錯視は、2回前にいくつか紹介しました。床屋の円柱も錯視でしたが、あれは運動方向が正しく知覚されない例でした。運動方向の錯視は色々あり、紙を使ったものでもできます。ピナの相対運動錯視というものがあります[43]。これは、中央の小さな点を見て、紙を前後に動かしてみます。そうすると、リングが回転して見えるというものです。運動の方向は、動かす方向とともに変化します。オオウチ錯視というのも似ていて、紙を振ると気持ち悪く動くというものです。これらの例を一般化して言えば、連続している線分の運動方向は誤って知覚されやすいということです。この誤った知覚は、脳のどこの処理に由来するのか。方位の処理は、眼ではなく脳で行われていると考えられているので、これらの錯視は脳によって作られているということを意味しています。

 

分類は他にもいろいろあり、見えているものが見えなくなる錯視などもあります。灰色の図形が描かれたプリントの一番下もその例で、中央の白い点を見続けると周りの輪郭が見えなくなるというものです。これはトロクスラー消失効果と呼ばれる錯視です[44]

 

このように錯視は色々あって、とてもこの授業中には紹介できません。重要なことは、錯視が生じるということから、私たちは外界そのものを見ているわけではないことが分かります。ただ、どのように、またなぜ錯視が生じるのかについては、分かっていないものも多いです。

 

中でも一番よく分からないのは、図形で書くと簡単な、幾何学的錯視なんですね。今ある説明の理論のうち、代表的なものを二つ紹介します。一つは奥行き説です。これは、人間は与えられた網膜像から奥行きを復元、構築しようと常に働いていると考えます。そして、錯視図形についても奥行きを復元しようとした結果、見かけが歪んでしまう、と考えます。この説の一つの根拠は、錯視図形を立体、つまり網膜像差をもつ図形で作ると錯視が消失するというものです。ミュラー・リヤー錯視やカニッツァの縮小錯視の場合にはそのような例も知られています。しかし、錯視が消失しない場合も報告されています。

 

幾何学的錯視には、色々な説明しづらい現象があることが知られています。ミュラー・リヤー錯視の例を挙げます。図形が三つ並んでいて、外側の図形は縦線分が長く見え、真ん中のものは少し短く見えます。つまり真ん中の要素の歪み方は、内側に歪んでいると考えることができます。では、このくの字型の図形(誘導図形)の内側のもののみを表示するとどのようになるでしょうか。良く見ると、真ん中の図形の下の端が、横の端よりやや下にくい込んで見えます。見えますか。しかし、これはミュラー・リヤー錯視から考えると少しおかしなことになっていて、ミュラー・リヤーの場合には上にずれて見えるはずでした。同じ刺激でありながら、図形配置がわずかに違うと、見かけが異なるということです。この、主線がない図形は、盛永矛盾図形と呼びます[45]

 

もう一つの説明は空間周波数説です。空間周波数については、アインシュタインの顔とマリリン・モンローの顔を合成した画像で説明しました。人間が処理できる空間周波数は限界もあり、また良く処理できる周波数もあるということでした。この考え方を錯視図形の空間周波数に適用します。すると、図形が、錯視が生じる方向に見えやすいことが分かります。

 

いまのところ、すべての錯視を統一的に説明できる理論はない、というのが実情です。

 

最後に、錯視の測り方について簡単に紹介しておきます。今までの例では錯視は見える/見えないというような質的な分類をしてきました。実際の実験では、錯視量を測定する、ということを行います。つまり、見かけを数値化したデータにするということです。一番分かりやすいのは調節法、つまり二つの図形をおいて、見えが同じになるように片方の図形を調節するというものです。同じに見えたときの調節量、例えばミュラー・リヤー図形の場合には長さですが、それが錯視がどの程度生じているかの目安になります。

 

他にもいろいろあり、調節はしないで二つのものを見せてどちらが長く見えるかを答えるような恒常法など、また錯視の強さを数字などで評価させる評定法、などです。少し前に流行したのは、錯視の量を手の動きの量で測るような方法です。これが面白かったのは、錯視を手でつかむように伸ばすと錯視は生じない、つまり手は騙されないというような実験結果が報告されました[46]。つまり、運動のための視覚情報処理と意識的な知覚のための視覚情報処理は経路が異なるという仮説が出されたのでした。これに関しては、他の研究者による追加実験が多く行われ、実際にはそれ程単純な話ではないというようなことが分かりつつあります。

 

今日の話をまとめるとスライド6のようになります。錯視は視覚情報処理システムの動作原理の解明に役立つだろうということ、また錯視は視覚属性ごとに数多く存在し、原因を説明する理論も数多く存在するということです。

 

13. 視覚情報処理I

 

今日を含めて最後の2回は、視覚情報処理の話をします。前の回は錯視、というものでした。物理的に同じ物が違って見えることで、具体的なものでした。しかし、これからの話は少し抽象的です。しかしなるべく具体例を挙げて考えていきます。簡単に言うと、見えることを「視覚情報処理」として考えます。

 

コメントカードの回答を最初に少し話します。11番、実生活で錯視が起きて困ることは何か、というコメントが多かったです。日常生活との関わりで言うと、交通場面では、速度や距離の錯覚が起こることが知られています。見落とし、見間違いは自動車を運転する場面では特に意識する必要があります。12番、錯視の発見が多くなされたのは19世紀の終わり頃です。特に、幾何学的錯視、直線や円などから構成される錯視はほとんどがその頃に発見されました。17番、錯視を測る時に、筋運動感覚で測ることができるかどうかということですが、近年の研究ではつかむ動作や指差し動作でも錯視が生じる場合があることが知られています。そのような研究が意味することは、あまり明快には言えないのですが、錯視を生じさせる視覚情報処理を理解するのは簡単ではないということです。また、錯視は個人差があるのに測れるのか、というコメントもありました。これは、個人差があるから測ることに意味がないというのは全く逆で、人ごとに違うから、測る価値があります。たとえば一円玉の大きさをすべて測ることに意味がありますか?

 

情報処理という言葉は堅苦しいですが、日本語の簡単な問いから始めたいと思います。「何が見えた?」という質問と、「どれぐらいに見えた?」という質問を考えてみましょう。何が違いますか。答え方が違います。最初の質問「何が見えた」については「はい/いいえ」で答えます。二番目の質問「どれぐらいに見えた」では「これぐらい/あれぐらい/それぐらい」などで答えます。情報処理というのは枠組みというか考え方を示していて、「見る」ということは、この2つの質問を常に常に細かく答え続けているような状態である、と考えます。

 

まず最初に、情報処理ということを説明します。情報処理の枠組みで考えるということは、入力、処理、判断の三つの段階を考えるということです。視覚の場合、入力は光ですね。2次元の模様でもOKで、それは光の模様ということです。私たちの脳が処理をして、その処理の結果として判断は「見えた」となるわけです。

 

これだと分かりにくいかもしれませんので、喩えで考えたいと思います。例えば「買い物」の情報処理を考えてみましょう。店で、色々な商品を見ます。そのうちのいくつかのものは買いたくなるかもしれませんし、全然欲しくないものもあるでしょう。そして、ある基準を超えれば、「買う」と判断するわけです。これが買い物を情報処理的に考えるということです。入力は「欲しい度合い」で、判断は「購入」となるわけです。他には、「笑い」の情報処理を考えることができます。お笑いでも面白いもの、面白くないものありますよね。そのうち、笑いの度合いがある程度大きいものであれば、実際に声を出して笑います。この場合、入力は面白さの度合い、判断は「笑い」となります。これは、ある種の判断と考えることができるわけです。

 

このような情報処理で共通しているのは、処理段階で、判断するものの強さを内的な基準で判別していることです。この基準は、検出閾と呼びます。

 

何かの見かけを測定するためには、入力側の情報もきちんと定義しておく必要があります。入力情報をきちんとして、測定を行う。これは、専門的に言えば、入力刺激と観察条件を統制する、ということです。統制する、というのは、余計な要因が入ってこないようにして、得られる結果のばらつきをなるべく小さくするという目的があります。これは物理や化学の実験と同じ精神です。

 

まず最初の基本的な事柄の一つに、呈示した視覚刺激が見えるか見えないかがあります。例えば、私たちは眼を開けていると何かが見えています。その最低限の必要条件は、視覚刺激が、十分な強さを持っているかどうかです。月のない夜に、例えばこの教室を考えてみましょう。恐らく、そこに何があるかは簡単には分かりませんよね。それはどうしてかというと、物体が十分な光を反射できないからです。このような事態は、スライド3に示されるグラフで表現することができます。

 

スライド3のグラフは仮想的な実験の結果です。横軸が光の強さで、縦軸が「光が見えた割合」を示しています。刺激が弱い時は、横軸の左の方の点になります。その時には刺激が見えないので、下の方の場所に位置します。そして、同じものが明るい照明のもとにあるとします。その場合には物体は多くの光を反射しますので、グラフの横軸の右の方に位置することになります。その時には「見えた」反応が得られますから、グラフの上の方に位置することになります。そして、このような実験を照明の強さを変えて繰り返すと、このようなS字に似た形の関数になります。このグラフの特徴は、あるところを境に、見えた割合が0から1に急激に変化します。これはとても合理的で、もしこのような課題を観察者が真面目にこなせば、ある光の強さを境に見える/見えないが決まっていると考えることは合理的であると思います。このグラフでSの位置が左に寄っていればいるだけ、感覚が鋭いということになるわけです。

 

この、見えるか見えないかの境目のときの刺激の強さの値は、検出閾あるいは刺激閾と呼ばれます(detection/stimulus/absolute threshold)。言い換えると、閾は、刺激の見えによって決まる物理的な値です。具体的には、このS字型のカーブのちょうど中央のところの刺激の強さを、刺激閾と定義する場合が多いです。

 

検出閾はこのような実験で測定することができますが、問題がないわけでもない。例えば実験参加者は、自分の視覚能力が優れているという印象を与えようとして、刺激が出てなくても、刺激が見えた、と答えるかもしれない。検出閾のこのような実験では、このようなズルいやり方で書くと閾値の値が下がり、より感覚が鋭いということになってしまいます。

 

そういうズルの人でも、能力を測るやり方があります。簡単に言えば、刺激が実際に呈示されなかったときでも、「見えた」とどれくらい反応するかを調べる方法です。それが次に説明する信号検出理論です[47]。信号検出理論とは、刺激が処理される時に曖昧さを仮定して、人間の情報処理能力を定量化しようとする理論的な枠組みです。signal detection theoryの日本語訳です。ここでいう信号とは、知りたい事柄の手がかりです。交通道路の信号は、青が「進め」の信号で赤が「止まれ」の信号となっていますよね。信号機が、霧とか雨の中にあって、見づらい事態を想像して下さい。その場合、霧によって見誤りが生じます。ここで、間違い方が二種類あることに注目します。一つは青信号なのに、青ではないと判断してしまう場合です。これを、専門用語でミス(miss)と言います。もう一つは、青信号がついていないのに、青信号であると判断してしまう場合です。これを、専門用語で誤警報(false alarm)と言います。正解も二種類ありますね。一つは、実際に青信号が付いているときに青だと判断できる場合です。これは、ヒット(hit)と言います。もう一つは、青信号がついていない時に青信号ではないと判断できる場合です。これは正棄却(correct rejection)と呼ばれます。

 

信号検出理論では、実際に上記の間違いが何回起こるかを数えて、その割合をもとに、観察者が信号をどの程度正しく検出できるかを計算します。具体的には、ヒット率と誤警報(フォルス・アラーム)率を用いて計算します。ヒット率とミス率を足すと1で、誤警報率と正棄却率を足すと1になり、必要な情報はこの二つで十分です。この二つの値から、検出能力を示す指標の値、d´(ディー・プライム)を計算します。信号検出理論では、判断基準cと呼ばれるバイアス、反応の偏りを表す指標も計算できます。

 

d´ = z(ヒット率)- z(誤警報率)

c = -[z(ヒット率)+ z(誤警報率))/2

 

z( )とは、累積正規分布の逆関数で、確率や割合の値を入力します。エクセルではnormsinv( )で計算でき、統計ソフトRではqnorm( )で計算できます。例えば、ヒット率が0.9, 誤警報率が0.1の観察者Aがいるとします。また、別の観察者Bはヒット率が0.99、誤警報率が0.2であるとします。この二人は、どちらが信号を良く見分ける能力があると考えられるでしょうか。d´は値が大きいほど、見分ける能力が高いということになります。cは、値が大きいほどヒット率は小さく、いわば「控えめな」判断をする人であるとみなせます。

 

検出感度d´については、

 

観察者A: z(0.9) - z(0.1) = 1.28 - (-1.28) ≈ 2.6

観察者B: z(0.99) - z(0.2) = 2.32 - (-0.84) ≈ 3.2

 

となり、観察者Bの方が青信号を見分ける能力が高いことが分かります。

 

判断基準cについては、

観察者A: -[z(0.9) + z(0.1)] = -[1.28 + (-1.28)]/2 = 0

観察者B: z(0.99) - z(0.2) =  -[2.32 + (-0.84)]/2 ≈ -0.8

となり、観察者Bの方が青信号であると判断する割合が多いことが分かります。

 

この信号検出理論による分析は、視覚以外にも幅広く用いられています。この分析は、信号を視覚以外で考えることができて、実際には聴覚や、記憶能力を定量化する際にも良く用いられています。

 

そして今日の後半の話に入ります。2つ目の質問「どれぐらいに見えるか?」を思い出してください。

 

検出閾と似ていますが異なる概念に、弁別閾というものがあります。スライド5を見て下さい。弁別という言葉は、複数のものを区別するという意味ですよね。弁別閾(difference/discrimination threshold)が表す概念もそれに関係していて、二つのものを区別するために必要な最小の差異、違いのことです。例えば、白と黒は明白に区別できますが、薄い灰色と濃い灰色の区別はそれほど明白ではありません。二つの対象の明るさをより近づけていけば、区別が付かなくなりそうです。

 

弁別閾に関しては、良く知られている重要な特性があります。それは、弁別閾というのは刺激強度によって変化するということです。これは、ドット模様を使って直感的に考えることができます。刺激強度はここでは2個のドット、刺激の差をΔIとしましょう。この場合、スライド5の左下の図で明らかなように、2個と3個のドットは明白に区別できます。では、刺激の強度が大きい場合、具体的には刺激強度が16の場合を考えてみます。その際に、同じく差を1とします。すると、この場合には差を見分けるのが困難になります。つまり、弁別閾は1以上になっていると考えられます。

 

以上のことを一般化して立てられたのが、ウェーバーの法則です[48]。一般的に言えば、弁別閾を刺激強度で割ったものは一定になるということです。記号はΔというのが差分(ギリシア文字)、differenceの気分を示していて、Iintensityのアイです。Kconstant(ドイツ語はkonstant)に近いと思って下さい。記号自体には対して意味はなくて、式が意味することの雰囲気をつかんでください。たとえば、K=0.1という法則が、何かについて成り立つとしましょう。そうすると、I=2ΔI=1の場合には先ほどの例では1/2=0.5となり、Kより大きくなっています。従って、Kの値より大きいので閾値より大きく、違いが見分けられることを説明できます。ではI=16の場合はどうでしょうか。1/16=0.0625となり、閾値より下ということになっています。つまり、I=16の場合には、違いが1では区別できないということを、説明できるわけです。ウェーバーの法則は、ウェーバー・フェヒナーの法則と呼ぶ場合もあります。ウェーバー(E. H. Weber)は19世紀中頃のドイツの生理学者です。フェヒナー(G. T. Fechner)は心理物理学という、心理学の基礎を作った19世紀中頃のドイツの物理学者です。フェヒナーの法則は、E = klogI+Cという式で表されます。

 

これをさらに一般化して、物理量と、知覚された量(感覚量)にはどのような基本的な対応関係があるのかを提案した人がいます。それは20世紀のアメリカの心理学者のスティーブンスです。

 

スティーブンスの法則は、PC画面の明るさの調節にも用いられています。例えば、私たちがPCで使うような黒から白までは、見かけ上は変化の割合が一定になっている気がしますよね。つまり、黒から白まで、見かけ上は徐々に変化します。では、これは、物理的な明るさもまた徐々に変化しているかというと、そうではありません。物理的な明るさの単位は、輝度でした。輝度とPC上の明るさの値をプロットしたグラフは、このような2次関数を横倒しにした形になっています。

 

スティーブンスの法則とは、このような物理量と感覚量の関係は、一般的にはこのようなゆるやかな曲線関数になることを指摘したものです。関数はn次関数となると提案されています。正確に言えば、この関数型は冪関数(べきかんすう)と呼ばれます。感覚量をEとし、Iを物理的強度、αkは定数です。スティーブンスの法則は、一般的にはE=kIαで表すことができます。

 

次週は、他の方法論を含めて、視覚情報処理を明らかにする方法論と、視覚的注意という話題を話したいと思っています。

 

14. 視覚情報処理II

 

最初に、前回の授業のコメントカードの回答です。文字が多い方のA3のプリントを出してください。多かった質問、1です。閾値は個人差もあるし曖昧なのでは?というコメントが多かったです。ばらつきは、必ず生じます。科学では、便利な言い方があって、そのような不確実性は、確からしさを数値で表す確率を用いて表現します。3.の質問、感覚量の数量化はどのような場面で役に立つか、というコメントも多かったです。感覚量の定量化は、一般的には表示装置を設計する場合には必ず考慮しなくてはならない要因です。視覚以外でも、例えば音量のつまみ、ボリュームの調節があります。音の大きさは、つまみを回すと滑らかに音の大きさが増加しているように感じますが、実際には光などと同じように、物理的な振動の量と知覚的な音の大きさは非線形な関係があります。

 

信号検出理論については、同じプリントの右側にまとめています。信号検出理論では、外から来る情報を信号とみなし、それを受け取る側の能力を定量化します。具体的には、信号を正しく受け取ったかどうかに関する割合を算出し、それに応じて検出感度(d´ディー・プライム)を算出する、という枠組みでした。前の回の例では、青信号を見間違うということを話しました。そんなことがあり得るのか、という質問がありました。あり得ます、例えば信号が霧で霞んで分かりにくいときなど、またとても慌てているときや、ぼんやりしているときなどを考えます。

 

ディープライムは、このように計算します。一般的な定義はd´=z(ヒット率)-z(誤警報率) です。ヒット率は、信号が実際に呈示されたときに信号があると答えた割合です。誤警報率は、信号が呈示されていないときに信号があると判断した割合です。z( )は何かというと、このようなS字型の関数、正式名称は累積標準正規分布の逆関数です。前回に挙げた例をそのままプリントに記載しています。

 

このような、信号検出理論を含めた感覚能力の定量化がどのような研究に役立つのか、というコメントもがありました。その例として、例えば運動視の講義の時に、自閉症児の知覚能力は運動視だけが阻害される例を紹介しました。第9回のスライド11がそれです。この実験では、生物学的運動の知覚能力を測定する場合にはd'を用いて、障害を持つ児童と持たない児童の知覚能力を比較しています。そして形の知覚能力を比較する場合には、角度の検出閾を測定しています。

 

今日の内容は視覚情報処理の2回目で、今回が最終回ですね。言い忘れていましたが視覚情報処理はvisual information processingの日本語訳です。processingは、processから派生していて、何かを加工・処理する時の過程、というような意味です。プロセスチーズのプロセスと同じですね。概念図をスライド2に示します。その中で、視覚情報処理の終わりの方で働くと考えられる重要な機能、視覚的注意について解説します。注意という言葉は日常生活でも使いますね。「良く注意しなさい」、とか「注意を惹く」、という言葉を使います。心理学では、その「注意」の意味をいくつかに限定して、専門用語として用います。

 

心理学で注意ということを考える場合には2種類の重要な区別をします。一つは、ボトムアップ的注意と呼ばれるもので、もう一つはトップダウン的な注意です。ボトムアップ/トップダウンという言葉は2目の講義の時にも説明しました(スライド14)。ボトムアップ的注意というのは簡単に言えば、特定の目立つ入力情報があって、そちらに自動的に注意を惹き付けられることを言います。それに対しトップダウン的注意とは、意図的に何かを良く見たり、解釈しようとする働きのことです。

 

心理学でいう注意の基本的な働きは、入力情報の一部を選択することです。例えば、眼を動かさずに、視野の一部に注意を払うということができます。誰か気になる人がいて、そちらの方に視線を向けずに、何をしているか知ることができます。このような意味で注意という言葉を使う場合には、「選択的注意(selective attention)」という言葉の使い方をします。注意は、視覚に限らず聴覚的なことに関しても注意は働くと考えます。例えば、大きな音がしたり、自分の名前を聞いたらそちらに意識が向きますよね。

 

視覚に限った注意は、視覚的注意(visual attention)と呼ばれます。注意の選択の機能のたとえとしてよく使われるものに、スポットライトがあります。スポットライトって知ってますよね、ステージで特定の人に当たるようにするあのライトです。済みませんが、後ろの電気に近い人、電気を消してもらえますか。ここに小さいライトがあって、このように光を当てたところが良く見えるようになります。注意を向けるということは、私たちの情報処理過程の中で、入力情報のなかでこのように特定の部分に光を当てるようなものだ、というのが注意のスポットライトの比喩です。

 

ボトムアップ的な注意機能を明らかにするための代表的な研究方法に、視覚探索課題があります[49]。視覚探索課題というのは、一度にたくさんの図形を呈示して、見つけるのにかかる時間を測定するというものです。判断は多くはターゲットがあるかないかの検出課題であることが多いです。見つけるべき図形を目標刺激(target)、それ以外を妨害刺激(distractor)と言います。図形のうちターゲットはあらかじめ決められていたり、特に指定せず一つだけ違うものを探す、という課題があります。

 

実験の論理は以下のようになります。もし、探すべき図形が注意を惹くならば、判断に要する反応時間は短く、注意を惹かないならば見つけるのにかかる時間は長くなるはずです。つまり、反応が速いならば、ボトムアップ的な注意を惹き付ける(誘導する)特徴をターゲットは持っているということになります。色々な実験によって、自動的に注意を惹き付ける特徴には、色や、線の傾き、運動などが知られています。スライド7に一覧を示します。私は大学院の時に、透明視による情報が注意を惹くかどうかを検討していたことがあります。透明感の知覚はこの講義の第7回目の「単眼性奥行き手がかり」で説明しました。スライド8がその視覚刺激の例です[50]

 

以上が、ボトムアップ的な注意の例でした。次にトップダウン的な注意について話します。注意は、他にもいろいろな役割を果たすことが知られています。その一つが、注意による見かけの変化です。スライド9の、三つの重なった円盤を眺めて下さい[51]。そして、3つのいずれかの円盤に注意を向けます。すると、その円盤の色が濃く感じられませんか?眼を動かさずに、他の円盤に注意を向けると今度はその円盤の色が濃く感じられます。これは、透明感を感じる図形で良く生じます。

 

スライド2では、私たちの意識に上るのは三次元表象であると解説しています。この表象とは、心の中にある外界の対応物と考えます。重要な問題は、この視覚表象というのは私たちが注意を向けなくても、保持しているのかどうか、という問題があります。イメージとして言えば、注意というものが、入力情報を必要に応じてピックアップするという感じです。その際、視覚表象(記憶)というのは注意を向けていなくても保持しているかどうか、それは主観的にはなかなか分かりません。このような問題を調べるために考えられたのが、変化検出課題です[52]。一番典型的にはこのように、類似した二枚の視覚刺激を呈示して、一カ所だけ変化させてグレーの画面を挟んで呈示します。グレーの画面が入ると全体的に点滅するような印象となります。ちなみに、グレーの画面がなければ変化は容易に検出できます。これは、運動視による働きです。

 

このようにして、変化が分かるまでにかかる時間を測定します。すると、大抵の場合には変化が見つかるまで長い時間、平均して速い場合でも5秒以上かかるという結果が報告されています。この、変化があるのに見落としを生じることは、「変化の見落とし/変化盲(change blindness)」と呼ばれます。結果の解釈としては、このように考えます。もし私たちが視覚的な記憶の中に画面の色々な事物を保持できるのならば、それは一カ所変化しているならば変化を見つけるのにかかる時間はそれほどかからないはずです。しかし、実際に変化を見つけるのにかかる時間は長い時間がかかります。つまり、変化を見つけるためには、記憶している表象と入力の情報を常に比較し続ける必要があるわけです。

 

この変化検出課題は1997年以降、心理学の世界では非常に流行しました。今もその余波は残っています。火付け役はこのRensinkの研究です。流行した理由は、一見して面白いことと、結果の意味するところの重要性です。変化検出課題は一般的にとても困難であることを思い出して下さい。それが学問的に意味するところは、私たちが保持している視覚的記憶は、とても限られた容量しかない、ということです。具体的に容量は、多くて4個の物体である、という推定もなされています[53]

 

今日のまとめと、この授業のまとめの一言メッセージを、スライド12に示します。今日の内容は、視覚的注意には様々な役割があるということです。授業全体の話をまとめると、錯視などの視覚現象の背後には、情報処理機構、情報処理の仕組みがあるということになります。

 

 



[1] 平成22年度後学期九州大学文学部授業科目の講義内容に基づきますが、内容は完全には対応していません。主に講義の予習・復習の利用を想定しています。コメントやお気づきの点は、電子メールなどでお知らせ頂けるとありがたいです(hmitsudo@lit.kyushu-u.ac.jp)。

[2] http://wiredvision.jp/blog/autopia/200706/20070620125247.html

[3] 大山正(1994)色彩心理学入門 中央公論社

[4] 鹿取廣人・杉本敏夫・鳥居修晃 () (2008). 心理学第3版 東京大学出版会

[5] 苧阪直行 (). (2001). 実験心理学の誕生と展開 京都大学学術出版会

[6] E. E. スミス他 内田一成(監訳)(2005). ヒルガードの心理学 ブレーン出版

[7] 日本視覚学会 () (2000). 視覚情報処理ハンドブック 朝倉書店

[8] R. L. グレゴリー 近藤倫明・三浦佳世・中溝幸夫(訳)(2001). 脳と視覚 ブレーン出版

[9] 大山正・今井省吾・和気典二 () (1994). 新編感覚・知覚心理学ハンドブック 誠信書房

[10] 大山正 (1994). 色彩心理学入門 中央公論社

[11] Snowden, R., Thompson, P., & Troscianko, T. (2006). Basic Vision. Oxford University Press.

[12] 大山正 (1994). 色彩心理学入門 中央公論社

[13] Gegenfurtner, K. R., & Sharpe, L. T. (Eds.). Color Vision. Cambridge University Press.

[14] Berlin, B., & Kay, P. (1969). Basic color terms. University of California Press.

[15] Valdez, P., & Mehrabian, A. (1994). Effects of color on emotions. Journal of Experimental Psychology: General, 123, 394-409.

[16] Hill, R. A., & Barton, R. A. (2005). Red enhances human performance in contests. Nature, 435, 293.

[17] Rowe, C., Harris, J. M., & Roberts, S. C. (2005). Sporting contests: Seeing red? Putting sportswear in context. Nature, 437, E10.

[18] Palmer, S. E. (1999). Vision science: photons to phenomenology. The MIT Press.

[19] Kanizsa, G. (1979). Organization in vision. Praeger.G. カニッツァ 1985 視覚の文法 野口薫(監訳) サイエンス社)

[20] 大山正・今井省吾・和気典二 () (1994). 新編感覚・知覚心理学ハンドブック 誠信書房

[21] Lindauer, M. S., & Reukauf, L. C. (1971). Introversion-extraversion and figure-ground perception. Journal of Personality and Social Psychology, 19, 107-113.

[22] Thompton, P. (1979). Margaret Thatcher: a new illusion. Perception, 9, 483-484.

[23] 坂井克之 (2008). 心の脳科学 中央公論社

[24] Wolfe, J. M., et al. (2005). Sensation and perception. Sinauer Associates.

[25] http://cvcl.mit.edu/hybrid_gallery/monroe_einstein.html

[26] Palmer, S. E. (1999). Vision science: photons to phenomenology. The MIT Press.

[27] Kanizsa, G. (1979). Organization in vision. Praeger.G. カニッツァ 1985 視覚の文法 野口薫(監訳) サイエンス社)

[28] Kanizsa, G. (1979). Organization in vision. Praeger.G. カニッツァ 1985 視覚の文法 野口薫(監訳) サイエンス社)

[29] 安藤清志 他 (1994). キーワードコレクション心理学 新陽社

[30] http://takeshi-website.hp.infoseek.co.jp/art-history/art-history.html

[31] 大山正・今井省吾・和気典二 () (1994). 新編感覚・知覚心理学ハンドブック 誠信書房

[32] 日本視覚学会 () (2000). 視覚情報処理ハンドブック 朝倉書店

[33] 日本視覚学会 () (2000). 視覚情報処理ハンドブック 朝倉書店

[34] http://www.ritsumei.ac.jp/~akitaoka/

[35]日本視覚学会 () (2000). 視覚情報処理ハンドブック 朝倉書店

[36] http://www.procreo.jp/labo/labo13.html

[37] Blake, R., Turner, L. M., Smoski, M. J., Pozdol, S. L., & Stone, W. L. (2003). Visual recognition of biological motion is impaired in children with autism. Psychological Science, 14, 151-157.

[38] Palmer, S. E. (1999). Vision science: photons to phenomenology. The MIT Press.

[39] Ott, M. (2001). Chameleons have independent eye movements but synchronise both eyes during saccadic prey tracking. Experimental Brain Research, 139, 173-179.

[40] 苧阪良二・中溝幸夫・古賀一男() (1993). 眼球運動の実験心理学 名古屋大学出版会

[41] Pinna, B., Brelstaff, G., & Spillmann, L. (2001). Surface color from boundaries: a new ‘watercolor’ illusion. Vision Research, 41, 2669-2676.

[42] 後藤倬男・田中平八 (編集) (2005). 錯視の科学ハンドブック 東京大学出版会

[43] Pinna, B., & Brelstaff, G. J. (2000). A new visual illusion of relative motion. Vision Research, 40, 2091-2096.

[44] Martinez-Conde, S., Macknik, S. L., Troncoso, X. G., & Dyar, T. A. (2006). Microsaccades counteract visual fading during fixation. Neuron, 49, 297-305.

[45] 大山正・今井省吾・和気典二 () (1994). 新編感覚・知覚心理学ハンドブック 誠信書房

[46] Aglioti, S., DeSouza, J. F., & Goodale, M. A. (1995). Size-contrast illusions deceive the eye but not the hand. Current Biology, 5, 679-685.

[47] G. A. ゲシャイダー, 宮岡徹・金子利佳・倉片憲治・芝崎朱美 () (2000). 心理物理学 方法・理論・応用 北大路書房

[48] 大山正 (1994). 色彩心理学入門 中央公論社

[49] Wolfe, J. M., et al. (2005). Sensation and perception. Sinauer Associates.

[50] Mitsudo, H. (2003). Information regarding structure and lightness based on phenomenal transparency influences the efficiency of visual search. Perception, 32, 53-66.

[51] Tse, P. U. (2005). Voluntary attention modulates the brightness of overlapping transparent surfaces. Vision Research, 45, 1095-1098.

[52] Rensink, R. A., O'Regan, J. K., & Clark, J. J. (1997). To see or not to see: the need for attention to perceive changes in scenes. Psychological Science, 8, 368-373.

[53] Luck, S. J., & Vogel, E. K. (1997). The capacity of visual working memory for features and conjunctions. Nature, 390, 279-281.