>> 295
簡単にいうと、p36,l13の通り、「2試行目で早く脱出できたのはたまたまだったから」だと思います。
箱の扉が開く条件をペダル踏み行動と仮定します。グラフから、1度目はなかなか踏まず、2度目はかなり早い段階でペダルを踏んだことがわかります。しかし、この段階ではまだ「ペダルを踏むと扉が開く」と学習したわけではなく、偶然早い段階で踏んだに過ぎないのです。そのため、3度目では2度目よりも脱出に時間がかかっています。5~12度目を見ると若干の上下はあるものの大幅に時間が短縮しています。これは、たまたまペダルを踏むことを繰り返して「ペダルを踏むと扉が開く」という随伴性を学習している様子です。
三項随伴性に当てはめると、「問題箱の中にいる(先行刺激)」‐「ペダルを踏む(行動)」‐「扉が開く(結果・後続刺激)」となります。図2.1のグラフは、扉が開くことが強化子となってペダル踏み行動の自発頻度が上昇していく様子を脱出時間の短縮に置き換えて示しているグラフです。
通報 ...
専門的には「平均への回帰」と言って、全般的に上昇あるいは下降傾向でも、ミクロに見ると逆行することがあります。「ジグザク変化するが、真実はその中間にあり」のが平均への回帰です。スポーツ選手の成績なんかも上下しますよね。平均して3割バッターだとしても。
しかしこのグラフによれば、学習というものは離散的でなく、連続的なものだということですね。つまり、どこかから完全にできるようになるというものでなく、できるとできないの比率が変わっていくというものだということです。これが試行錯誤の姿なのでしょう。
受講生同士の質疑応答、いいですね。今後も続けてください。
4点差し上げます。