S_1_10_fixed

Мотивация в американских теориях научения

Первые бихевиористы, особенно Уотсон, считали объяснения поведения с точки зрения инстинктов бесплодными и были крайне нетерпимы по отношению к распространенному в тогдашней психологии интроспективному методу, который давал противоречивые результаты и был бесполезен при работе с детьми и животными. Метод Павлова произвел сильное впечатление на Уотсона и сторонников теорий научения своей объективностью и экспериментальной точностью. Павлов объяснял поведение с позиций теории научения, допуская существование безусловных рефлексов в минимальном количестве и описывая исключитель но наблюдаемое поведение, а также и его физиологические механизмы.

Теория научения, выдвинутая Газри в 1935 г., была наиболее близкой тому, как Уотсон воспринял систему Павлова. Эта теория провозглашала простую связь между реакцией, понимаемой как деятельность или секреция желез, и любым стимулом или их комбинацией, как основной закон научения. Мотивация при этом была совершенно не важна. Реакции на различные сигналы, внутренние или внешние, у голодного животного отличаются от реакций сытого животного. Вознаграждение совершенствует поведение не в качестве должного ответа, а потому что оно завершает данную серию действий, и, таким образом, предохраняет связь между собой и любой последней деятельностью животного от разрушительного влияния других действий. С этой точки зрения, «бесцельное поведение» не представляет трудности для объяснения.

Теория Халла — самая влиятельная теория научения в англоязычных странах — разделяла предположения Торндайка, что вознаграждение важно при научении. Типичное научение кошек методом «проб и ошибок» проявилось в «проблемных ящиках» Торндайка, представляющих собой выбор образца для научения в соответствии с методикой проведения тренировки по Павлову. Сначала кошки двигались наугад, случайно нажимая рычаг, который открывал выход из клетки к пище и свободе. Нажатие на рычаг после ряда успешных попыток постепенно совершенствовалось. Торндайк описывает это, допуская, что связи между стимулом в этом «проблемном ящике» и реакцией усиливались благодаря вознаграждению.

Тщательно разработанная гипотеза Халла, которая основана на экспериментах, поддающихся контролю, была гораздо более продуманной и точной. Она предполагала, что вознаграждение необходимо для научения. Поведение мотивируется первичными побуждениями, т. е. физиологическими потребностями, такими, например, как голод, вызывающими сильные внутренние стимулы. Вознаграждение ведет к редукции (ослаблению) побуждения, вызванного физиологическими потребностями и соответствующими стимулами. Типовые эксперименты состояли в том, что голодные крысы бегали по клеткам, построенным в форме лабиринтов, которые заканчивались тупиками либо камерами, содержащими пищу. Чувство голода, измеряемое временем, в течение которого крыса была лишена пищи, и вознаграждение, в виде получения пищи, в конце лабиринта имеют существенное значение в эксперименте. Пища ослабляет побуждение (чувство голода), и, таким образом, усиливает связь между сигналами (их расположение, яркость и т. д.) нужного пути и реакцией в виде бега, которая является способом получения пищи. Какого-то изначально совершенно безобидного сигнала, если он сопровождается болью, было достаточно, чтобы придумать новый способ избегать его.

Таким образом можно изучить основную массу «вторичных» побуждений. Похвала, деньги или игрушки — вторичные побуждения, которые стали эффективными после научения, основанного на редукции первичных побуждений. Ребенок учится подражать своим родителям и более старшим детям, сравнивая свое поведение с поведением более старших и сильных, что приводит его к успеху гораздо чаще, чем раньше. Длительный период детства человека, во время которого его потребности удовлетворяются матерью или близкими людьми, рождает вторичные мотивы, которые делают более эффективными вербальные и социальные стимулы. Сначала необязательно поощрять ребенка всякий раз, когда он занят какой-либо деятельностью. Достаточно и того, что есть какие-то внешние знаки или внутренние стимулы, связанные изначально с ослаблением побуждения. Стимулы, производимые собственными реакциями животных, могут занимать промежуточное положение, действуя как сигналы к получению вознаграждения. По этой теории, такое поведение, как игра, т. е. активность без видимого вознаграждения, объясняется как поведение, возобновленное вторичными сигналами, которые приобретены в результате научения и символизируют вознаграждение, вызванное промежуточными стимулами, производимыми собственными реакциями животных.

В своей теории Скиннер сформулировал законы, описывающие различия стимулов, реакций и вознаграждений (подкреплений), и их отличие от механизмов, с помощью которых проходило научение. Он разграничивал реакции, вызываемые стимулами («респондентное» поведение), и «оперантное» поведение, которое производится самим организмом, но формируется избирательным подкреплением. Скиннер показал, что один из факторов, который способствует формированию навыка ходьбы, — это тип и режим подкрепления при обучении, особенно, если оно подается через неодинаковые интервалы времени (что трудно предугадать учащемуся ходить ребенку).

Любая птица, обученная ударять по клавише, после чего на кажый клевок появляется пища, быстро остановится, если пищевого подкрепления больше не последует. Однако, если пища подавалась через неравные промежутки времени, птица продолжает клевки гораздо дольше. Это навело на мысль о формировании поведения в детстве. Родители не могут подкреплять (похвала, вознаграждение) любое случайное поведение. Видимо, «невознаграждаемое» поведение может быть просто поведением, которое ранее поощрялось нерегулярно. С другой стороны, поощрения, даваемые регулярно через короткие промежутки времени безотносительно к текущему поведению, вызывают странные и бессмысленные реакции. Так, голодные птицы получали кусочки пищи регулярно через короткие промежутки времени безотносительно к тому, что они делали. Получалось, что любое действие птицы во время появления пищи выступало как бы в качестве условного раздражителя к ее появлению. К окончанию эксперимента одни птицы наклоняли, другие поднимали головы, ожидая пока поднос с пищей не появится вновь, и это продолжалось непрерывно более 10 000 раз до того, как реакция исчезнет. Вероятно, некоторые игры могли развиваться и этим путем.

Содержание