Режим подкрепления
Правило, описывающее условия получения подкрепления при определенном поведении.
Крайними вариантами режима подкреплений служат постоянное подкрепление (continuous reinforcement, CRF), когда подкрепляется каждое проявление поведения и гашение, когда все подкрепления отменяются.
Промежуточным вариантом являются различные варианты режимов периодического подкрепления (intermittent schedules of reinforcement), при которых подкрепляются не все, лишь некоторые выбранные реакции. Благодаря этим режимам обеспечивается устойчивость сформированных видов поведения. Базовые режимы периодического подкрепления:
(1) Режим подкрепления с постоянной пропорцией (fixed ratio, FR) — режим, при котором для получения подкрепления требуется завершение нескольких реакций. Например, в режиме FR 4 подкрепление происходит после каждой четвертой правильной (или целевой) реакции.
(2) Режим подкрепления с переменной пропорцией (variable ratio, VR) — режим, при котором для получения подкрепления требуется постоянно меняющееся число реакций. Количественной характеристикой данного режима служит среднее число реакций в пропорции подкрепления. Например, при режиме VR 10 подкрепление предоставляют в среднем после 10 реакций, но это фактическое число реакций в каждой подкрепляемой серии может варьировать от 1 до 30 и больше.
(3) Режим подкрепления с постоянным интервалом (fixed interval, FI) — режим, при котором подкрепляют первую реакцию по истечении постоянного промежутка времени (например, при режиме FI 3 мин. подкрепляется первая реакция по истечении трех минут).
(4) Режим подкрепления с переменным интервалом (variable interval, VI) — режим, при котором подкрепляют первую правильную реакцию по истечении меняющихся промежутков времени. Для количественной характеристики данного режима используют усредненный интервал. Так, в режиме VI 10 мин средний интервал между подкреплением и возможностью последующего подкрепления составляет 10 мин, но фактические интервалы могут варьировать от < 30 с до > 25 мин.
(5) Интервальный режим с ограниченным временем доступности подкрепления (interval schedules with a limited hold) — интервальный режим подкрепления, при котором последнее оказывается доступным на протяжении ограниченного времени по истечении заданного постоянного или переменного интервала. Если в течение этого интервала реакции нет, возможность получить подкрепление утрачивается и начинается новый интервал. Например, в режиме FI 5 мин. с ограничением в 30 с. подкрепляется первая правильная реакция, возникшая на протяжении 30 с по истечении пятиминутного интервала. Если в течение 30 с. реакции нет, начинается новый цикл.
Варианты базовых режимов периодического подкрепления:
(1) Дифференцированное подкрепление высокой частоты реакций (differential reinforcement of high rates, DRH) — режим, при котором подкрепление предоставляется в конце заданного интервала, если частота реакций выше заданного критерия.
(2) Дифференцированное подкрепление низкой частоты реакций (differential reinforcement of low rates, DRL) — режим, при котором подкрепление предоставляется в конце заданного интервала, если частота реакций выше заданного критерия, то есть либо а) время между реакциями не меньше заданного критерия, либо б) число реакций в течение заданного интервала не больше заданного критерия. Этот режим используют, если частота неких реакций чрезмерна, но все же эти реакции должны сохраниться в поведенческом репертуаре.
(3) Дифференцированное подкрепление снижения частоты реакций (differential reinforcement of diminishing rates, DRD) — режим подкрепления, при котором постепенно и в зависимости от показываемых результатов снижают пороговый критерий числа реакций в интервале (минимальное количество реакций в заданном интервале, превышение которого приводит к лишению подкрепления), например менее 5 реакций за 5 мин, 4 реакций за 5 мин, 3 реакций за 5 мин и т. д.
(4) Режим подкрепления с прогрессирующим прореживанием (progressive schedule of reinforcement) — режим подкрепления, при котором последовательно снижают частоту возможности получения подкрепления вне зависимости от поведения участника. Как при пропорциональных, так и при интервальных режимах прореживание можно осуществлять в арифметической или в геометрической прогрессии.
Помимо перечисленных выше базовых режимов и их вариантов существуют также комплексный режим подкрепления и его варианты.
Комплексный режим подкрепления (compound schedule) — режим подкрепления, включающий элементы двух или нескольких базовых режимов — постоянного подкрепления, четырех режимов периодического подкрепления, дифференцированного подкрепления высокой и низкой частоты реакций, а также гашения. Элементы базовых режимов могут возникать последовательно или одновременно, при наличии либо отсутствии дискриминативных стимулов, как отдельные поведенческие последовательности или в составе новой последовательности, сформированной посредством сочетания разных элементов. Закон пропорциональности частот реакций и под креплений (matching /aw) — распределение реакций при конкурентных режимах, при котором частоты реакций соответствуют частотам подкрепления в каждом из этих режимов.
(1) Конкурентный режим подкрепления (concurrent schedule) — режим подкрепления, при котором две или несколько поведенческих последовательностей действуют независимо и одновременно для двух или нескольких видов поведения.
(2) Множественный режим подкрепления (multiple schedule) — комплексный режим подкрепления, при котором чередуются два или более базовых режима, причем в большинстве случаев случайным образом. Базовые режимы реализуются последовательно и независимо. Для каждого режима имеется свой дискриминативный стимул. Подкрепление предоставляется при выполнении критерия для каждого действующего в данный момент режима.
(3) Цепной режим подкрепления (chained schedule) — режим, в котором для подкрепления должна быть выполнена строго определенная последовательность двух или нескольких базовых режимов, характеризующихся разными дискриминативными стимулами.
(4) Смешанный режим подкрепления (mixed schedule) — комплексный режим подкрепления, состоящий из двух или более базовых режимов, чередующихся независимо, обычно случайным образом. Дискриминативных стимулов для отдельных базовых режимов нет, подкрепление предоставляется при выполнении критерия для каждого действующего в данный момент режима.
(5) Тандемный режим подкрепления (tandem schedule) — режим подкрепления, почти идентичный цепному, но отличающийся отсутствием дискриминативных стимулов для отдельных элементов цепочки.
(6) Альтернативный режим подкрепления (alternative schedule) — режим, при котором подкрепление предоставляется, когда удовлетворяются требования либо пропорционального, либо интервального режима (базовых режимов, представляющих собой альтернативы), вне зависимости от того, какое из них удовлетворяется первым.
(7) Конъюнктивный режим подкрепления (conjunctive schedule)- режим подкрепления, при котором подкрепляется выполнение требований двух базовых режимов (пропорционального и интервального), а не только одного из них. Подкрепление вызывает первая реакция по завершении временного интервала, если количество реакций соответствует заданному критерию.
Англо-русский глоссарий терминов прикладного анализа поведения из книги: «Джон О. Купер, Тимоти Э. Херон, Уильям Л. Хьюард. Прикладной анализ поведения. Пер. с англ. — М.: Практика, 2016.