Kitobni o'qish: «Основы регрессионного моделирования для психологов»
Введение
Разработка данного учебного пособия является следствием ряда формальных и содержательных проблем, которые имеют место в ходе изучения студентами-психологами такого раздела учебной дисциплины «Математическая статистика и математические методы в психологии», как «Регрессионное моделирование в психологии».
Во-первых, разработка компьютерных статистических пакетов для обработки эмпирических результатов в гуманитарных дисциплинах (SPSS, Statistica и др.) не только привела к целому ряду позитивных моментов в научно-исследовательской деятельности в психологии (например, значительно сократилось время статистической обработки эмпирических данных, появилась возможность вносить определенные коррективы в планирование самого эмпирического исследования с опорой на промежуточные статистические результаты и т. д.), но и породила некоторые негативные моменты. В частности, можно привести два таких момента. Первый связан с тем, что простота «нажатия кнопок по схеме» в компьютерных статистических пакетах, приводящего к конечному продукту статистического анализа (в Интернете в режиме свободного доступа достаточно много информационных источников, презентирующих эту схему), стала проявляться в том, что в научно-психологических исследованиях статистический анализ стали использовать «где надо» и «где не надо», забывая о том, что психология имеет весьма специфичный объект исследования. К примеру, многие в своих исследованиях пытаются найти некие статистические обобщения с применением компьютерных статистических пакетов (благо доступ к таким программам стал «беспроблемным») даже там, где с методологической точки зрения речь идет об уникальности бытия человеческой личности (понимающая методология). Особенно эта тенденция проявляется в исследовательских работах студентов-психологов, ориентированных на формальные требования к научно-исследовательским работам (требование использовать статистические методы). Второй связан с тем, что психолога-исследователя стали интересовать только «конечные распечатки» и он перестал обращать внимание на технологические аспекты математико-статистических расчетов, осуществляемых компьютером. Как следствие, абсолютно перестал учитываться тот факт, что в технологиях математико-статистического анализа для их проведения существует достаточно много формальных условий-требований, автоматически проявляющихся в «конечных распечатках», но выполнение которых не всегда возможно применительно к конкретной научной дисциплине, в частности к психологии.
Во-вторых, педагогический опыт показывает, что когда речь идет об изучении студентами-психологами продуктов моделирования в психологии по разным учебным дисциплинам, то приоритет отдается моделям, которые основаны на концептуальных взглядах автора модели, а не моделям, основанным на строгом статистико-математическом (мы специально используем связку в виде статистико-математический, а не математико-статистический, потому что в регрессионном моделировании математические расчеты осуществляются на основе статистических данных) анализе реальных эмпирических результатов (следствие – низкая объективность (научность) продуктов моделирования в нынешней психологии). Одна из причин такого положения вещей кроется в отсутствии у студентов понимания сути и технологических составляющих проведения регрессионного моделирования (основанного на строгом статистико-математическом анализе реальных эмпирических результатов) в психологических исследованиях.
Учитывая вышесказанное, в данном пособии мы попытались доступным для понимания языком представить содержание, которое синтезировало бы содержательные аспекты трех составляющих (компонентов):
1) методологических основ психологии как науки; 2) математических основ регрессионного анализа; 3) компьютерных технологий математико-статистического анализа эмпирических результатов.
Следуя этим путем, мы понимали, что создание такого «гибрида», как и любого гибрида, обязательно приведет и к негативным последствиям. В частности, он утратит часть содержательных аспектов каждого из своих «родительских» компонентов по сравнению с ситуацией, если бы мы рассматривали их в отдельности (чтобы снизить влияние этого фактора, в пособии в сносках приводится литература, которая позволит повысить знания в каждом из этих компонентов). Несмотря на это, как нам представляется, изучение содержания данного пособия студентами-психологами позволит решить две важные учебные задачи. Во-первых, будет способствовать развитию у них стратегического видения возможности применения регрессионного моделирования в реализации своих научно-исследовательских проектов (численное моделирование дает наиболее точную прогнозируемую оценку изучаемым явлениям). Во-вторых, будет способствовать развитию у них способности более качественно проводить регрессионное моделирование с технологической точки зрения.
Автором предисловия и параграфов 1.1, 1.3, 2.2, 2.3, 2.4, 3.1, 3.2, 3.3, 3.4, 4.1, 4.3 и тестовых заданий для самопроверки является В. А. Дорофеев, автором параграфов 1.2, 2.1, 4.2 – Ю. А. Мочалова.
Тема 1. Методологические аспекты регрессионного анализа в психологии
1.1. Законы и закономерности в психологии и регрессионный анализ
Чтобы иметь статус науки, психология должна опираться на определенные законы и закономерности. В задачи данного пособия не входит рассматривать методологические аспекты наличия или отсутствия законов и закономерностей в психологии и соотношения между ними1, только заметим, что в основе закона лежит связь между одним или несколькими явлениями (переменными) и другим или другими явлениями (переменными). Если следовать всем канонам требований к научности (объяснительности) результатов исследования, то разговор идет прежде всего о связи каузальной.
Что касается определения сущности каузальной связи, то стоит заметить, что единого подхода к пониманию этой сущности не существует и, как следствие этого, нет единого подхода к ее эмпирическому изучению2.
С содержательной стороны построения регрессионных моделей, освещаемой данным пособием, важно заметить, что в определение каузальной связи может включаться или не включаться такой фактор, как время. Если фактор времени включить в определение, тогда каузальную связь можно определить следующим образом.
Каузальная связь (от лат. causa – причина) – одна из важнейших форм взаимосвязи и взаимообусловленности явлений и процессов бытия, выражающая такую генетическую связь между ними, при которой одно явление (процесс), называемое причиной, при наличии определенных условий неизбежно порождает, вызывает к жизни другое явление (процесс), называемое следствием (или действием).
При каузальной связи причина и следствие разнесены во времени (одна психологическая переменная (причина) появляется раньше другой (следствие), а не наоборот). Следствие не может быть раньше причины – причина и следствие связаны генетически.
Например, в психологии в конце 1930-х гг. была сформулирована ставшая впоследствии широко известной в психологической науке теория фрустрации – агрессии. Ее авторами являются Н. Миллер, Д. Доллард, М. Дуб, Д. Маурер и Р. Сиэрс.
Представители этого направления Н. Миллер и Д. Доллард следующим образом сформулировали гипотезу: наличие агрессивного поведения всегда предполагает существование фрустрации и, наоборот, существование фрустрации всегда ведет к некоторой форме агрессии. Таким образом, в данной модели ее авторы отразили каузальную связь, включающую фактор времени: сначала фрустрация → потом агрессия.
Однако экспериментальные данные в рамках вышеназванной теории показали, что только одной теории недостаточно для объяснения агрессивного поведения. Реальные экспериментальные исследования показали, что существуют явные и неявные переменные, которые не только искажают генетическую связь между фрустрацией и агрессией, но и нарушают универсальность каузальной (генетической) направленности такой связи.
Применительно к задачам и содержанию данного пособия заметим, что теория вероятностей и математическая статистика, которые в нем представлены, – лишь инструмент для изучения статистической зависимости между явлениями, но однозначно не позволяют установить наличие каузальной связи, включающей фактор времени. В психологии представления о генетически определяемой каузальной связи должны быть привнесены из некоторой другой теории, которая позволяет содержательно объяснить изучаемое явление.
Заметим, что психология как научная дисциплина в отношении включения фактора времени в регрессионные модели находится в весьма затруднительном положении по сравнению с другими дисциплинами (например, экономикой, биологией). В экономике и биологии в регрессионной модели фактор времени включается в моделирование в виде статистических данных, собранных на протяжении определенных предшествующих интервалов времени, чего практически не встретишь в психологии. Причин тому несколько. Например, одной из причин такого положения вещей (невозможность сформировать статистические базы данных на определенных периодах развития изучаемых явлений) является отсутствие в психологии надежного измерительного инструментария (за исключением психологии ощущения и восприятия (сантиметры, секунды)), позволяющего хотя бы отчасти сохранить объективность результатов измерений.
Иногда в литературе можно обнаружить исследования, в которых психологи-исследователи для нахождения каузальной связи используют дисперсионный анализ (ANOVA, MANOVA). Но дисперсионный анализ позволяет определить статистическую достоверность влияния одной (нескольких) переменной на зависимую (зависимые) переменную (проявляется в мере дисперсии зависимой переменной), однако наличие статистически достоверного влияния является необходимым, но еще далеко не достаточным условием генетически обусловленной связи между явлениями.
Таким образом, выделим первый важный аспект регрессионного анализа: он не позволяет устанавливать связь каузальную, понимаемую как связь генетическая между явлениями и процессами. Например, установить факт того, что наличие состояния фрустрации всегда приведет к агрессии.
Тогда возникает вопрос: какую же связь позволяет находить регрессионный анализ?
В ответе на этот вопрос дадим характеристику той связи, с которой имеет дело психолог-исследователь после проведения эмпирического исследования, когда выполнены все требования к технологиям сбора эмпирических результатов и соблюдены требования к объему статистической выборки.
Если выполнены вышеназванные условия (соблюдены требования к технологиям сбора эмпирических результатов и к объему статистической выборки) и полученные эмпирические результаты нанесены на двумерный график, то мы столкнемся с тем, что всегда одним и тем же значениям одной переменной будут соответствовать разные значения другой переменной.
На рис. 1.1 представлены два возможных варианта графического представления такой ситуации.
Связь, которая представлена на рис. 1.1, называется вероятностной (стохастической).
Стохастическая связь – связь, при которой каждому значению одной переменной значение других переменных соответствует не однозначно, а с определенной долей вероятности.
Рис. 1.1. Варианты диаграмм совместного рассеивания точек (каждая точка – испытуемый) в двумерном исследовании
Количественным выражением такого вида связи является коэффициент корреляции.
При стохастической связи переменные как случайные величины заданы совместным распределением вероятностей величины.
Bepul matn qismi tugad.