logo search
ПСИХОГЕНЕТИКА

6.3.3. Регрессия

Коэффициент корреляции не предполагает наличия какой-либо причинно-следственной зависимости между переменными. Если с увеличением переменной х наблюдается рост переменной y, то мы констатируем наличие положительной корреляции между этими переменными, однако на этом основании мы еще не можем утверждать, что увеличение у является следствием увеличения х. Например, в городах мы можем обнаружить, что количество кафе и столовых положительно коррелирует с количеством больниц и поликлиник. Естественно, из этого не следует, что общественное питание является причиной высокой заболеваемости населения, что и приводит к появлению новых лечебных учреждений. Просто количество тех и других заведений определяется численностью населения города: чем больше жителей, тем больше необходимо как кафе, так и поликлиник. Отсюда и высокая положительная корреляция. Таким образом, коэффициент корреляции позволяет определить лишь наличие статистической связи между переменными, но не позволяет установить причину этой связи. В статистике существует и другой метод измерения связи, который предполагает оценку зависимости одной переменной от другой. Это метод линейной регрессии. Метод регрессии позволяет предсказать, какую величину будет иметь зависимая переменная у при любых значениях независимой переменной х. Речь фактически идет об уравнении регрессии уi = a + b( xi - x ), в котором нам необходимо определить величины а и b соответствующей линии регрессии. Независимая переменная (xi - x) представляет собой отклонение признака данного индивида от среднепопуляционной величины. Линия регрессии строится таким образом, чтобы квадраты расстояний между ней и всеми точками на графике были минимальными (рис. 6.2 и 6.3а, б.). Коэффициент b называется коэффициентом регрессии у на х. Если коэффициент регрессии достоверно выше 0, то говорят о зависимости переменной у от переменной х. В количественной генетике регрессия применяется в основном в исследованиях родителей и детей. Часто используют одновременно и регрессию, и корреляцию. Регрессия имеет ряд преимуществ по сравнению с корреляцией, применение которой ограничено рядом условий, о которых речь пойдет в следующем разделе. Регрессия менее чувствительна к этим условиям.

Термин регрессия был введен Ф. Гальтоном при исследовании роста у родителей и детей. В этой работе Ф. Гальтон отметил, что у более высоких отцов сыновья также отличаются высоким ростом, но все же они несколько ниже своих отцов. У отцов небольшого роста сыновья так же невысоки, но они обычно выше своих отцов. Таким образом, рост детей как бы стремится к популяционной средней (рис. 6.4). Это явление Ф. Гальтон назвал регрессией на среднюю.

6.4. Условия соответствия коэффициента корреляции коэффициенту родства

Как мы уже говорили, выявление степени внутрисемейного сходства является основным методом количественной генетики. Основоположники биометрической генетики, начиная с Ф. Гальтона, ввели этот метод в обиход генетических исследований, практически ничего не зная о механизмах, приводящих к появлению сходства между родственниками. Сейчас мы знаем, что в основе фенотипического сходства лежит сходство генетическое, обусловленное общностью генов, полученных от одного предка (если, конечно, признак не целиком обусловлен средой, а все же зависит от действия генов). В 1918 г. английский генетик и статистик Р. Фишер показал, что результаты, полученные основоположниками биометрической генетики, могут быть объяснены именно с позиций менделевской генетики. Можно сказать, что в этом году две независимо развивавшиеся ветви генетики - менделевская и гальтоновская - наконец нашли путь к объединению. Заслуга Р. Фишера в том, что он показал, что ожидаемая степень сходства между родственниками объясняется полигенным наследованием, т.е. детерминацией признака не одним, а многими генами, и при определенных допущениях, о которых речь пойдет ниже, она соответствует коэффициентам родства. В основе этого лежат вероятностные процессы, происходящие при расщеплении и рекомбинации аллелей, открытые Г. Менделем. Оказалось, что регрессия (напомним, что это термин Ф. Гальтона) родителя к ребенку или ребенка к родителю, или сибса к сибсу, или других пар родственников соответствует доле общих генов у этих родственников, т.е. коэффициенту родства. Коэффициент корреляции равен корню квадратному из произведения двух регрессий, т.е. регрессии первой величины по второй и второй величины по первой . Коэффициент корреляции будет эквивалентен регрессии, когда две регрессии (например, ребенка к родителю и родителя к ребенку) равны. Таким образом, при определенных условиях коэффициент корреляции в парах родственников должен соответствовать доле общих генов, или коэффициенту родства.

Итак, существует три условия, при точном соблюдении которых реально получаемые корреляции между родственниками должны совпадать с теоретически рассчитанными коэффициентами родства. Из всех количественных признаков человека лучше всего удовлетворяют этим условиям дерматоглифические узоры на пальцах. Каждый человек имеет свой индивидуально специфический характер дерматоглифических борозд (рис. 6.5). Этот рисунок закладывается на ранних этапах эмбриогенеза и впоследствии не претерпевает никаких изменений, т.е. не испытывает средовых модификаций. Распределение индивидов по числу борозд соответствует нормальному, гауссову, следовательно, мы можем предположить, что здесь имеет место чисто аддитивное наследование. Браки по такому признаку, естественно, не могут быть избирательными.

В отличие от корреляции, регрессия менее чувствительна к ассортативности, поэтому регрессией можно пользоваться в семейных исследованиях, когда предполагается избирательность браков по изучаемому признаку. Регрессия позволяет также выявлять так называемый материнский эффект, т.е. влияние фенотипа матерей на фенотип потомства. При материнском эффекте регрессия потомков к матерям значительно больше, чем регрессия к отцам. По регрессии можно судить и о наличии эффектов доминирования. Обычно для изучения наследуемости стараются применять различные методы: вычисление коэффициентов корреляции между различными группами родственников (родители-потомки, сибсы, полусибсы, матери-дочери и т.д.) и вычисление коэффициентов регрессии тем или иным способом.

Выводы

  1. Сходство между родственниками, проживающими вместе, возникает за счет общих генов и общей среды и, следовательно, включает в себя наследственный и средовой компоненты. Необходимо различать сходство семейное и сходство генетическое.

  1. У родственников всегда имеются общие гены, полученные ими в силу происхождения от общих предков.

  1. Число общих генов у потомков одних и тех же родителей определяется чистой случайностью. Мерой случайности является вероятность.

  2. При образовании половых клеток (гамет) происходят вероятностные события. В результате родные братья и сестры получают какое-то количество одинаковых аллелей.

  3. Вероятность того, что двое людей обладают одинаковыми аллелями, называется коэффициентом родства. Коэффициенты родства для различных категорий родственников рассчитываются теоретически на основе теории вероятностей и математической статистики.

  4. В психогенетических исследованиях для количественной оценки сходства между родственниками пользуются коэффициентами конкордантности, корреляции и регрессии.

  5. Коэффициент конкордантности используют при анализе сходства и различий между родственниками по альтернативным признакам, например по наличию или отсутствию какого-либо заболевания или отклонения. По коэффициентам конкордантности родственников разной степени родства можно судить о возможной наследуемости признака и риске заболевания для родственников.

  6. Коэффициент корреляции используют при анализе сходства и различий между родственниками по количественным признакам. Высокая корреляция указывает на преобладание однонаправленных отклонений значения изучаемого признака у родственников от выборочной средней. Это не предполагает обязательного сходства в абсолютных величинах признака в парах родственников.

  7. Коэффициент регрессии чаще всего применяется при исследованиях родителей и детей и, в отличие от коэффициента корреляции, может служить мерой причинно-следственной зависимости между переменными. Регрессия при определенных условиях соответствует доле общих генов у родственников, т.е. коэффициенту родства.

  8. Если регрессии родителя к ребенку и ребенка к родителю совпадают, то коэффициент регрессии будет эквивалентен коэффициенту корреляции.

  9. При определенных условиях теоретически рассчитанное сходство между родственниками (коэффициенты родства) совпадает с эмпирически полученными коэффициентами корреляции и регрессии. Эти условия таковы:

    • исследуемый признак является количественным и в его детерминации принимают участие только полигены, условия среды не влияют на признак;