Коллинеарность

Коллинеарность в статистике - корреляция между переменными-предикторами (или независимыми переменными), так что они выражают линейную зависимость в регрессионной модели. Когда переменные-предикторы в одной и той же регрессионной модели коррелированы, они не могут независимо предсказать значение зависимой переменной. Другими словами, они объясняют некоторые из тех же отклонений в зависимой переменной, что, в свою очередь, снижает их статистическую значимость.

Коллинеарность становится проблемой в регрессионном анализе, когда существует высокая корреляция или связь между двумя потенциальными переменными-предикторами, когда происходит резкое увеличение значения p (т. Е. Снижение уровня значимости) одной переменной-предиктора при включении другого предиктора. в регрессионной модели или при определении фактора инфляции с высокой дисперсией. Коэффициент увеличения дисперсии обеспечивает меру степени коллинеарности, так что коэффициент увеличения дисперсии 1 или 2 практически не показывает коллинеарности, а показатель 20 или выше показывает крайнюю коллинеарность.

Мультиколлинеарность описывает ситуацию, в которой связано более двух переменных-предикторов, так что, когда все они включены в модель, наблюдается снижение статистической значимости. Подобно диагностике коллинеарности, мультиколлинеарность может быть оценена с использованием факторов инфляции дисперсии с тем же ориентиром, что значения больше 10 указывают на высокую степень мультиколлинеарности. Однако, в отличие от диагностики коллинеарности, может оказаться невозможным предсказать мультиколлинеарность до наблюдения ее влияния на модель множественной регрессии, потому что любые две из переменных-предикторов могут иметь лишь низкую степень корреляции или ассоциации.