본문 바로가기
연구방법_분석방법

정준상관분석(Canonical Correlation Analysis), 데이터의 연결 고리를 찾는 법

by PhDHelper 2025. 9. 2.
반응형

정준상관분석(Canonical Correlation Analysis) 완전 정리

다변량 변수 집합 간의 전반적인 관계를 분석하는 방법

정준상관분석이란?

정준상관분석은 간단히 말해,
두 개의 변수 집합(각각 여러 개의 변수로 구성) 사이의 상관관계 전체를 한꺼번에 분석하는 방법이에요.

  • 변수 집합 1 (독립변수): X₁, X₂, X₃…
  • 변수 집합 2 (종속변수): Y₁, Y₂, Y₃…

예를 들어,

  • X: 학습 동기, 시간관리, 자기효능감
  • Y: 학업 성취도, 만족도, 몰입도

이렇게 여러 개의 변수 묶음(X, Y)을 비교해서
전체적으로 얼마나 연관되어 있는지를 알아보는 분석입니다.

[참고논문]

노현식, 이성호, & 김성훈. (2020). A Comparative Study of Consumption Propensity and Determinants of Purchasing According to Cultural Differences between Baby Boomers and Millennials. 한국프랜차이즈경영연구, 11(1), 31-44.

언제 쓰나요?

  • 두 집단의 변수 묶음 전체 관계를 보고 싶을 때
  • 단순 상관분석이나 회귀분석으로는 설명이 부족할 때
  • 다변량 독립변수 ↔ 다변량 종속변수 간 상관관계를 파악하고 싶을 때
  • 사회과학, 교육, 심리학 등에서 종합적 해석이 필요한 경우

핵심 개념

개념
설명
정준변수(Canonical Variate)
각 변수 집합(X, Y)에서 도출한 가중합 변수
정준상관(Canonical Correlation)
두 정준변수 간의 상관계수
정준계수(Canonical Coefficient)
정준변수 구성에 사용되는 가중치

즉, X와 Y에서 각각 하나의 "대표 축"을 만들어
그 축들 사이의 상관관계를 계산하는 거예요!

[분석결과 예시]


해석 방법

1. 정준상관계수(Rc)

  • 첫 번째 정준상관(Rc₁), 두 번째 정준상관(Rc₂)… 등 여러 쌍이 나올 수 있어요
  • 일반적으로 Rc₁이 가장 중요 (가장 큰 상관 설명)

2. 유의성 검정 (Wilks’ Lambda 등)

  • 각 Rc쌍이 통계적으로 의미 있는지를 확인
  • p < .05 이면 유의함

3. 정준계수 해석

  • 어떤 변수가 정준변수 구성에 많이 기여했는지 보기
  • 부호(+, -)도 해석에 중요

4. 공분산 공유량(R²)

  • 각 변수 집합이 서로에게 설명하는 정도

장단점 정리

장점
단점
여러 변수 간 복합 관계 해석 가능
해석이 다소 복잡
데이터 요약 효과 우수
변수 수 많으면 과적합 위험
회귀/상관보다 풍부한 분석 가능
이론적 배경 없이 사용하면 해석 애매

분석 도구

  • SPSS: CCA 분석 → REGRESSION → CANONICAL CORRELATION 메뉴
  • R: cancor() 함수
  • Python (statsmodels, sklearn 기반 분석 가능)
  • SAS 등도 지원

정리 요약

  • 정준상관분석은 변수 간 하나하나가 아니라, 변수 '집합 전체'의 관계를 보는 분석
  • 교육, 심리, 경영, 사회과학 전반에서 많이 활용
  • 분석 결과는 정준상관계수, 정준계수, 유의성 중심으로 해석
  • 데이터 수와 이론적 배경이 충분할 때 사용하기!
반응형