MATH/차원 축소와 요인 분석(PCA,FA) 3

요인 분석 실습(1)

#요소분석 실행 #주축 요소분석 (principal axis), 회전(varimax) 이용한 factor loading 값 factorloading은 변수와 factor 간의 상관관계를 나타냄,상관관계가 가장 높은 곳에 그변수가 facotor에 묶이는것 ->3번째factor는 분위기로 볼 수 잇음 접근성은 1번쨰 factor로 볼 수 잇 ->편의성1은 날라감,가장 높은 factor loading값이 0.5가 안된다. #1번 foctor는 접근성, 2번 factor는 편의성, 3번 factor는 분위기, 4번factor는 친절도 라고 이름을 붙임 #factor요인명은 요인분석을 돌리고 나서 붙이는 것 #4갸의 factor가 사용한 분산은 62.3%이다. 약 40%를 버림-> 요소 분석의 단점 #correl..

요인 분석의 기초- PAF(요인분석)

출처 ; https://youtu.be/n3Sb6lQihPA?si=JQgscbUpi6TNw-XY #상관관계 행렬은 분산 공분산 행렬을 표준화 한 것이므로 상관관계 행렬로 시작해도댐! -> 상관관계 행렬이 매우 중요!! #우리가 갖은 지표 점수(국어, 영어)를 종속 변수로 하고 나머지 지표 변수를 통해 유추 #SSE는 unique variance와 비슷하다고 본다. r스퀘어는 common variance와 비슷하다고 본다. #분산을 r스퀘어로 대체 하는게 가능할까? 회귀분석과 비슷 하다고 본다. #언어 능력은 변수로서 데이터로서 존재하지 않음 , 우리가 가진 지표 변수를 이용하여 한개의 지표 변수를 종속 변수로 하고 나머지 모든 변수를 없지만, 보이지 않지만 언어능력이라는 개념으로 보고 전부다 독립 변수로..

차원축소와 요인 분석-PCA(주성분 분석)

출처: https://youtu.be/TesmO5Sq1YQ?si=WJ7kXEQYR746BJLF 차원축소( demension reduction) #차원 축소-변수를 줄이는 것 #변수를 줄여야 하는 이유 -변수가 너무 많은 경우 이를 다 사용하는 것은 불가능 혹은 불필요 -가능성은 낮으나 변수의 개수가 관찰값의 개수보다 많으면 분석이 거의 불가능 -너무 많은 변수의 사용은 불필요하거나 효율적이지 않음 #차원 축소를 어떻게 할 것인가 -상관관계가 중요(=상관관계가 높은 변수들을 묶어보자) -더 정확하게는 variance-covariance matrix(공분산행렬)을 이용 -covariance matrix는 correlation matrix(상관관계)와 유사 -말 그대로 “co”는 함께(together)의 의미..