[MDA] Inferences About a Mean Vector
·
Study/Multivariate Data Analysis
이번 포스팅에서는 mean vector의 추론에 대해 알아보겠습니다. 일변량 통계에서는 평균값의 추론을 위해 t-test를 사용했습니다.그러면 다변량 통계에서는 평균 벡터를 추론하기 위해 어떤 test를 사용해야 할까요? 우선 위의 고민을 머리에 품어둔 채로, t-test 때처럼 평균 벡터의 추론을 위한 귀무가설과 대립가설을 살펴봅시다. 다르게 보면, 다음과 같이 Naive하게 가설을 세울 수도 있겠네요. 이러한 가설을 검정하기 위한 가장 단순한 방법은, univariate case에서의 확장입니다.즉 t-test를 Type 1 Error $\alpha$로 각 변수마다 총 p번 시행하는 것이죠. 다만 이럴 경우 문제가 생깁니다. 바로 귀무가설이 맞음에도 불구하고 이를 기각할 확률인 FWER (Family..
[MDA] Multivariate Q-Q Plot
·
Study/Multivariate Data Analysis
저번 포스팅에서는 다변량통계에서 주로 사용되는 다변량정규분포에 대해 언급했습니다. 이번 포스팅에서는 데이터가 주어졌을 때, 해당 데이터가 다변량정규분포를 따르는지 확인할 수 있는 기초적인 방법인 Q-Q plot에 대해 알아보겠습니다. 앞으로 사용할 다양한 통계기법의 경우 대체적으로 정규성 가정을 기반으로 합니다.따라서 데이터를 분석하기 위해 통계기법을 사용하기 전, 데이터의 정규성을 확인하는 것은 매우 중요합니다. 먼저 기존의 일변량통계에서 QQ plot은 표본의 분위수와 이론 정규분포의 분위수를 비교해서, 직선 위에 점들이 놓일 경우 정규분포를 따른다고 판단할 때 사용되었습니다. 점들이 빨간 점선 위에 잘 놓여있을 경우, 정규분포를 따른다고 간단하게 확인할 수 있습니다. (좌측 그래프 참고) 다변..
[MDA] Multivariate Normal Distribution
·
Study/Multivariate Data Analysis
해당 카테고리에서는 Multivariate Data Analysis(다변량자료분석)에 관한 내용을 다루어보려 합니다. 이 카테고리에서 작성되는 내용은 복습을 위해 개인적으로 정리하는 글이기 때문에 내용이 정확하지 않을 수 있다는 점 미리 안내드립니다. (고쳐야 할 부분이 있을 경우 댓글로 알려주시면 감사하겠습니다.) 이번 포스팅에서는 Multivariate Normal Distribution (다변량 정규분포)에 대해 간단히 소개하겠습니다. 기초통계학에서 배우는 univariate normal distribution이 일변량 통계에서 가장 중요한 통계적 분포인 것처럼, 역시나 다변량 통계에서 가장 중요한 통계적 분포는 multivariate normal distribution이라고 할 수 있습니다. 그..