본문 바로가기

기억하기 위한 기록

엑셀로 QQ plot, Scatter plot 그리는 방법 - 자료 분포 한눈에 파악하기

728x90
반응형
SMALL

안녕하세요~!

 

우블입니다.

 

오늘은 엑셀로 엄청나게 많은 수의 데이터를 한눈에 볼 수 있는 방법 중

가장 쉽고 간단한,

엑셀로도 그릴 수 있는

QQ plot 과 Scatter plot에 대해 알아보고

어떻게 하면 그릴 수 있을지도 알아보겠습니다!!!

 

 

 

 

먼저, 간단하게 소개해드리자면,

 

 

 

1. QQ plot

 

정확히 말하면, Q–Q (quantile-quantile) plot 이고,

쉽게 말하면

분위수로 자료 값을 나열한 뒤 그래프로 보여주는 방법입니다.

 

예를 들어,

자료 개수가 10개라면, 

작은 것 부터 0 -> 100% 라고 정하는 경우,

10%는 가장 작은 자료의 값,

20%는 두번째로 작은 자료의 값,

...

100%는 가장 큰 자료의 값 입니다.

 

 

 

 

 

2. Scatter plot (XY plot 또는 산점도)

 

Scatter plot 은 아무래도 두 자료에 대해 비교하기 위해서 사용합니다.

제가 주로 쓰는 이유는

특정 좌표에서 갖는 값에 대해

실측값과 모델링한 값을 비교할 때 주로 사용합니다.

 

너무나도 단순하게, 

그냥 두 자료를 (z1, z2) 로 놓고 그래프에 뿌려보는 방법으로 비교합니다!

 

저와 같은 목적을 가지고 계신 분이라면 Scatter plot 으로 비교해보는 것이 용이할 것입니다!!

 

(이는 1. QQ plot 도 마찬가지입니다. 

두 자료에 대해 구한 뒤 그래프를 그려봤을 때 y=x 직선에 가까울 수록 

두 자료가 유사하다는 결과를 얻을 수 있습니다.)

 

 

 

 

 

소개는 이쯤하고,

엑셀에서 어떻게 구하는지 방법에 대해 알아보도록 하겠습니다.

 

 

 

 

1. QQ plot

 

너무 간단해서 놀라실겁니다 ....ㅎㅎㅎ

 

=PERCENTILE(자료전체,분위수)

자료전체 : 범위로 넣습니다.

분위수 : 1부터 100의 수를 넣습니다. 

 

예) =PERCENTILE(A$3:A$344,$O3)

이런식으루요!

 

 

 

 

2. Scatter plot (XY plot)

 

이건 더 간단합니다...ㅎㅎㅎㅎ

 

그냥 자료값을 잡고 분산형 그래프로 만드시면 됩니다...!

 

그래프 예시는 아래와 같아요

 

 

 

단, 당연히 같은 좌표에서의 두 값을 넣어야 합니다!!!

 

엑셀에서의 추세선 기능을 이용하면 얼마나 y=x 에 가까운지도 

바로 파악할 수 있으니 정말 편리합니다 ㅎㅎㅎ

 

박스 안의 식은, 추세선의 직선의 방정식(위)과

결정 계수인 R^2(아래)을 나타냅니다.

 

결정 계수는 0~1 사이의 수로, 1에 가까울수록 두 자료의 상관관계가 큰 것을 나타냅니다!

 

즉, 두 자료가 유효한 관련이 있다는 것을 알 수 있네요!

 

 

 

 

 

여기까지, 두 자료를 비교할 때 유용한 두 방법을 소개해드렸습니다.

 

궁금한 점이나 더 추가해야된다고 생각되시는 게 있다면 언제든 댓글로 알려주세요!!!!

 

읽어주셔서 감사합니다~!

 

 

 

 

~ 함께 보면 좋은 글 ~

 

2020/02/05 - [엑셀 함수] 엑셀함수로 간단하게 분산, 표준편차, 변동계수를 구해보자!

 

[엑셀 함수] 엑셀함수로 간단하게 분산, 표준편차, 변동계수를 구해보자!

안녕하세요, 우블입니다. 이번 글은 엑셀에서 자주 사용하는 함수(통계 관련)에 관련된 정보를 다루려고 합니다! 아무래도 통계를 돌릴 때 쓰는 프로그램은 많지만, 저처럼 가장 기본적인 계수들이나, 따로 프로..

wooble52.tistory.com

 

 

728x90
반응형
LIST