수업후기/확률과 통계

6강: R 그래프 만들기

Heeyeon Choi 2019. 4. 18. 12:44
728x90

08 그래프 만들기

08-1 R로 만들  수 있는 그래프 살펴보기

<R그래프, 어떤 것들이 있을까?>

-> 2차원 그래프, 3차원 그래프, 지도 그래프, 네트워크 그래프, 시간에 따라 변화하는 모션차트,

마우스 조작에 반응하는 인터랙티브 그래프 등

 

<쉽게 그래프를 만들 수 있는 ggplot2 패키지>

-> 산점도, 막대 그래프, 선 그래프, 상자 그림 등

728x90

08-2 산점도- 변수 간 관계 표현하기

*연속형, 연속형일때 사용

0. ggplot2 패키지 업로드 하기

 

library(ggplot2)

 

1. 배경 설정하기

2. 그래프 추가하기

 

3. 축 범위를 조정하는 설정 추가하기

 

08-3 막대그래프- 집단 간 차이 표현하기

 

#평균 막대 그래프 만들기

 

1. 집단별 평균표 만들기

 

2. 그래프 생성하기

3. 크기 순으로 정렬하기

 

 

#빈도 그래프 만들기

 

08-4 선그래프 - 시간에 따라 달라지는 데이터 표현하기

 

#시계열 그래프 만들기

-> 출력된 그래프를 보면, 실업자 수가 약 5년 주기로 등락을 반복하고, 2005년 이후 급격하게 증가하였다가 2010년 이후 다시 감소하는 추세라는 것을 알 수 있다.

 

 

08-5 상자그림- 집단 간 분포 차이 표현하기

 

#상자 그림 만들기

상자그림 설명
상자 아래 세로선 아랫수염 하위 0~25%이내 해당하는 값
상자 밑면 1사분위수 하위 25% 위치 값
상자 내 굵은 선 2사분위수 하우 50% 위치 값
상자 윗면 3사분위수 하위 75% 위치 값
상자 위 세로선 윗수염 하위 75%~100% 내에 해당하는 값
상자 밖 점 표식 극단치  

 

<결론>

 

-4륜구동은 17~22 사이에 대부분의 자동차가 모여 있습니다.

중앙값이 상자 밑면에 가까운 것을 보면 낮은 값 쪽으로 치우친 형태의 분포라는 것을 알 수 있습니다

 

- 전륜구동은 26~29사이의 좁은 범위에 자동차가 모여 있는 뾰족한 형태의 분포라는 것을 알 수 있습니다.

수염의 위, 아래에 점 표식이 있는 것을 보면 연비가 극단적으로 높거나 낮은 자동차들이 존재한다는 것을 알 수 있습니다

 

-후륜구동은 17~24 사이의 넓은 범위에 자동차가 분포하고 있다는 것을 알 수 있습니다.

수염이 짧고 극단치가 없는 것을 보면 대부분의 자동차가 사분위 범위에 해당하는 것을 알 수 있습니다.

 

출처: 김영우, "쉽게 배우는 R 데이터 분석", 이지스퍼블리싱, 2017년, 181-198쪽

728x90