수업후기/확률과 통계
6강: R 그래프 만들기
Heeyeon Choi
2019. 4. 18. 12:44
728x90
08 그래프 만들기
08-1 R로 만들 수 있는 그래프 살펴보기
<R그래프, 어떤 것들이 있을까?>
-> 2차원 그래프, 3차원 그래프, 지도 그래프, 네트워크 그래프, 시간에 따라 변화하는 모션차트,
마우스 조작에 반응하는 인터랙티브 그래프 등
<쉽게 그래프를 만들 수 있는 ggplot2 패키지>
-> 산점도, 막대 그래프, 선 그래프, 상자 그림 등
728x90
08-2 산점도- 변수 간 관계 표현하기
*연속형, 연속형일때 사용
0. ggplot2 패키지 업로드 하기
library(ggplot2)
1. 배경 설정하기
2. 그래프 추가하기
3. 축 범위를 조정하는 설정 추가하기
08-3 막대그래프- 집단 간 차이 표현하기
#평균 막대 그래프 만들기
1. 집단별 평균표 만들기
2. 그래프 생성하기
3. 크기 순으로 정렬하기
#빈도 그래프 만들기
08-4 선그래프 - 시간에 따라 달라지는 데이터 표현하기
#시계열 그래프 만들기
-> 출력된 그래프를 보면, 실업자 수가 약 5년 주기로 등락을 반복하고, 2005년 이후 급격하게 증가하였다가 2010년 이후 다시 감소하는 추세라는 것을 알 수 있다.
08-5 상자그림- 집단 간 분포 차이 표현하기
#상자 그림 만들기
상자그림 | 값 | 설명 |
상자 아래 세로선 | 아랫수염 | 하위 0~25%이내 해당하는 값 |
상자 밑면 | 1사분위수 | 하위 25% 위치 값 |
상자 내 굵은 선 | 2사분위수 | 하우 50% 위치 값 |
상자 윗면 | 3사분위수 | 하위 75% 위치 값 |
상자 위 세로선 | 윗수염 | 하위 75%~100% 내에 해당하는 값 |
상자 밖 점 표식 | 극단치 |
<결론>
-4륜구동은 17~22 사이에 대부분의 자동차가 모여 있습니다.
중앙값이 상자 밑면에 가까운 것을 보면 낮은 값 쪽으로 치우친 형태의 분포라는 것을 알 수 있습니다
- 전륜구동은 26~29사이의 좁은 범위에 자동차가 모여 있는 뾰족한 형태의 분포라는 것을 알 수 있습니다.
수염의 위, 아래에 점 표식이 있는 것을 보면 연비가 극단적으로 높거나 낮은 자동차들이 존재한다는 것을 알 수 있습니다
-후륜구동은 17~24 사이의 넓은 범위에 자동차가 분포하고 있다는 것을 알 수 있습니다.
수염이 짧고 극단치가 없는 것을 보면 대부분의 자동차가 사분위 범위에 해당하는 것을 알 수 있습니다.
출처: 김영우, "쉽게 배우는 R 데이터 분석", 이지스퍼블리싱, 2017년, 181-198쪽
728x90