728x90
09-3 나이와 월급의 관계 - "몇살 때 월급을 가장 많이 받을까?"
#나이변수 검토 및 전처리
1. 변수 검토하기
728x90
2. 전처리
<코드북>
범위 | 모름/무응답 |
1900~2014 | 9999 |
3. 파생변수 만들기- 나이
#나이와 월급의 관계 분석
1. 나이에 따른 월급 평균표 만들기
2. 그래프 만들기
<결과>
20대 초반에 100만원 가량의 월급을 받고, 이후 지속적으로 증가하는 추세를 보인다.
50대 무렵 300만원 초반대로 가장 많은 월급을 받고, 그 이후로 지속적으로 감소
70세 이후 20대보다 낮은 월급을 받는다.
09-4 연령대에 따른 월급차이-"어떤 연령대에서의 월급이 가장 많을까?"
#연령대 변수 검토 및 전처리하기
-파생변수 만들기 - 연령대
qplot(welfare$ageg)
#연령대에 따른 월급 차이 분석하기
1. 연령대별 월급 평균표 만들기
2. 그래프 만들기
* 나이순으로 정렬하기
<결과>
중년이 280만원 정도로 가장 많은 월급을 받는다는 것을 알 수 있습니다.
노년은 125만원정도로 초년이 받는 163 만원보다 적은 월급을 받습니다.
09-5 연령대 및 성별 월급차이-"성별 월급 차이는 연령대별로 다를까?"
#연령대 및 성별 월급 차이 분석하기
1. 연령대 및 성별 월급 평균표 만들기
2. 그래프 만들기
-출력된 그래프는 각 성별의 월급이 연령대 막대에 함께 표현되어 있어 차이를 비교하기 어렵다.
geom_col()의 position 파라미터 값을 "dodge" 로 설정해 막대를 분리하자.
#나이 및 성별 월급차이 분석하기
출처: 김영우, "쉽게 배우는 R 데이터 분석", 이지스퍼블리싱, 2017년, 220-232쪽
728x90
'수업후기 > 확률과 통계' 카테고리의 다른 글
8-2강 : 데이터 분석 프로젝트! - 종교 이혼율, 노년층 지역 (0) | 2019.05.16 |
---|---|
8 -1강 : 데이터 분석 프로젝트-직업별 월급, 성별 직업분석 (0) | 2019.05.16 |
7-1 강 : 데이터 분석 프로젝트- 성별에 따른 월급차이 (0) | 2019.05.15 |
6강: R 그래프 만들기 (0) | 2019.04.18 |
5강: 데이터 정제 (0) | 2019.04.14 |