수업후기/확률과 통계
8-2강 : 데이터 분석 프로젝트! - 종교 이혼율, 노년층 지역
Heeyeon Choi
2019. 5. 16. 15:59
728x90
09-8 종교 유무에 따른 이혼율-"종교가 있는 사람들은 이혼을 덜 할까?"
#종교 변수 검토 및 전처리 하기
1. 변수검토하기
2. 전처리
728x90
#혼인 상태 변수 검토 및 전처리하기
1. 변수검토하기
2. 파생변수 만들기- 이혼 여부
값 | 내용 |
0 | 비해당(18세 미만) |
1 | 유배우 |
2 | 사별 |
3 | 이혼 |
4 | 별거 |
5 | 미혼(18세 이상, 미혼모 포함) |
6 | 기타(사망 등) |
#종교 유무에 따른 이혼율 분석하기
1. 종교 유무에 따른 이혼율 표 만들기
2. 이혼에 해당하는 값만 추출, 이혼율 표 만들기
3. 그래프 만들기
<결과>
이혼율은 종교가 있는 경우 7.2% 종교가 없는 경우 8.3%로 나타났습니다.
따라서 종교가 없는 사람들이 이혼을 더 한다고 볼 수 있습니다.
#연령대 및 종교 유무에 따른 이혼율 분석하기
1. 연령대별 이혼율 표 만들기
2. 연령대별 이혼율 그래프 만들기
3. 연령대 및 종교 유무에 따른 이혼율 표 만들기
4. 연령대 및 종교 유무에 따른 이혼율 그래프 만들기
09-9 지역별 연령대 비율 -"노년층이 많은 지역은 어디일까?"
# 지역 변수 검토 및 전처리하기
1. 변수 검토하기
2. 전처리
- 지역 코드를 참고해 지역명 변수를 추가하자.
+ left_join 으로 합치기
welfare <- left_join(welfare,list_region, id = "code_region")
#지역별 연령대 비율 분석하기
1. 지역별 연령대 비율표 만들기
2. 그래프 만들기
3. 노년층 비율 높은 순으로 막대 정렬하기
4. 연령대 순으로 막대 색깔 나열하기
<결과>
노년층 비율이 대구/경북, 강원/충북, 광주/전남/전북/제주도 순으로 높다는 것을 알 수 있다.
출처: 김영우, "쉽게 배우는 R 데이터 분석", 이지스퍼블리싱, 2017년, 244-261쪽
728x90