수업후기/확률과 통계

8-2강 : 데이터 분석 프로젝트! - 종교 이혼율, 노년층 지역

Heeyeon Choi 2019. 5. 16. 15:59
728x90

09-8 종교 유무에 따른 이혼율-"종교가 있는 사람들은 이혼을 덜 할까?"

 

#종교 변수 검토 및 전처리 하기

 

1. 변수검토하기

2. 전처리

728x90

#혼인 상태 변수 검토 및 전처리하기

1. 변수검토하기

2. 파생변수 만들기- 이혼 여부

내용
0 비해당(18세 미만)
1 유배우
2 사별
3 이혼
4 별거
5 미혼(18세 이상, 미혼모 포함)
6 기타(사망 등)

 

 

#종교 유무에 따른 이혼율 분석하기

 

1. 종교 유무에 따른 이혼율 표 만들기

 

 

2. 이혼에 해당하는 값만 추출, 이혼율 표 만들기

 

3. 그래프 만들기

<결과>

 

이혼율은 종교가 있는 경우 7.2% 종교가 없는 경우 8.3%로 나타났습니다.

따라서 종교가 없는 사람들이 이혼을 더 한다고 볼 수 있습니다.

 

#연령대 및 종교 유무에 따른 이혼율 분석하기

 

1. 연령대별 이혼율 표 만들기

 

 

2. 연령대별 이혼율 그래프 만들기

 

3. 연령대 및 종교 유무에 따른 이혼율 표 만들기

 

4. 연령대 및 종교 유무에 따른 이혼율 그래프 만들기

 

 

09-9 지역별 연령대 비율 -"노년층이 많은 지역은 어디일까?"

 

# 지역 변수 검토 및 전처리하기

 

1. 변수 검토하기

 

 

 

2. 전처리

- 지역 코드를 참고해 지역명 변수를 추가하자.

 

 

+ left_join 으로 합치기

 

welfare <- left_join(welfare,list_region, id = "code_region")

#지역별 연령대 비율 분석하기

 

1. 지역별 연령대 비율표 만들기

2. 그래프 만들기

3. 노년층 비율 높은 순으로 막대 정렬하기

 

4. 연령대 순으로 막대 색깔 나열하기

 

<결과>

 

노년층 비율이 대구/경북, 강원/충북, 광주/전남/전북/제주도 순으로 높다는 것을 알 수 있다.

 

 

출처: 김영우, "쉽게 배우는 R 데이터 분석", 이지스퍼블리싱, 2017년, 244-261쪽

728x90