728x90

수업후기/데이터 분석 도전! 문제풀이 5

혼자 해보기: 충청북도 보은군_감염병 발생 정보_2015기준

각 질병별로 얼마나 발생하였을까?(충청북도 보은군, 2015년) 1. 데이터 불러오기 https://www.data.go.kr/dataset/3071216/fileData.do 공공데이터포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다. www.data.go.kr 에서 데이터를 다운 받기 2. 복사본 만들기 3. head() 로 앞부분 보기 4. 감염병명 변수 검토하기 5. 계 변수 검토하기 6. 평균표 만들기 7. 그래프 만들기 2015년에 충청북도 보은군은 쯔쯔가무시증이 제일 많았고 다음이 수두 다음이 산모B..

혼자 해보기: 범죄종류에 따른 혼인관계

1. 데이터 불러오기 *데이터는 https://www.data.go.kr/dataset/3074470/fileData.do 공공데이터포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다. www.data.go.kr 에서 다운 받기 2. dplyr 불러오기 (전처리하는 데에 필요함) 3. 데이터 복사본 만들기 #복사본 만들기 crime '범죄대분류'라는 변수가 범주형 변수라는 것을 알 수 있다. 5. 그래프 그려보기 library(ggplot2) qplot(crime$범죄대분류) 6. 혼인관계: 유배우자 변수의 타입 ..

혼자 해보기: 차량 사고 유형별 교통사고 통계

1. 데이터 불러오기 데이터 출처: data.go.kr 2. 전처리 3. 복사본 만들기 4. '사고유형대분류' 변수 검토하기 -> 이상치가 없음 5. 모양 보기 qplot(acc$사고유형대분류) 6. '합계' 변수 검토하기 7. 교통사고 유형별 합계 평균표 만들기 8. 그래프 만들기 차대차가 제일 높은 비율로 사고가 일어나며 건널목 사고가 제일 적게 일어난다는 것을 알 수 있습니다.

R데이터 분석도전! -2탄

문제: 미국 동부중부 437개 지역의 인구통계 정보를 담고 있는 midwest 데이터를 사용해 데이터 분석문제를 해결하여 보자. midwest 는 ggplot2 패키지에 들어 있다. 문제1: popadults는 해당지역의 성인 인구, poptotal은 전체 인구를 나타냅니다. midwest 데이터에 '전체 인구 대비 미성년 인구 백분율' 변수를 추가하세요. #데이터 불러오기 midwest %를 사용하기 위해 library(dplyr) 꼭 해주기 midwest % mutate(ratio_child=(poptotal-popadults)/poptotal*100) 문제2: 미성년 인구 백분율이 가장 높은 상위 5개 country의 미성년 인구백분율을 출력하세요. 문제3: 분류표의 각 기준에 따라 미성년 비율 등..

728x90