728x90

전체 글 186

2강 : R데이터분석을 위한 도구, 데이터프레임

3. 데이터 분석을 위한 연장 챙기기 03-1 변하는 수, '변수' 이해하기 |변수는 '변하는 수'다. 소득 성별 학점 국적 1000만원 남자 3.8 대한민국 2000만원 남자 4.2 대한민국 3000만원 여자 2.6 대한민국 4000만원 여자 4.5 대한민국 이 표에서 소득, 성별, 학점은 변수이고 국적은 상수이다. 변수는 데이터 분석 대상이고 상수는 아니다. 1. a (1+2+3)/n -> 2 1. x 함수 사용하기 * 패키지 로드하는 작업은 R 스튜디오를 새로 시작할 때 마다 반복해야 한다. 1. ggplot 패키지 설치하기 install.packages("ggplot2") 2. ggplot 패키지 로드하기 library(ggplot2) 3. 함수 사용하기 x

빅데이터 분석 기술

빅데이터는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미 빅데이터의 특징으로는 크기(Volume), 속도(Velocity), 다양성(Variety)을 들 수 있다. 크기는 일반적으로 수십 테라 바이트 혹은 수십 페타바이트 이상 규모의 데이터 속성을 의미한다. 속도는 대용량의 데이터를 빠르게 처리하고 분석할 수 있는 속성이다. 융복합 환경에서 디지털 데이터는 매우 빠른 속도로 생산되므로 이를 실시간으로 저장, 유통, 수집, 분석처리가 가능한 성능을 의미한다. 다양성(Variety)은 다양한 종류의 데이터를 의미하며 정형화의 종류에 따라 정형, 반정형, 비정형 데이터로 분류할 수 있다. [네이버 지식백과] 빅데이터란? (국립중앙과학관 - 빅..

빅데이터/정보 2019.03.20

제 2강: Computer System & OS Software

OS의 종류에는 윈도우즈, 리눅스, ios 등이 있다. OS는 사용자가 컴퓨터를 다루기 쉽게 해주는 인터페이스다. 출처: 광주과학기술원, https://gist.edwith.org/computer-systems/lecture/40784/ 강의를 들으면서 느낀 점은 우선 어렵다는 것이다. 현재 리눅스라는 과목을 배우며 리눅스에 대해서는 어느 정도 알고 있었는데 리눅스가 실행되는 방식에 대해서는 처음 알았다. 하드웨어적인 부분에서는 어려운 것 같다.

1강: 타이타닉호의 비극, 빅데이터 분석도구 R이란?, 빅데이터 분석 IDE R Studio

*타이타닉호에 승선했던 실제 인명 자료를 통하여 객실등급(class), 성별 그리고 나이에 따른 생존율 분석 -1등급 객실과 Coach 객실 승객 생존율을 분석하기 위 결과를 보면 Coach 승격 1,876 명중에 27%가 생존했으며 1등급 승객은 62%가 생존함 -성별에 따른 분석하기 여성은 73%, 남성은 21%가 생존하였음 -나이에 따라 분석하기 Adult 는 18세 이상으로 분류하였음. 성인은 31%, 아이는 52%가 생존하였음. 출처: https://m.blog.naver.com/jiehyunkim/205591243 01 안녕, R? 01-1 R이 뭔가요?- R 이해하기 *R: 데이터를 분석하는 데 사용되는 소프트웨어 *R이 쓰이는 곳: 통계분석, 머신러닝 모델링, 텍스트 마이닝, 소셜 네트워크..

제 1강: What is Computer System?

컴퓨터 시스템이란 무엇일까? *시작하기 전에 알아야 할 기본적인 단어! Compute: 계산하다 ->현재: 처리하다 Networking: 연결되어 있는 것 Storage: 컴퓨터 프로세서가 접근할 수 있도록 테이터를 전자기 형태로 저장하는 장소 *컴퓨터란? 데이터를 갖다가 저장하고 처리할 수 있는, 그리고 이거를 2진이라고 하는 0,1 단위를 가지고 저장하고 처리할 수 있는 전자기적인 디바이스 *CPU 내부 CPU는 현재 멀티 코어 프로세서를 사용한다. 컴퓨터 시스템의 변화 *컴퓨터가 작아질 수 있던 이유? 개별적인 요소들을 이어 붙인 형태 -> 시스템칩으로 통합되는 형태 *메모리, 스토리지 -메모리: 데이터가 올려져 있어 데이터를 볼 수 있음, 저장보다는 사용하는 것에 가까움 -스토리지: 데이터 저장 ..

728x90