다양한 생활 데이터로 쉽게 배우는 데이터 과학
데이터에서 가치를 발견하고 이를 문제 해결에 활용하는 데 관심이 많은 사람들을 위한 데이터 과학 입문서입니다. 프로그래밍 경험이 전혀 없어도 시작할 수 있도록 R의 기본 사용법부터 데이터 과학의 주요 주제인 데이터 정제와 가공, 시각화, 모델링과 예측까지 충실히 설명합니다. 데이터 과학 학습을 위한 전형적인 데이터뿐만 아니라 현실감 있는 다양한 생활 데이터도 다양하게 실습해볼 수 있어 스스로 더 재미있는 데이터를 찾아 활용할 수 있는 기초 체력도 다질 수 있습니다.
부/장별 요약
Chapter 01 데이터 과학 알아보기
01 데이터 홍수 시대
02 데이터 과학 열풍
03 데이터 과학이란?
04 데이터 과학의 절차
4.1 세상과 상호작용하는 데이터 과학
4.2 이 책에서 다루는 범위와 내용
05 데이터 과학 관련 분야
06 데이터 과학 자원
6.1 데이터 저장소
6.2 온라인 교육 사이트
6.3 소프트웨어 도구
6.4 R 공식 문서
역사 속의 데이터 과학
단원문제
Chapter 02 데이터 과학으로 풍덩
01 도구 챙기기
02 데이터와 친해지기
03 데이터 시각화 맛보기
04 데이터 과학 학습을 위한 좋은 습관 알아보기
4.1 도움말 청하기
4.2 익숙해지기
4.3 점증적으로 생각하기
4.4 좋은 도구 쓰기
05 좋은 도구 익히기
5.1 통합 개발 환경
5.2 스크립트 창에서의 코딩
5.3 작업 디렉토리의 지정
5.4 라이브러리의 활용
06 데이터와 더 친해지기
6.1 사랑스런 iris 데이터
6.2 돈을 벌어주는 tips 데이터
나는 아마추어 데이터 과학자?
단원문제
Chapter 03 R의 데이터형과 연산
01 데이터의 저장과 처리
02 변수
03 데이터형
04 연산자
05 벡터
5.1 벡터 생성
5.2 벡터 연산
5.3 벡터 연산에 유용한 함수
06 배열(행렬)
6.1 배열 생성
6.2 배열 연산
6.3 배열에 유용한 함수
07 데이터 프레임
7.1 데이터 프레임 생성
7.2 데이터 프레임 요소에 접근
7.3 데이터 프레임에 유용한 함수
08 리스트
8.1 리스트 생성
8.2 리스트 요소에 접근
8.3 리스트에 유용한 함수
유용한 R 스튜디오 사용법
단원문제
Chapter 04 데이터 취득과 정제
01 파일 읽고 쓰기
1.1 파일 읽기
1.2 파일 쓰기
02 데이터 정제를 위한 조건문과 반복문
2.1 조건문
2.2 반복문
03 사용자 정의 함수 : 원하는 기능 묶기
04 데이터 정제 예제 1 : 결측값 처리
05 데이터 정제 예제 2 : 이상값 처리
미국 명문 대학교의 데이터 과학에 대한 인식
단원문제
Chapter 05 데이터 가공
01 데이터 가공이란?
02 베이스 R을 이용한 데이터 가공
03 dplyr 라이브러리를 이용한 데이터 가공
04 데이터 가공의 실제
4.1 방대한 데이터 요약
4.2 모델링을 위한 가공
4.3 데이터 구조 변경
데이터 가공의 의의
단원문제
Chapter 06 데이터 시각화
01 데이터 시각화란?
1.1 데이터 시각화의 필요성
1.2 시각화의 기본 요소
02 시각화의 기본 기능
2.1 많은 양의 데이터를 효과적으로 관찰
2.2 데이터를 여러 관점에서 보게 함
03 시각화 도구
3.1 베이스 R
3.2 시각화에 특화된 ggplot2 라이브러리
04 시각화를 이용한 데이터 탐색
시각화는 왜 할까?
단원문제
Chapter 07 모델링과 예측 : 선형 회귀
01 모델링과 예측이란?
1.1 간단한 예로 알아보기
1.2 데이터 과학 세계의 모델링과 예측
02 현실 세계의 모델링
03 단순 선형 회귀
04 단순 선형 회귀의 적용 : cars 데이터
05 모델의 통계량 해석
06 다중 선형 회귀
07 다중 선형 회귀의 적용 : trees 데이터
t-검정과 분산 분석
단원문제
Chapter 08 일반화 선형 모델
01 일반화 선형 모델은 왜 필요한가?
02 일반화 선형 모델
2.1 단순 데이터에 적용
2.2 실제 데이터에 적용 : Haberman survival 데이터
2.3 특징 선택
03 로지스틱 회귀
04 로지스틱 회귀의 적용 : UCLA admission 데이터
05 로지스틱 회귀의 적용 : colon 데이터
과잉적합
단원문제
Chapter 09 분류를 위한 모델
01 회귀와 분류
02 결정 트리의 원리
03 결정 트리 함수의 사용
04 결정 트리의 해석
05 랜덤 포리스트
06 SVM과 k - NN
07 분류 모델의 다양한 적용
7.1 UCLA admission 데이터
7.2 colon 데이터
7.3 voice 데이터
7.4 성능 측정에 대한 고찰
기계 학습
단원문제
Chapter 10 모델의 성능 평가
01 예측 오류는 왜 발생하나?
02 정확률
03 일반화 능력 측정
04 교차 검증
05 모델 선택
06 정밀도와 재현율
07 ROC 곡선과 AUC
단원문제
Chapter 11 텍스트 마이닝
01 텍스트 마이닝 기초
02 DTM 구축
03 단어 구름
04 문서 분류
05 영어 텍스트 마이닝을 이용한 한국어 처리
06 KoNLP를 이용한 한국어 텍스트 마이닝
트위터 API를 이용한 말뭉치 얻기
단원문제
Chapter 12 구글 플레이 스토어 앱 데이터를 이용한 실전 프로젝트
01 프로젝트 소개
02 데이터 정제
03 탐색적 데이터 분석
04 모델링과 예측
FAMILY 앱이 대세?
단원문제
자료명 | 등록일 | 다운로드 |
---|---|---|
예제소스(From CDN) | 2024-12-05 | 다운로드 |
예제소스(from GDrive) | 2024-12-05 | 다운로드 |
우와후지 이치로우 , 니시카와 히로아키 , 아사쿠라 마사미 , 모리모토 에이이치
피터 브루스 , 앤드루 브루스
비즈니스를 위한 데이터 과학 : 빅데이터를 바라보는 데이터 마이닝과 분석적 사고
포스터 프로보스트 , 톰 포셋
필드 케이디