실제 데이터를 통해 데이터 수집부터 분석, 문제 해결까지!
데이터 과학, 엑셀 하나면 충분하다!
이 책에서 말하는 ‘데이터 과학’이란,
데이터를 이용해서 다양한 문제를 해결하는 것을 의미합니다.
이를 위해서는 데이터를 수집 및 검토하고, 통계학을 바탕으로 분석하는 과정이 필요합니다.
이 책의 목표는 데이터 분석에 입문하고자 하는 독자들이 ‘데이터 과학’을 기반으로,
누구나 쉽고 편하게 접할 수 있는 엑셀을 통해서 실제로 데이터 분석을 경험해 보는 것입니다.
프로그래밍 언어(파이썬, R)나 통계학과 관련된 지식이 없어도 괜찮습니다.
엑셀 사용 방법을 몰라도 할 수 있습니다.
허상의 데이터가 아닌 실제 조사로 수집한 공공 데이터를 통해 데이터 수집부터 분석, 문제 해결까지!
<엑셀만 알아도 할 수 있는 데이터 과학>으로 데이터 과학을 시작해 보세요.
<이 책의 특징>
<어떤 독자를 위한 책인가? >
CHAPTER 01 데이터 과학을 시작하기 전에
1.1 다양한 데이터
개별 데이터와 집계 데이터
양적 자료와 질적 자료
1.2 통계적 방법과 변수
변수와 데이터
확률변수
1.3 엑셀을 이용한 데이터 과학
셀과 셀 주소
기본적인 계산
함수를 사용하는 방법
자주 사용하는 함수
[이 장의 핵심 정리]
CHAPTER 02 데이터 모으기
2.1 데이터를 만드는 방법
조사 대상 정하기
조사 방법 고르기
표본 고르기
2.2 데이터를 모으는 방법
질문을 만드는 방법
선택지를 만드는 방법
기존 자료를 사용해서 데이터를 모으는 방법
2.3 데이터를 변환하는 방법
설문조사 조사표 점검
데이터 입력
입력 데이터의 확인
[이 장의 핵심 정리]
CHAPTER 03 데이터 정리하기
3.1 표본과 모수
표본이란?
모수란?
표본과 모수의 관계
3.2 데이터와 척도
질적 자료
양적 자료
3.3 데이터의 분포
생활 습관에 관한 설문 데이터 분포
행정구역별 건강•의료 관련 데이터 분포
[이 장의 핵심 정리]
CHAPTER 04 집계는 어떻게 하지?
4.1 데이터는 어떻게 입력하지?
데이터 입력
응답 내용
주의해야 할 점
4.2 전체 집계는 어떻게 하지?
질적 자료 집계
양적 자료 집계
[이 장의 핵심 정리]
CHAPTER 05 교차표 만들기
5.1 교차표 작성 방법
5.2 피벗 테이블 만드는 방법
5.3 단일 응답의 교차 집계
5.4 복수 응답의 교차 집계
5.5 설문의 교차 집계
[이 장의 핵심 정리]
CHAPTER 06 통계 그래프 만드는 방법
6.1 통계 그래프의 종류와 특징
원 그래프
띠 그래프
막대 그래프
꺾은선 그래프
산포도
레이더 차트
상자 수염 그림
6.2 통계 그래프 작성의 기본
엑셀에서 통계 그래프 만드는 방법
전체 집계, 교차 집계 엑셀 그래프 만들기
[이 장의 핵심 정리]
CHAPTER 07 통계학의 기초
7.1 크기의 대표값(위치 모수)
평균값과 산출 방법
중앙값과 산출 방법
최빈값과 산출 방법
평균값, 중앙값, 최빈값의 비교
7.2 산포도의 대표값
표본분산 구하기
표본표준편차 구하기
사분위범위 구하기
표준편차 비교하기
변화율
분석 도구 사용
[이 장의 핵심 정리]
CHAPTER 08 추측과 판단
8.1 측정값과 오차
8.2 대표값의 추정
평균값 추정
분산 추정
비율 추정
8.3 검정 순서
[이 장의 핵심 정리]
CHAPTER 09 평균값 비교하기
9.1 두 집단의 평균 차이 검정
9.2 두 집단의 평균 차이 검정 예시
9.3 대응표본 평균 차이 검정
9.4 집단이 셋 이상인 경우의 평균 차이 검정
9.5 집단이 셋 이상인 경우의 평균 차이 검정 예시
9.6 분석 도구를 이용한 일원배치 분산분석
[이 장의 핵심 정리]
CHAPTER 10 질적 자료 분석
10.1 연관성 측정하기
어느 정도 연관이 있는지 측정하는 지표
2×2 교차표의 경우
분류 항목이 2개 이상인 교차표의 경우
10.2 연관성 판단하기
연관이 있는지 없는지 알아내는 방법
검정 절차
10.3 데이터가 적을 때의 대응 방법
[이 장의 핵심 정리]
CHAPTER 11 양적 자료 분석
11.1 상관의 정도를 측정하는 상관계수
상관관계의 정도
상관계수 계산하기
상관계수 읽는 방법
상관 행렬 계산하기
11.2 데이터로부터 예측하는 회귀 분석
회귀 분석이란?
회귀 분석 계산하기
11.3 여러 요인을 분석하는 다중 회귀 모델
[이 장의 핵심 정리]
CHAPTER 12 공공 데이터 사용하기
12.1 출생 관련 공공 데이터
출생아 수와 조출생률
합계 출산율
12.2 사망 관련 공공 데이터
사망자 수와 조사망률
연령 표준화 사망률
[이 장의 핵심 정리]
CHAPTER 13 데이터 과학에서 실제로 발생하는 문제
13.1 표본 크기 정하기
모집단의 크기가 무한할 경우
모집단의 크기가 유한할 경우
13.2 이상치 찾아내기
변수가 하나일 경우
변수가 여러 개일 경우
13.3 빠진 데이터 보정하기
[이 장의 핵심 정리]