메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

이것이 데이터 분석이다 with 파이썬

파이썬으로 배우는 데이터 분석 입문 (동영상 강의 무료 제공 / 판다스, 넘파이, Matplotlib 활용)

한빛미디어

집필서

판매중

  • 저자 : 윤기태
  • 출간 : 2020-02-10
  • 페이지 : 360 쪽
  • ISBN : 9791162242513
  • 물류코드 :10251
초급 초중급 중급 중고급 고급
4.7점 (25명)
좋아요 : 7



실생활 예제로 쉽게, 단계별 분석에 따라 구조적으로 배우는 데이터 분석 입문서

데이터를 다루는 데 언어나 라이브러리는 도구일 뿐입니다. 진짜 중요한 것은 문제해결 능력입니다. 이 책은 주어진 문제를 어떻게 단계적으로 접근하면 좋을지에 대해 독자 친화적으로 가이드를 주는 책입니다. 프로그래밍 기초 지식만 있다면 통계에 대한 지식이 전혀 없는 비전공자도 데이터 분석에 입문할 수 있도록 쉽게 풀어썼습니다.

 

종합 예제를 통해 학습 내용을 입체적으로 실전에 적용해본다. 

중고 휴대폰 거래 가격 예측, 구매 데이터를 분석하여 상품 추천하기 등 종합적인 예제를 통해 앞에서 배운 내용을 입체적으로 실전에 적용해 볼 수 있습니다. 또 기본적인 데이터 전처리 및 시각화, 그리고 결과 회고에 이르기까지의 분석 사이클을 일정 수준까지 경험할 수 있습니다.

 

 

어떤 독자를 위한 책인가?

  • 라이브러리를 사용하는 프로그래밍을 경험해본 사람
  • 데이터 분석에 대해 어렴풋이 들어봤지만 제대로 공부해본 경험이 없는 사람
  • 입문자에게 중요한 분석 포인트를 알고 싶은 사람

 

 

이 책의 특징

 

① 데이터 분석의 이론보다는 ‘흐름’을 담았습니다. 

이 책은 데이터 분석 이론, 혹은 라이브러리 사용법을 아주 자세히 설명하지는 않습니다. 그 이유는 데이터 분석으로 문제를 해결하는 과정 자체에 집중하기 위함입니다. 따라서 필수적으로 다뤄야 할 이론에서는 최대한 수식을 배제하고 직관적인 설명만 담았습니다.    

   

② 단계별/반복적으로 학습하며 데이터 분석을 체계적으로 배울 수 있습니다. 

데이터 분석을 각 step별로 단계적으로 배울 수 있도록 구성했습니다. 각 Chapter에서는 대표적인 데이터 분석 방법 하나씩을 다룹니다. ‘비트코인 시세 예측’, ‘우리나라는 술을 얼마나 독하게 마실까’ 등 흥미로운 예제를 기반으로 데이터 분석을 체계적으로 학습할 수 있습니다. 

.

③ 저자 직강 동영상 강의 무료 제공

https://www.youtube.com/user/HanbitMedia93

한빛미디어 유튜브 채널에서 『이것이 데이터 분석이다 with 파이썬』의 저자 직강 동영상도 만나보세요! 공부하다가 막힐 땐 각 강좌의 댓글에 질문을 남기면 저자가 직접 답변을 달아드립니다.

 

상세이미지_이것이데이터분석이다_700.jpg

 

저자

윤기태

아주대학교 미디어학과를 졸업하였으며, 패스트 캠퍼스에서 파이썬과 데이터 분석을 주제로 강의하였다. 현재는 이커머스 분야에서 추천시스템을 만드는 머신러닝 엔지니어로 일하고 있다. 주로 랭킹 모델링과 분산처리를 고민하는 데 시간을 보내는 편이다. 데이터 분석과 개발이 취미이지만 취미보다는 노는 것이 더 좋다. 특히 영화를 아주 좋아해서 돈만 준다면 밥도 안먹고 영화만 볼 수도 있다. 그래서 최근에는 영화를 보며 돈을 벌 수 있는 방법을 고민하고 있다. 글쓰는 것도 좋아해서 블로그((https://yamalab.tistory.com)에 이것 저것 쓰고 있으며, 주로 데이터 분석에 대한 글을 쓴다.

Chapter 00. 들어가기 전에

0.1 개발환경 구축하기

0.2 데이터 분석을 위한 라이브러리

 

Chapter 01. 데이터에서 인사이트 발견하기 

1.1 탐색적 데이터 분석의 과정

1.2멕시코풍 프랜차이즈 chipotle의 주문 데이터 분석하기

1.3국가별 음주 데이터 분석하기

연습문제

 

Chapter 02. 텍스트 마이닝 첫걸음

  2.1 웹크롤링으로 기초 데이터 수집하기 

2.2 나무위키 최근 변경 페이지 키워드 분석하기

2.3 특정 키워드가 있는 게시물 크롤링을 위해 API 사용하기

2.4 트위터 API로 ‘손흥민’과 연관된 키워드 분석하기

연습문제

 

Chapter 03. 미래를 예측하는 데이터 분석

3.1 프로야구 선수의 다음 해 연봉 예측하기

3.2 비트코인 시세 예측하기

3.3 미래에 볼 영화의 평점 예측하기

연습문제

 

Chapter 04. 데이터 분류 모델

4.1 타이타닉의 생존자 가려내기

4.2 강남역 맛집 리뷰로 알아보는 감성 분류 

연습문제

 

Chapter 05. 데이터 분석 종합 예제 

5.1 중고나라 휴대폰 거래가격 예측하기

5.2 구매 데이터를 분석하여 상품 추천하기

  • 데이터 분석이 가장 요즘 뜨거운 Topic이 아닌가. 

     

    데이터 사이언티스, 데이터 분석, 데이터 인사이트, 데이터 경제 등등 다양한 포장을 쓰고 있다. 

     

    이 분야에 공부를 시작할 때 가장 두번째  만나기에 좋은 책을 소개한다. 

     

    두번째라고 표현한 이유는 '기초', 베이직 서적으로는 제격이 아니였다. 

     

    흔히들 프로그래밍 언어 도서를 시작할때는, 'Hello World'를 Output 하기위한 설치과정, 실행과정을 

     

    친절하게 설명하지만, 이 책은 그렇지 않다. 

     

    개념설명보다는 충실히 데이터 분석 절차와 인사이트를 얻는데 충실하다보니...

     

    최소한 다른 언어를 개발을 해본 사람이나, 개념설명보다는 바로 결과를 확인해보고싶은 분에게 좋을 거같다.

     

    실제로 도서에는 깃허브를 통해서 소스를 제공하고, 저자의 강의를 무료로 동영상으로 볼수있기때문에

     

    이 한권으로 데이터 분석의 개념과 단계를 이해할 수 있는 두번째 기본서로 활용하면 좋을거같다. 

     

    다만, 프로그램을 처음 해보는 사람에게는 실행과정의 내용을 좀더 풍성하게 담았다면, 더할 나위 없이 좋은 기본서였을거같다는 아쉬움이 있다.  

     

    - 추천대상 : 데이터분석 초보자

    - 기초지식필요 : 프로그램 실행 경험

    - 난이도 : 초급자(다만, 프로그래밍 기본이 필요함 - 프로그램 실행할 수 있는 수준) 

    - 이동성 : 두께와 사이즈가 있어 이동성은 어려움(360p) 

     

  • 예전부터 빅데이터, 데이터 마이닝, 머신 러닝 등에 대해 공부하고 싶었지만 쉽지가 않았다. 관련 책들을 보기도 했지만 난해한 수식과 용어들로 인해 내용이 잘 이해가 되지 않았다. 그러던중 우연한 기회에 한빛미디어 서평 이벤트를 통해 이 책을 접하게 되었다.

     

    이 책은 기본적으로 파이썬에 대한 사전 지식을 가지고 있는 데이터 분석 입문자를 대상으로 하고 있다. 개인적으로 회사에서 파이썬을 사용하고 있는 관계로 책의 내용을 따라 하는데 큰 무리는 없었다. 특히 이 책은 구체적인 이론이나 난해한 개념 설명보다는 "데이터 분석이란 이런 과정으로 진행된다"는 큰 흐름을 보여주고 있기에 전반적인 내용을 이해하는데 많은 도움이 되었다. 특히 일상 생활에서 흔히 접할 수 있는 데이터(영화 평점, 야구 선수 연봉, 비트코인 가격 등)들을 입력해서 분석하고 그 결과를 토대로 미래의 결과를 예상하는 과정을 보여주기 때문에 비슷한 성격의 데이터만 수집할 수 있다면 바로 실무에 적용 가능하겠다는 생각이 들었다.

     

    책의 구조에 대해 알아보자면 각 장의 시작마다 핵심 개념을 간략히 잘 정리하고 있어서 독자가 이번 장에서는 무엇을 배우는데 집중해야 하는지를 미리 알 수 있다. 각 분석 예제의 마지막에는 "표로 정리하는 데이터 분석" 항목을 통해 데이터 분석의 핵심 내용과 결과를 한눈에 파악할 수 있다.

     

    데이터 분석은 다음의 단계로 이루어진다.

    1. 데이터 수집하기

    2. 데이터를 분석하기 좋은 형식으로 가공하기 (데이터 전처리)

    3. 수집된 데이터를 데이터 분석 라이브러리로 읽어 들이기

    4. 데이터 분석하기

    5. 분석된 결과 사용하기: 유의미한 결과 추출하기, 미래 예측

     

    이 책의 특징은 다음으로 요약할 수 있겠다.

    * 데이터 분석을 처음 시작하는 사람들을 위한 입문서 (단 파이썬에 대한 사전 지식 필요)

    * 친숙한 예제를 통해 데이터 분석 과정을 쉽게 따라해볼 수 있다.

    * 배경 지식이 없어도 데이터만 가지고 있다면 데이터 분석을 쉽게 적용해볼 수 있다.

    * 데이터 분석에 대한 용어나 알고리듬에 대한 상세한 설명은 없으므로 깊이 있는 내용을 원하는 독자들은 책에 언급된 용어를 바탕으로 추가적인 학습이 필요하다.

     

     

  • 저자는 원래 데이터 분석을 지망하는 사람이 아니라, 디자이너를 지망하던 사람이었다.

    우연히 인턴쉽 과정에서 웹 개발 업무를 통해 파이썬을 익혔고 요즘 유행하는 데이터 분석 라이브러리를 접하면서 데이터 분석에 입문하게 되었다.

     

    그 만큼 데이터 분석에 입문하며 우여곡절을 많이 겪으며 이런 내용이 들어있다면 참 알기 쉬었을 텐데 라는 의문을 종종 갖곤 했다고 한다. 이 책은 그런 저자의 의문점들이 심사숙고되어 쉽게 풀이되어 나온 책이라고 볼 수 있다. 이 책을 통해 우리는 더이상 맨땅에 헤딩하듯 입문하지 않아도 된다는 얘기이다.

     

    특히 이런 사람들에게 이 책을 추천한다.

    - 프로그래밍 유 경험자

    - 데이터 분석에 초보자

    - 단순히 따라하는 것이 아닌 분석의 흐름을 공부하고 싶은 자

    - 실생활 예제를 다루고 싶은 자

     

    이 책에 등장하는 예제는 모두 깃허브(Github)를 통해 공유 저장소에 올려져있어서 언제든

    직접 실행 가능하다.

     

     

    데이터 분석 용어의 하나하나, 파이썬 함수 또는 라이브러리 함수의 하나하나를 모두 설명하며

    진행하고 있기 때문에 책을 읽으며 별다른 의문거리를 갖을 거리가 없다고 해도 과언이 아니다.

     

    직접 인터넷에서 웹크롤링을 함께 진행하고 그 데이터들을 통해 학습을 진행하기 떄문에,

    앞으로도 필요한 데이터 분석 주제가 있다면 직접 웹크롤링을 하여 얼마든지 분석을 하기에

    용이하다.

     

    수식없이 실생활과 밀접한 데이터를와 직관적인 설명으로 데이터 분석을 배우고 싶은 분들이

    읽으면 꼭 도움이 되리라 생각한다.

  •  

    데이터분석과 파이썬 이것을 일거양득이라고 한다.

     

    한빛미디어 사이트의 장점은 바로 미리보기, 미리 맛보기라는 것이다.

    책을 구매하기 전에 어느정도 책과 동일한 느낌의 서비스로 이 책을 사게되는 구매력을 확보하게 됨이다.

    미리보기를 나름 엮어본다.

    1.gif

    http://m.hanbit.co.kr/store/books/book_view.html?p_code=B2717499992

     

     

    22.jpg

    모바일 페이지

    23.jpg

    실제 한빛미디어 미리보기의 구성

    한빛미디어 미리보기가 여느 출판사 정보보다 정교하고, 깔끔하다. 진정한 전자책, 웹북 느낌이라는 것이다.

    일단 도서마다 웹에서 확인이 가능하다는 것이다.

    책 넘김의 느낌이 있다.

    http://preview2.hanbit.co.kr/books/jnkh/

    책넘기

     

    24.jpg

    지은이의 글

    25.jpg

     

    26.jpg

    일러두기

    27.jpg

    이런 사람이 보면 좋습니다.

     

    28.jpg

    나름 책의 구성이 탄탄하다. 구성하나가 책의 진도를 빼는데는 가장 큰 도움이라는 것이다.

    어릴적 전과라는 것이 있었다. 자율학습모드를 지원하는 구성이다.

    29.jpg

     

    30.jpg

    요새는 대세가 유튜브 강의라는 것이다.

    31.jpg

    목차

    32.jpg

     

    33.jpg

     

    34.jpg

     

    35.jpg

     

    36.jpg

    인사이트

    37.jpg

    실제 책의 내용

    38.jpg

     

    39.jpg

     

    40.jpg

     

    41.jpg

     

    42.jpg

     

    43.jpg

     

    44.jpg

     

    45.jpg

    46.jpg

     

    실제 책으로 만나보는 데이터 분석

    51.jpg

    이론보다 흐름 자가학습, 자율학습이 포인트이다.

    52.jpg

     

    53.jpg

     

    54.jpg

     

    55.jpg

    재미나는 주제

    중고나라 휴대폰 거래가격 예측하기

    56.jpg

    STEP-1 탐색적 분석 : 중고나라 데이터 분석하기

    57.jpg

     

    58.jpg

    STEP2 피처 엔지니어링 : 예측 모델 개선하기

    59.jpg

    STEP3 예측 : 중고 휴대폰 거래가 예측하기

    60.jpg

    STEP4 프로토타입

    61.jpg

     

    또다른 재미나는 아이템

    62.jpg

    63.jpg

     

    데이터분석 기반의 책이기에 여러모로 도움이 된다. 게다가 언어는 파이썬이다.

    요새 가장 많이 사용하는 파이썬에 데이터 분석까지 언급되어 있고, 책 구성도 도움이 되는 책이다.

  • 600IMG_6092.png

     

    빅데이터는 이제 누구나 아는 단어가 되었다. 그만큼 눈부신 빅데이터의 다양한 활용과 기술적 발전으로 인해, 더욱 포괄적인 개념인 데이터 과학이 주목을 받게 되었다. 데이터 과학은 데이터를 분석하기 위해, 프로그래밍 기술, 수학, 통계학, 패턴인식, 기계학습, 데이터베이스 등의 여러 분야를 융합하여 이용하는 과학이다.

     

    사실 데이터 과학이라 부르다 보니, 좀 생소할 뿐이지, 영역을 좁고 쉽게 생각해 보면, 그냥 과거부터 해왔던 인구 통계 조사나 제품 마케팅 분석, 소비자 패턴 분석과 같은 데이터 분석을 떠올리면 된다. 다만 이제는 좀 더 세련된 각종 기술을 사용한다는 차이가 있다.

     

    그런데 데이터 과학이 왜 최근 들어 인기를 끌고 있는가 하면, 데이터 과학이 적용되는 분야가 의학, 공학, 일반 과학뿐만 아니라, 사회학, 도시공학, 경제학 등 각종 인문과학에도 쓰이고 있으며, 많은 기업들이 데이터 과학의 기술을 적용하고 있기 때문이다. 그만큼 수요가 계속 늘고 있는 분야인 것이다.

     

    하지만 데이터 과학은 앞에서 말했듯이 복합적 기술을 필요로 하기에 익히기가 어렵다. 게다가 이론을 어느 정도 습득했다고 해서, 다 되는 게 아니다. 분석하고 적용하는 실무 능력도 필요하다. 그러나 이런 실무 능력은 쉽게 길러지지 않는다. 특히 그것을 기를 참고할 책들이 그리 많지 않다.

     

     

    600IMG_6096.png

     

    다행스럽게 이번에 본 '이것이 데이터 분석이다 with 파이썬'는 바로 그런 데이터 분석 실무를 익히는데 도움이 되는 책이었다. 처음엔 그냥 빅데이터 분석이나, 그래프 그리고, 평균이나 구하고, 키워드 시각화 방법 정도 배우는 주로 응용 스킬을 다루는 책으로 생각했는데, 보다 보니, 그보다는 데이터 분석 응용이라는 근육을 트레이닝으로 키워주는 책이었다.

     

     

    600IMG_6098.png

     

    각 주제들은 대략 3, 4단계로 나눠 생각한다. 우선 주어진 데이터를 들여다보면서, 데이터 가공을 어떻게 할 거며, 그것을 어떻게 프로그래밍할지, 생각해보고, 다음 단계로 분석 방법, 시각화 방법을 정한다. 그리고 이어진 단계에서 라이브러리 활용이나 수학 기법 개선을 해보기도 하고, 더욱 다양한 결과 도출과 시각화를 해본다. 최종적으로는 만들어진 모델을 검증 또는 평가도 해본다. 여기에 중간에 나오는 퀴즈와 챕터 끝에 나오는 연습문제를 통해 배운 것을 점검하고 다시 응용도 해보게 된다.

     

    점진적 단계별로 배워 나가는 구성과 함께 마음에 드는 점은 분석 주제들이다. 멕시코풍 프랜차이즈 요리 분석은 실제 음식점 메뉴나 가격 책정 같은 데 도움이 될 수 있는 주제다. 국가별 음주 데이터 분석은 주제만 바꾸면 얼마든지 다양한 국가 비교 주제가 될 수 있다. 프로야구 선수의 다음 해 연봉 예측이나 비트코인 시세 예측은 증권 분석 또는 제품 판매 예측 등에도 쓸 수 있을 것이다. 이와 같이 이 책에는 현실적이고 재미난 분석들이 많다. 실전 내공을 높이는데 도움 되는 주제들이라, 배운 거 얻다 써먹지 고민할 필요 없는 책이다. 

     

     

    600IMG_6094.png

     

    '이것이 데이터 분석이다 with 파이썬'에서는 파이썬이란 프로그래밍 언어를 이용하고, 판다스, 넘파이, Matplotlib를 활용한다. 기본 설치 방법은 챕터 0에서 알려주고 있긴 하지만, 파이썬 언어 자체를 책에서 가르쳐 주고 있지 않으므로 이 책을 이해하기 위해서는 최소 파이썬을 다룰 줄 알아야 한다. 부제로 '파이썬으로 배우는 데이터 분석 입문'이라고 되어 있지만, 어디까지나 데이터 분석 입문이지, 파이썬 입문 책은 아니라는 것이다. 아울러 책에서 중간중간 설명도 되어 있고, 분량 면에서 많이 다루지는 않지만, 그래프와 통계학에 대한 이해가 있으면 더욱 좋다. 물론 본문에 수식이 나오거나 계산하고 그런 것은 없으므로 부담 가질 필요는 없다. 어디까지나 도움이 된다는 정도다.

     

    어쨌든 입문 책이라지만, 난이도가 어느 정도 있는 책이다. 여러 번 읽어가며, 직접 코딩하며 테스트하는 것이 가장 빠른 지름길이라 생각한다. 그리고 한빛미디어 유튜브를 통해 저자의 직강도 볼 수 있으므로, 그것을 함께 참고하며 공부하면 도움이 될 것이다.

     

    분석의 기술적 방법은 일종의 기교로 얼마든지 익힐 수 있지만, 정답을 도출해 내는 데이터 분석은 절대 쉽게 할 수 있는 일이 아니다. 잘못된 데이터 분석은 기업에는 치명적인 손해를 끼칠 수 있고, 연구를 신뢰하지 못하게 만들 수 있다. 그런 오류를 줄여 나가는 방법은 역시 경험 밖에 없다고 생각한다. 

    '이것이 데이터 분석이다 with 파이썬'은 그러한 경험을 쌓는데 바른 첫걸음을 내딛게 해주는 책인 것이다.

     

  • 요즘들어서 데이터를 가지고 하는 일들이 많아졌다. 소위 "빅데이터"의 시대인만큼 어마어마하게 수집된 데이터들 사이에서 남들이 발견하지 못한 insight를 찾고자 하는 사람들도 많아지고, 수요도 늘었다. 물론 이 insight를 부여하는 것을 사람에 따라서 다르게 수행하고 있다. 어떤 사람은 데이터들 사이에서 특징을 잘 추출할 수 있도록 정리해주는 일을 할 수도 있다. 이해당사자들에게 데이터가 가진 의미를 잘 설득할 수 있도록 시각화를 하는 일도 있고, 아마 요새 가장 핫한 일이겠지만, 이런 데이터에 머신러닝이나 딥러닝 같은 인공지능을 적용해서 미래의 일을 예측하거나, 최적화된 동작을 수행하도록 개발하는 일이 있을 수 있다. 이렇게 언급한 업무들 모두 본질적으로는 탐색적 데이터 분석, 조금더 나아가면 Exploratory Data Analysis (EDA)가 필요한 업무들이다. 데이터 분석없이 특징을 찾고 정리할 수 있을까? 데이터의 본질을 이해하지 못한 상태에서 인공지능을 통해서 뭔가를 예측할 수 있을까? 개인적으로도 EDA는 데이터를 가지고 하는 일 중 가장 기초이면서도 핵심이라고 생각한다.

     그런데 기초라고 말하면서도 항상 새로운 데이터를 살펴보면, 어떤식으로 데이터를 분석해야할지 항상 고민하고 있다.그래서 요새 통계쪽이나 확률 강의를 많이 듣기도 하고, kaggle에 공개된 다양한 type의 dataset도 살펴보면서 경험을 쌓고 있다.

     

    그림 1. 이것이 데이터 분석이다 with 파이썬

     

     이번에 소개할 책은 Python으로 데이터 분석하는 방법에 대해서 소개한 책이다. 아마 데이터 분석에 관심있는 사람은 서점이나 도서관에 가보면 알겠지만, 데이터 분석에 대해서 소개하고, 가르치는 책들이 정말 많다. (대충 Data Analysis로만 검색해도 500여종 정도 나오는 것 같다.) 그래서 그 책들 중에서 딱 한권을 고르자니 기준이 참 막막하다. 어떤 책은 Pandas나 Numpy, Matplotlib의 사용법에 대해서 소개하는 반면, 또다른 어떤 책은 통계나 확률 이론적으로 접근한 데이터 분석 이론을 소개한다. 어떤 책은 R로 가르치는 책도 있고, 다른책은 Visualization에 치중해서 가르치는 책도 있다.

     이 책은 철저하게 실습 위주의 책이라고 볼 수 있다. 물론 초반부에 예제 등으로 통해서 library의 사용법이나 이론을 소개하고 있지만, 책의 대부분을 실제 데이터를 활용해서 분석하고, 시각화하는데 할애하고 있다. 중간중간에 부족한 부분은 간단한 노트등을 통해서 소개하고 있다. 크게 이 책을 통해서 다루고 있는 실제 예제는 다음과 같다.

    • 국가별 음주 데이터 분석
    • 프로야구 선수의 다음해 연봉 예측
    • 비트코인 시세 예측
    • 영화 평점 예측
    • 타이타닉 생존자 특성 분석
    • 강남역 맛집 리뷰의 중요 키워드 분석
    • 중고나라 휴대폰 가격 예측

     대부분의 예제들이 실제의 공공 데이터 등을 바탕으로 실습하는 방향으로 구성되어 있어, 이런 방향으로 데이터를 다뤄보고 싶은 사람한테는 좋은 실습 교재가 될 수 있다. 특히 키워드 분석과 같이 언어처리도 같이 다뤄진 예제나, 비트코인 시세 예측과 같이 Time-series data analysis 방면으로도 공부할 수 있는 예제는 서두에서 언급했던 EDA의 전반적인 내용을 다 다룰 수 있는 것이 이 책의 장점이 아닐까 생각한다. 나같은 경우에도 현업에서 필요했던 시계열 데이터 분석 부분이나 시각화 관련 기법은 이 책에서 조금 참고해서 도움을 받았던 것 같다.

     

    그림 2. 유튜브 강의 제공

     

     소소하게 장점이라고 할 수 있는 부분은 저자 직강(링크)이 제공된다는 점이다. 물론 요새는 좋은 MOOC도 많이 공개되어 있긴 하지만, 책과 관련된 내용에 대해서 직접적으로 가르치는 리소스가 있는 부분은 책을 통해서 학습하는 독자에게는 좋은 교육자료가 제공된다.

     물론 잠깐 언급했다시피, 시중에 정말로 많은 데이터 분석 관련 책들이 출판되어 있다. 물론 어떠한 학습 방향이 옳고, 어떤 책이 정말 좋다라고 단언하기는 어려운 부분이 있지만, 그래도 적어도 실습 위주로 학습하는 독자의 경우에는 이 책이 하나의 길잡이 역할을 할수 있다고 생각한다. 그리고 조금더 첨언하자면, 진짜 데이터 분석 경험을 계속 쌓는게 필요하다고 본다. 그래서 남들이 kaggle같은 곳에 만들어 놓은 EDA notebook 같은 것을 보면서 많이 배우고, 현재 데이터 분석 관련 일을 한다면 하나하나씩 적용해보는 것도 조금더 숙련된 EDA를 할 수 있지 않을까 하는 의견을 한번 가져본다.

     (참고로 조금더 고급 지식을 살펴보고 싶은 사람이라면 저자 블로그 에서도 얻는 부분이 많을것 같다.)



    출처: https://talkingaboutme.tistory.com/entry/Book-DS-Data-Analysis-with-Python [자신에 대한 고찰]

  •  

    81DA116A-D16F-438B-9A26-0CE3A69D82D5.jpeg

     

     

     

    드문드문 데이터분석 공부를 하고 있었지만 확실히 머리속에 개념이 잡히지 않음을 느끼고 있었습니다. 

     

    나는 리뷰어다 활동 중 요 책이 낙점되어서 데이터 분석의 플로우를 한번 경험해보자는 마음으로 가볍게 읽기 시작했는데 

    사실 이 책은 눈으로 읽기보다는 코드를 따라서 돌려보면서 필자의 문제해결능력을 구경하면서 공부되는 책입니다. 

     

    이 책만의 장점은 

     

    데이터 분석을 하는 사람들은 다들 알고 있고 머리속에 인스톨되어 있지만 책에는 적혀있지 않은 그런 프랙티스와 생각의 흐름이 어떻게 가야하는지가 글로 풀어져 있다고 느꼈습니다. 

     

     챕터 전체가 동영상 강의로 포함되어서 이해가 안가는 부분을 직강으로 들을 수 있으며 굉장한 장점입니다. 

     

    핵심은 시각화!인데 적재적소에 알맞은+다양한 시각화를 사용하고 있어서 책을 열심히 공부하면 정말 도움이 많이 될것입니다. 

     

     

    간단히 흐름에 대해 소개하면 

     

     - 데이터의 특성에 대해 먼저 살펴봅니다. 

         경험적으로 이 단계를 건너뛰고 뭔가를 하려고 했을 때 다시 데이터로 돌아가야했던 적이 있었는데 너무나 당연하게 챕터의 모든 시작은 데이터를 살펴보는 일입니다. 

    - 적절하게 모델링 개념을 섞어서 설명해줍니다. 

    - 평가와 검증하는 방법을 소개해줍니다. 

     

     

    문제를 보고 유형을 떠올리고 푸는 방법을 떠올리는 것이 어떻게 보면 정석이고 문제해결능력을 기르게 해주지만 실생활에서는 무엇이 문제인지조차 알 수 없는 경우가 다반사입니다.그런 중에 가끔은 거꾸로 유형과 푸는 방법을 공부하고 문제를 만나는 것이 도움이 될 때가 많은 것 같습니다. 

    시간을 들여 단계적으로 책을 끝까지 따라가면 그런 도움을 많이 얻을 수 있을것입니다.

     

  • 이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (1).jpg

     

    이것이 데이터 분석이다 with 파이썬 ( 파이썬으로 배우는 데이터분석 입문 )

     

    자바를 이용한 웹개발을 공부하다가 파이썬을 통한 웹크롤링에 관심을 가지게 되었다. 

    혼공 파이썬 도서를 통해 기본을 공부하고 보게된 두번째 도서 데이터분석. 

     

    한빛미디어 도서들 왠만한건 유튜브 동영상강의로 책과 함께 공부 가능하다. 

    데이터분석with 파이썬 본 도서도 유튜브를 통해 공부 가능하다. 멘토가 있는것과 없는것은 큰 차이가 있다 ㅎㅎ 

     

    이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (4).jpg

     

    [대상독자]

    파이썬 프로그래밍을 조금이라도 접해본 사람. 

    데이터 분석이 처음이거나 조금이라도 경험해 본 사람. 

     

    - 프로그래밍에 개념이 전혀 없거나 데이터분석에 사용되는 수학적. 통계적 개념을 깊게 이해하고 싶은 독자에게는 권장하지 않는다. 

     

     

     

    이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (6).jpg

     

    [목차]

    개발환경/분석환경 구축 →  데이터에서 인사이트 발견하기 →  텍스트 마이닝 첫걸음 →  데이터분석 →  데이터분류모델 →  데이터 분석 종합 예제를통한마무리.

     

     

     

    이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (8).jpg

     

    [분석환경 구축하기]

    도서의 0.1에 해당하는 개발환경 구축하기를 통해 설치가 어렵다면 영상강의에서 자세히 설명해 주기 때문에 훨씬 수월하게 따라할 수 있다. + 주피터 기본 사용법도 알려주신다. (동영상 채팅창과의 대화는 약간 당황스러웠다 ㅎㅎ)

     

    3가지 라이브러리와 함께하는 데이터분석

    1) Pandas -> 라이브러리를 이용하면 실행결과가 엑셀처럼 예쁘게 보인다. 

    2) NumPy -> 백터.행렬연산은 쉽게 도와줌 입문자는 쓸일이 잘 없다고.. 

    3) matplotlib -> 판다스. 넘파이로 데이터를 받아와 보기좋게 시각화. 

     

    코드 하나를 실행하고  →  이에 대한 설명을 확인하면서 도서를 공부하는것을 추천한다. 

    똑같이 실행했음에도 불구하고 오류가 나면 깃허브 예제코드를 참고하자. 

     

     

     

    이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (10).jpg

     

     

    본격적으로..

    각 단원의 앞부분에 '학습목표'를 통해 뭘 공부할지 미리 요약해 보여준다. 

    목차와 더불어 앞부분에 해당 단원에서 배우게 될 것을 미리 정리해 주니 전체적인 나무를 보고 열매를 공부하러 들어가는 느낌이라 정리가 더 잘되는것 같아 좋았다. 

     

    본격적인 강의는 탐색적 데이터분석이 어떤것인지 알아보는것으로 부터 시작된다. 

    (raw data) 데이터를 관찰하고, 특징을 발견하고, 데이터를 시각화 하고 원하는 데이터를 얻어내는 전체적인 개념을 이야기해준다. 

     

    이것이 데이터 분석이다 with 파이썬 한빛미디어 웹크롤링 (15).jpg

     

    이 책을 보고싶었던 가장 큰 이유 웹크롤링.

    '나무위키 최근 변경 페이지' 텍스트 데이터를 분석 출력하는 실전예제를 통해 웹크롤링을 배울 수 있다. 

     

    마지막 5단원에서는 2~4단원 에서 배운 데이터 분석 기술 응용을 통해 실생활에서 바로 쓰일 수 있는 예제를 실습해보게 함으로써, 지금까지의 공부 내용을 정리할 수 있도록 이끌어 주고 있다. 

     

    파이썬 프로그래밍 입문자가 따라하기에는 문제가 없다. 탄탄한 기초공사는 매우 중요하니까 ! 

    깊은 데이터 분석 보다는 실생활에서 재미를 느끼며 분석가능한 정도라 부담이 없었다. 

    역시 ~이것이 시리즈는 믿고보는 최고의 입문서. 

     

     

  • 주전공은 신문방송학이지만 우연히 관심이 생겨서 컴퓨터공학과 복수전공을 하게 되었고,

    약 2년, 그러니까 4학기의 시간 동안 C, 논리회로, 자료구조, 알고리즘 등

    다양한 컴공과의 전공과목을 수강했었지만(어쩌면 주전공보다 더... 열심히... 흑)

    학교 내에서의 수업만으로는 뭔가 충분한 경험을 쌓지 못했다는 생각이 작년 내내 들었거든요 :(

     

    그래서 휴학으로 남는 시간 동안, 평소에 관심있었지만 시간이 없어서 혹은 어려워서

    다음으로 미뤄두었던 공부를 해보려 하는데, 그 중 하나가 바로 '데이터 분석' 이에요!

     

    때마침 한빛미디어 [나는리뷰어다] 활동에 선정되어 처음으로 받게 된

    <이것이 데이터 분석이다 - with 파이썬> 책으로 데이터 분석에 발을 들일 수 있었습니다.


     

     

    책 표지를 보면,

    '실생활 예제', '단계별 분석', '구조적'이라는 말이 눈에 띄네요.

    이 책의 가장 큰 장점이라고 볼 수 있습니다.

     

    아무래도 연습에 쓰이는 예제가 너무 동떨어진 내용이다 보면 분석 툴을 손에 익히는 건 몰라도 몰입은 덜할 텐데,

    이 책의 예제들을 살펴보면

    - 국가별 음주 데이터

    - 비트코인 시세 예측

    - 강남역 맛집 리뷰

    과 같은 실생활과 밀접한, 친근한 키워드를 자주 볼 수 있어서 호기심이 가더라고요 ㅎㅅㅎ

     

    (개인적으로는 '국가별 음주 데이터'가 참 궁금했습니다 ㅋㅋㅋㅋㅋ

    과연 우리나라는 술을 얼마나 독하게 마실 지....?! 어느정도 예상은 가시겠지만 직접 분석을 통해 확인하는 걸 추천합니다^_^)

     

    또한 데이터 분석이 처음이시거나 익숙하시지 않은 분들은 그냥 데이터가 주어지면

    어떤 방향으로 분석을 진행해야 할 지 난관을 겪게 될 수도 있는데,

    그럴 땐 세부적으로 나눠진 단계별 분석을 참고해서 여러 번 따라하다 보면

    어느 순간 '여기서는 이걸 먼저 하고 저걸 알아봐야겠다'라고 생각할 수 있게 될 거에요!

    저도 그렇게 능숙해지는 날이 오길 바라며...

     

    사진 설명을 입력하세요.

     

    이 책의 또 다른 장점, 바로 동영상 강의 제공이에요!

    가끔씩은 책만 보고서는 이해하기 어려울 때가 종종 있는데,,,,

    유튜브에 책 제목으로 검색하시면 바로 강의를 찾을 수 있으니

    참고하여 함께 공부하면 시너지가 되겠죠?

     

    본격적인 데이터 분석에 앞서 나오는 페이지입니다.

    이 책을 추천할 수 있는 독자 유형고 그렇지 않은 유형을 말해주고 있네요.

    저 같은 경우는 어렴풋이 데이터 분석에 대해서만 들어보았지

    어떻게 시작해야하는지, 어떤 포인트에 중점을 둬야하는지 등등을 하나도 몰랐기 때문에

    이 책이 필요한 독자 유형이었다고 보면 되겠네요.

     

     

    다만, 밑부분에 있는 이런 사람이 보면 그다지 좋지 않을 수도 있습니다 항목 또한 주의깊게 볼 필요가 있어요.

    책 제목에서도 알 수 있듯이 이 책의 데이터 분석 과정은 모두 파이썬 프로그래밍을 기반으로 합니다.

    알고리즘, 문제 해결법....처럼 기초 이상의 프로그래밍 기법을 요구하지는 않지만,

    모듈, 라이브러리, 함수 등 기본적인 파이썬 내 기능 자체를 활용하여 분석을 하기 때문에

    이러한 개념에 대한 기본적인 이해가 전제되어야 원활한 학습이 가능합니다.

     

    혹시 파이썬 및 프로그래밍에 대한 이해가 전혀 없거나 아직 부족하신 분들은,

    점프 투 파이썬(https://wikidocs.net/book/1) 을 참고해서 기초적인 지식을 습득하거나

    그때그때 구글링을 통해 필요한 부분을 검색해보면서 학습을 진행하는 것도

    하나의 방법이 될 수는 있을 것 같아요.

     


    지금까지 한빛미디어 출판사의 <이것이 데이터 분석이다 - with 파이썬> 도서에 대해 간단하게 살펴봤는데요,

    제가 언급한 내용은 아주아주 일부분이랍니다!

    실제로 여러분이 직접 코드를 치고 결과를 확인하며 익히는 과정이 있어야

    진짜 여러분의 데이터 분석 실력이 되겠죠?

     

    최근 IT분야, 특히 그 중에서도 '빅데이터' 가 크게 주목을 받으며

    데이터 분석에 관심을 갖는 분들이 많아졌는데요,

     

    친근한 예제들과 함께 흐름을 따라가며 분석 과정 자체를 손에 익히며 실력을 늘리고 싶은 입문자 분들에게는

    이 <이것이 데이터 분석이다 - with 파이썬> 책이 도움이 될 것 같습니다.

  • 흥미를 끌기에 충분한 너무나 많은 데이터가 공유되는 때에

    단순해보이는 데이터들에서

    진흙속 진주를 찾아내듯이

    유의미한 데이터로서 변모시킬 수 있는

    데이터분석은 너무나 매력적인 일인 것 같다.

     

    이러한 데이터 분석을 하기 위해

    너무나 잘 어울리는 책이 있어 소개해보려한다.

     

    바로 "이것이 데이터 분석이다 with 파이썬" 이다.

     

     

    이것이데이터분석이다.jpg

     

     

    데이터 분석의 시작부터 화려한(?!) 마무리까지를

    깔끔하고 쉽게 풀어낸 듯하다.

     

    주제에 맞는 데이터 분석을

    어떤 시각으로 어디에서 부터

    어떻게 접근해야 하는지에 대해

    단계별로 자세하게 안내하고 있다.

     

    더불어 중간중간 보이는 용어와 개념에 대한 설명들은

    적재적소에 가려운 곳을 잘 긁어주는 역할을 해준다.

     

    데이터 분석은 나만 알아보고

    글자로서 무언가를 보여주는 것도 가능하겠지만

    역시나 모든 것은 시각화 아닌가?

     

    이 책의 거의 모든 데이터 분석은

    항상 시각화 처리로 끝내고 있고

    시각화 처리를 어떻게 해야하는지에 대한

    안내를 해주고 있어서

    정말 데이터 분석의 시작부터 끝까지를 잘 이끌어주고 있다.

     

    데이터 분석과 함께

    약간의 파이썬까지

    두마리 토끼를 잡고 싶은 분들에게 강력 추천한다.

     

  • 요즘 전 산업분야에서 가장 많이 쓰이는 단어 중 하나가 '데이터'이다.
    예전에는 전혀 가치도 의미도 없던 것들이 이제는 하나하나가 소중한 자원이 되어 버렸다.
    데이터는 그대로인데 그것을 바라보는 시각이 바뀌었다.
    다이아몬드도 가공하지 않으면 의미가 없는 것처럼 데이터도 그러하다.
    데이터가 담고 있는 의미, 그것을 찾아내야 한다.
     
    이 책 '이것이 데이터 분석이다'는 바로 데이터속에서 다이아몬드보다 귀한 것을 찾는 방법을 알려주고 있다.
     

    data.jpg

     

     
    데이터를 다루는 도구, 프로그래밍 언어는 많다.
    미니탭, SAS와 같이 전문적인 도구도 있고, R, 파이썬과 같은 언어도 있다.
    이 책은 가장 대중적인 프로그래밍 언어인 파이썬으로 설명하고 있다.
    파이썬에 대한 기초지식만 있다면 누구나 쉽게 따라할 수 있는 코드를 제공하고 있다.
     
    하지만 이 책의 본질은 파이썬이 아니다.
    주제인 '데이터 분석'을 설명하기 위한 도구로 파이썬을 사용하고 있는 것 뿐이다.
    물론 파이썬으로 데이터 분석을 공부하는 분들에게는 최고의 책이겠지만, 데이터 분석에 관심이 있는 분들에게도 좋은 책이라는 의미이다.
     
    사실 데이터 분석이라고 하면 무척 막막하게 느껴진다.
    책에서도 사용하는 넘파이, 판다스를 잘 다루지만 막상 데이터를 주고 분석을 요청하면 의미없는 결과를 받을때도 있다.
    도구의 문제가 아니라, 분석의 문제인 것이다.
     
    데이터를 통해 도출할 수 있는 유의미한 결과를 끄집어 내는 것. 그것이 데이터 분석이고, 그것을 잘 할 수 있다면 파이썬이 아니라 엑셀, 계산기도 환영이다.
    그런 의미에서 이 책은 데이터 분석의 흐름을 잘 보여주고 있다.
    주변에서 쉽게 접할 수 있는 데이터로 어떤 유의미한 결과를 어떻게 도출할 수 있는지를 단게별로 잘 알려주고 있다.
    이론이 아닌 실무에서의 사용법을 알려주고 있고, 이해가 되지 않는다면 무료로 제공하는 동영상 강의를 참고하면 좋다.
     
    데이터 분석에 대한 개념과 흥미를 갖고 싶다면 이 책이 도움이 될 것이다.
    최고의 입문서인지는 모르겠지만, 나에게는 많은 도움이 되는 입문서임에는 틀림없다.

  • ‘이것이 데이터 분석이다’는 데이터 분석 입문책인데 그 도구로 파이썬을 이용하고 있습니다.  다른 언어로도 데이터 분석이 가능하지만 요즘 가장 많이 사용하는 언어가 파이썬입니다. 이 책은 파이썬 기초를 설명하지 않기 때문에 모른다면 파이썬을 먼저 익히고 읽을 것을 권합니다. 파이썬은 프로그래밍 언어 중에서도 쉽고 입문용으로 어울리기 때문에 쉽게 배울 수 있습니다.

     

    이 책은 데이터 분석을 시작하는 사람에게 어울립니다. 지루하고 어려운 데이터 분석 이론, 단순 파이썬 라이브러리 사용법을 설명하는 책이 아닙니다. 바로 데이터 분석을 따라하기 방식으로 도전해볼 수 있는데 이 과정이 어렵지 않고 흥미롭습니다. 어떻게 데이터 분석을 하는지 이 책을 통해 맛을 보면 다음에 필요한 내용은 알아서 공부할 수 있을 것 같습니다. 참고로 이 책은 파이썬 데이터 분석 도구로 판다스(Pandas), 넘파이(Numpy), Matplotlib 라이브러리를 사용합니다.

     

    책에서 설명하는 데이터 분석 과정은 간단합니다. 데이터를 수집하고 그걸 분석하고 가공해서 예쁘게 시각화하여 보여주면 됩니다. 데이터를 얻는 방식은 단순 파일부터 웹 크롤링, 트위터 같은 데이터 제공 API를 사용할 수 있습니다. 이렇게 얻은 데이터를 잘~ 가공하면 되는데 이것이 이 책의 주제입니다.

     

    뒤쪽으로 갈수록 어려운 코드, 수식, 그래프도 나오는데 전부 이해하지는 못해도 따라하다 보면 감은 잡을 수 있습니다. 잘 모르겠으면 이런게 있구나 넘어가고 필요하면 본격적으로 찾아서 공부하면 될 것 같습니다.

     

    ‘이것이 데이터 분석이다’로 데이터 분석 책을 처음 접했는데 생각보다 재밌네요. 데이터 분석을 본격적으로 공부해서 재미있는 사이트를 많이 만들고 싶은 욕심도 생기고. 많은 데이터를 다루는 직장인이라면 엑셀에서 머물지 말고 파이썬을 활용해서 다양한 도전을 해보는 것도 괜찮을 것 같습니다.

  • 데이터 분석을 해보고자 하는 초심자를 위한 책이다.

    주제를 제시하고 이를 해결해 가는 과정을 보여줌으로써 실제 데이터 분석 업무를 경험해 볼수 있도록 안내하고 있다.

    각 주제에서 데이터를 제시하고, 이를 단계적으로 분석해 가며, 최종 분석자료를 만들어가는 일련의 과정을 배울 수 있다.

     

     

    1.jpg

    2.jpg

     

     

    책의 모든 소스코드 및 실행 결과가 노트북(Jupyter Notenbook)으로 제공되어 설명하고 있는 내용을 즉시 확인 할수 있다.

    또한 저자 직강 동영상 강의가 공개되어 있다.(저자의 유튜브에 현재 5장까지 전부 공개 되었다.)

     

    이렇게 노트북으로 소스를 제공하면 독자가 단순히 실행/확인 만 하고 넘어가기 쉽다.

    이런 단점을 연습문제로 보완하고 있다.(물론 연습문제의 결과도 제공한다.)

    인터넷 강의를 들으며 따라가는 식으로 공부하고 이후 연습문제로 점검하는 방식으로 학습하기에 아주 적합하게 구성된 책이다.

     

    전체적으로 구성이나 진행면에서 나무랄데 없는 좋은 책이다.

    다만, 이론에 대한 설명이 부족한 부분이 있고, 딮러닝 등 새로운 분석방법을 사용하진 않는다. 

    진짜 데이터 분석가가 되고자 한다면, 깊이 있는 다른 책을 더 봐야한다는 점은 꼭 유의해야 한다.

     

    저자가 제시하는 이 책을 활용하는 방법이다.

    본 강의는 코드를 따라 치거나, 이론적인 설명에 집중하지 않습니다.

    입문자 입장에서 동영상을 보는 여러분께서는, 코드를 따라치는 것보다는 예제를 풀어나가는 과정을 구경하는 것을 권장드립니다.

    예를 들어 축구하는 법을 배우고 싶을 때, 아직은 축구하는 법을 잘 모르지만 구경부터 시작하는 것과 비슷합니다.

    축구를 하는 사람들을 구경하면서 볼을 다루는 법을 유심히 관찰한 뒤, 자신이 연습할 때 그 부분들을 신경써서 연습하는 것입니다.

     

    데이터 분석을 시작하고자 하는 초심자에게 데이터 분석의 흐름을 알려주는 좋은 길잡이가 되리라 생각한다.

  •  

     
    개인적으로 이론 설명이 많은 교과서 같은 책 보단 실습이 많은 책을 선호하기에 기분 좋게 공부할 수 있었습니다.
    최근 캐글과 데이콘 같은 대회를 통해 분석에 대한 감을 잡고 직접 도전 해보는 모습을 주변에서 종종 보고있는데,
    해당 도서에서 설명하는 절차 및 팁 들이 익힌다면 이런 대회를 시작하시는 분들에게는 많은 도움이 될 것 같습니다.
     
    데이터 분석에 대한 감을 잡고 캐글, 데이콘과 같은 분석 대회에 도전해 보고 싶으신 분들에게 추천 드립니다. Emotion Icon

     

  •  

    이 책을 추천하고 싶어 마음만은 많이 쓰고 싶지만 보는 사람의 입장에서 지루할꺼 같아 개조식으로 쓰겠습니다.

     

    1.      장점

    A.     쉽게 표현해 놓음

                             i.         다른 데이터 분석 책들의 경우 이론도 많은 편이고 전문 용어가 많아 힘든 부분이 많아 난해하였는데 이 책은 초보자도 이해를 쉽게 할 수 있게 간단하면서도 쉽게 표현

                            ii.         응용해볼 프로그래밍 코드도 주석으로 표현해줘서 이해하기 쉬움

                           iii.         이해가 안될 경우 무료 강의 영상 제공

    B.      바로 응용해 볼 수 있음

                             i.         데이터 분석에 대한 다양한 주제를 시각화 하여 볼 수 있어 재미있음

    C.      핵심 위주로 뽑음

                             i.         데이터 분석에 대한 차트시각화크롤링, API, 미래 예측 등 핵심적인 부분을 종합해 놓음

     

    2.      단점

    A.     기본적인 파이썬 문법을 알아야한다.

                             i.         이 책은 파이썬을 응용하는 책이라 기본적인 파이썬 문법을 알고 있어야함

     

    3.      추천대상

    A.     데이터 분석을 해보고 싶은 입문자 및 응용에 부족한 사람이 읽으면 좋음

     

     

     

    20200325_211416.jpg

     

     

     

  •  

    이것이.jpg

     

     

     


    이 책은 파이썬 문법을 어느정도 알고 있으며, 데이터분석이 처음이거나 

     

    익숙치 않은 분들을 대상으로 작성된 책입니다.


    파이썬 가상환경 설치부터, 데이터 수집 및 크롤링, 데이터 정제과정 

     

    그리고 데이터 분석까지의 일련의 과정을


    상세하고 쉽게 알려주고 있습니다.


    대신 넓은 분야를 다루고 있기 때문에, 하나의 분석에 대한 깊이가 조금 얕습니다.


    그래도 책을 보며, 여러가지 데이터를 수집하고 직접 분석해 볼 수 있습니다.


    파이썬이나 텐서플로우에서 제공하는 기본 데이터셋이 아닌, 

     

    중고 거래나 비트코인 가격, 특정 브랜드의 주문 데이터


    같이 일상에서 접할수 있는 데이터를 분석하는 법을 배울수 있습니다.


    요약하자면, 파이썬을 어느정도 알지만 데이터분석이 처음이거나 

     

    여러가지 분야에 적용해 보고 싶다 하시는 분들께


    추천드립니다.

  • 요약

     

    - 쉽게 데이터 분석에 접근해보고 싶다면 추천!

    - 수학적 능력이나 딥러닝등에 사용될 내용을 찾는다면 비추천!!

    - 책 내용이 하나하나 친절하다. 굿쨥!

    - 실생활에서 한번쯤은 생각했을법한 내용들로 접근해 흥미를 갖게한다.

     

    우앙!

    한빛에서 혼공 시리즈와 함께 밀고있는

    '이것이' 시리즈!

     

    이것이 오라클이다.

    이것이 자바다

    를 이미 소유하고 있었지만

    이것이 시리즈인것은 이번에 새롭게 안 사실...?!

    뭐 딱히 연관관계가 있는것은 아니지만

    '이것이 바로!!' 느낌의 제목이 팍팍 머리속에 들어온다.

     

    이 책의 타겟 독자는?

    그렇다고 한다.

    최신 기술(딥러닝같은)을 원하거나,

    수학적인 능력을 기르고 싶은 분들에겐 비추!

     

    데이터 분석이 처음이거나

    약간의 지식이 있지만 막연히 따라하는 예제보단

    분석의 흐름과 실생활 예제를 살펴보고 싶다면 추천!

     

    그리고

    '파이썬을 조금이라도 접해본 사람을 대상'으로 한다

    라고 한다.

     

    파이썬은 최근들어 C언어를 대신해서

    프로그래밍 입문자에게 추천할 만큼 '쉬운 언어'로 소개되지만

    문법이나 다른 프로그래밍 언어에서 활용되던 개념이 약간 다른 느낌을 갖기 때문에 (본인 피셜)

    파이썬을 알고있는 독자들을 타겟으로 잡은것 같다.

     

    친절하구먼!

    개발환경을 어떻게 구축할것인지,

    소스코드를 GIT-HUB에서 어떻게 다운받을수 있는지,

    학습을 진행하다가 막히면 활용할수 있는 수단은 어떻게 있는지

    등등 친절하게 설명하고 있다.

     

    사실 프로그래밍을 조금 해봤다고 하는 사람들 중에는

    '변화를 싫어하는' 사람들이 꽤 많다.

    '이런게 있다...' 정도로 알고 있지만 바꾸거나

    기능을 업그레이드 할 필요를 못느껴

    신기술을 모르는 경우가 많기 때문이다.

     

    파이썬을 사용하던 프로그래머 중에는

    pycham같은 특정 IDE만을 써왔다면

    '아나콘다'라는 것을 몰랐을테고,

    SVN 형상관리 툴만을 사용해왔던 사람은

    GIT 이라는 형상관리 툴은 들어서 알지만 써보지 않았을 수도 있다.

     

    이렇게 친절하게 알려주면 입문자 입장에서는 고마울 수 밖에 없다!

    게다가 유튜브 강의까지!!

    저자분이 직접 답변을 해주신다니까 모르는게 있으면 직행하자!

     

    저자분에게 질문하러 고고!

    각 장으로 넘기면 학습 목표의 핵심개념이 무엇인지 간략하게 설명하고,

    해당 장 에서 어떤 데이터 분석을 할지 이미지를 미리 보여준다.

    인기 있는 메뉴는 뭘까..!?

    저자가 소개했던 말처럼

    소스코드를 보고 직접 해보면서

    실전에서 쓰일법한 예제들을 다룬다.

     

    데이터를 직접 활용할 수 있는 방법을 보여주기 위해

    SNS와 특정 문서(나무위키 같은) 를 크롤링 해서 직접 데이터를 구성하여

    위와 같은 데이터들을 볼 수 있다.

     

    '분석' 이라는 말이 갖게 하는 느낌,

    어렵고 복잡할 것 같은 느낌을 지울수 없다.

    분명 처음엔 이미지, 그래프들로 쉬움을 강조하지만

    학습할수록 숫자와의 싸움을 벗어날순 없다.

     

    하지만 이 책은 그 '어려움'을 최소화 하기 위해

    실제 한번쯤은 궁금했을법한 내용들을 사용하고

    어떻게 이런 코드가 사용됐는지를

    독자와 함께 진행하면서 대화하는 느낌을 통해 이해하게 한다.

     

    커버에 저자분의 얼굴인진 모르겠지만...(맞겠지?)

    확실히 얼굴 내놓을만한 책이라고 생각한다.

  •  
    오늘 리뷰하는 책은 "이것이 데이터 분석이다 with 파이썬" 이다.
     
    파이썬 기반의 데이터 분석 관련 책은 전에 다른 책을 본 적도 있으나, 그때 그책은...좀 살짝 지루했다. 
     
    이유는 간단하다. 살짝 부담스러운 분량, 편집이나 레이아웃, 흑백 인쇄, 번역서 였기 때문이다.
     
    이 책은 부담 없이 쭉쭉 볼 수 있었는데 그 이유는 바로 위의 이유 대부분을 피해갔기 때문이었다.
     
     
     
    일단 칼라 인쇄는 항상 옳다. 특히 이런 챠트나 그림이 많이 나오는 책에서는 그 진가를 확실하게 발휘한다.
     
    아래 사진이 바로 그런 점들을 증명하고 있다. 같은 내용이라도 흑백 인쇄보다 가독력이 뛰어나고, 
     
    내용도 팍팍 머리에 들어오는 느낌을 준다.
     
     
     
     
     
    목차에서도 맘에 부분이 있었다. 데이터 분석의 핵심 키워드들이 큰 목차에 그대로 있고 해당 예제들을 다루는 점이 좋았다.
     
     
     
    위의 워드 클라우드에서도 보았지만 원서에서는 구경하기 힘든 한글 처리 부분과 한국 지도 서비스 연동 하는 등의
     
    애국적인 예제들로 설명하고 있으니 좀 더 쉽게 이해가는게 당연하다.
     
     
     
    곳곳에 통계나 데이터 분석 관련 용어들도 설명이 되어 있어서 좋았다.
     
    용어들은 꼭 익혀 두는게 좋다. 머신 러닝, 딥러닝에서도 동일하거나 관련 있는 용어들이 많이 나온다.
    (예를 들면 원 핫 인코딩)
     
    때로는 설명이 약간 부족한듯한 부분도 있지만 분량을 줄이려면 어쩔수 없을터.
     
    아주 어려운 용어도 가끔 있었다. 이런건 검색을 이용하거나 따로 공부를 해야 할듯...
     
     
    이 책은 각각의 라이브러리에 대해서는 간단하게만 설명을 하고 있다. 
     
    데이터 분석을 주도 다루는 책이니 당연한 것이니, 라이브러리 설명 부족은 해당 매뉴얼을 보는게 정답이다.


    부담 없는 분량으로 자칫 지루하기 쉬울 수 있는 통계, 데이터 분석 등의 내용을 화려한 컬러 인쇄로 볼 수 있어서 

    좋은 책이었다. 유투브에 동영상 강의도 있다고 하니 가서 들어보자~!

  • 

    한빛미디어에서 출판된 "이것이 데이터분석이다 with 파이썬"은 데이터 분석 입문자들에게 완전 추천하는 책이다.

    만약 파이썬 기초문법에 대해서 다 배우고 어떤 책으로 넘어와야 할 지 모르겠다면,

    실제 예제를 풀어가며 데이터 분석에 대한 기초를 차근차근 쌓을 수 있게 도와주는 입문서로 완전 추천한다.


    책 안의 깃헙 주소로 들어가면 예제를 손쉽게 다운받을 수 있다.

    바로바로 따라하며 데이터 분석 기초를 다져주니 훨씬 이해도 쉽고 문과생들도 쉽게 따라갈 수 있다.

    문과생인 내가 이해를 하면서 따라간다는 것은 다른 문과생들도 쉽게 할 수 있다는 보증수표이다.

     

    기존에 라이브러리가 없던 사람들도 따라하기 쉽게 처음부터 시작한다.

    입문자들은 라이브러리 다운로드에서부터 막히는 사람들이 많은데 그러한 문제를 겪지 않게 상세하게 설명이 되어있다.

    또한, 여러가지 데이터 분석 사례들을 다루고 있기 때문에 입문책으로 공부하다가

    어떤 데이터 분석을 좀 더 공부하면 좋을 지에 대해서 생각 할 수 있는 기회를 준다.

     

    특히 재밌었던 부분은 비트코인 예측하기이다.

    요즘 주식이 너무 심하게 요동쳐서 이 책에서 다룬 시세예측을 현재 주식판에 연결해서 적용해봐도 재밌을 것 같다.

     

    또한, 책만으로 공부가 어려운 사람들을 위해 아래 유튜브를 들어가면 저자직강을 볼 수 있어 더더욱 도움이 된다.

    보통은 저자직강을 유튜브 채널로 제공해주는 경우는 잘 없는데 너무 유용하게 공부할 수 있었다.

    책 내에서도 코드와 함께 실행 결과를 함께 보여줘서 공부하기 편했는데, 저자직강을 들으니 좀 더 이해가 쏙쏙 되서 책과 강의를 함께 보는 것을 추천한다.

    https://www.youtube.com/user/HanbitMedia93

    



  • [한줄평]

    실생활 예제로 쉽게, 단계별 분석에 따라 구조적으로 배우는 데이터 분석 입문서


    [목차구성]

    Chapter 00. 들어가기 전에

    Chapter 01. 데이터에서 인사이트 발견하기

    Chapter 02. 텍스트 마이닝 첫걸음

    Chapter 03. 미래를 예측하는 데이터 분석

    Chapter 04. 데이터 분류 모델

    Chapter 05. 데이터 분석 종합 예제


    [이 책의 특징]

    ① 데이터 분석의 이론보다는 ‘흐름’을 담았습니다. 

    ② 단계별/반복적으로 학습하며 데이터 분석을 체계적으로 배울 수 있습니다. 

    ③ 저자 직강 동영상 강의 무료 제공


    [대상 독자]

    -라이브러리를 사용하는 프로그래밍을 경험해본 사람

    -데이터 분석에 대해 어렴풋이 들어봤지만 제대로 공부해본 경험이 없는 사람

    -입문자에게 중요한 분석 포인트를 알고 싶은 사람


    [서평]

    이 책은 입문자의 입장에서 단계적으로 데이터 분석에 접근하는 방법을 잘 설명하고 있습니다. 데이터 분석 입문자에게 가장 중요한 것은 이론이나 스킬이 아닌, 문제에 올바르게 접근하는 사고의 과정이라 생각합니다. 여기 책에서는 총 5챕터로  대표적인 분석 방법을 설명하지만 데이터 분석 이론, 라이브러리 사용법은 자세하게 다루지는 않습니다. 하지만 데이터 분석에 가장 중요한 문제를 어떻게 해결 하는지 과정을 자세하게 다루고 있습니다. 그리고 문제를 해결하는 과정에서 꼭 필요한 이론에 대해서는 쉽게 이해 할수 있게 설명하고 있습니다.


    이책은 파이썬문법을 사용한다는 과정하게 진행하기 때문에 파이썬에 대한 기초적인 문법은 알고 있어야 합니다. 이부분이 조금 아쉬웠습니다. 파이썬 기초 문법에 대해서는 설명을 하면 좋지 않았을까 생각합니다.


    데이터 분석에 대해서 처음 시작 하고 싶다면 이책을 통해서 데이터 분석 방법과 실무에 사용하는 다양한 예제를 배우고 데이터에대한 인사이트를 발견할 수 있을 것이라 생각합니다.



  •  

    KakaoTalk_20200322_233323768.jpg

     

    나는 처음 책표지를 딱보았을 때 먼저 사람의 모습이 인상적이였다.

    지은이는 어떤 분일까 너무 궁금해서 책을 받자마자 지은이의 글부터 읽어보게 되었다.

    미디어학과생으로 디자이너를 지망하던 대학생이 인턴십 과정에서 웹 개발 업무를 하게 된 계기로 프로그래밍의 적성을 발견하고  데이터분석의 매력을 느끼고 데이터분석 공부를 하다가 지금은 머신러닝 엔지니어라는 커리어까지 시작할 수 있었다는 부분이 너무나 매력적이였다. 누구나 데이터분석자, 머신러닝 엔지니어는 전공자만 가능하다라는 것을 깨뜨리고 스스로 노력하고 공부하여 자신의 길을 개척하고 극복해 나가는 작가님이 너무 대단한 분이구나 싶다. 무에서 유를 스스로 공부하며 이해하셨기에 입문자들의 어려움을 누구보다 잘 알거란 믿음이 더 가는 부분이다.

     

    파이썬과 pandas, Numpy, Matplotlib를 접해봤지만 제대로된 데이터 분석을 해보지 않은 나에게 이 책은 제대로된 데이터분석 흐름을 절차적으로 배울 수 있는 입문서로 보인다.

     

    이 책은 데이터 분석 이론과 라이브러리를 상세하게 설명하진 않는다. 그래서 처음부터 일일이 찾아서 공부하면서 하면 첫 Chapter부터 힘이 빠질 것이다. 작가가 의도한 것처럼 먼저 이책의 가장 큰 장점은 데이터 분석으로 문제를 해결하는 과정, 흐름을 볼 수 있는 책이기에 그 흐름을 보는 눈을 키우는 것을 1차 목표로 삼아야 할거 같다. 그러면서 모르는 라이브러리나 이론적인 부분은 체크해 두고서 나중에 책을 모두 실습해 본 후에 천천히 공부하면서 상세히 정리해 가다보면 더 이해가 빠를 듯 하다. 

     

    그래서 이 책은 파이썬 프로그래밍을 조금이라도 접해본 사람이 적합하다. 프로그래밍에 대한 개념이 전혀 없으신 분은 추천할 수 없는 책이다. 그리고 데이터 분석에 사용되는 수학적, 통계적 개념을 깊게 이해하고 싶은 분도 적합하지 않다. 데이터 분석의 흐름을 알려주는 것이 가장 핵심 목표이기에 데이터 분석 이론과 수학적, 통계적 개념은 깊게 다루진 않는다. 

     

    5개의 Chapter는 단계적으로 학습할 수 있게 이루어져 있다. 각 Chapter마다 다양한 예제를 두어서 지루할 틈이 없다. 

    앞에서 말한것처럼 데이터 분석의 흐름을 배울 수 있게 예제 자체들을 Step별로 나눠서 문제 해결 하는 과정이 이해의 구조화를 해 줘서 너무 좋다.  예제들을 하다보면 또다른 확장된 주제로 생각이 뻗어 나가며 분석해보고 싶은 또다른 것들이 떠오르게 됨을 경험하게 되고 그러면서 데이터 분석의 재미를 느끼게 한다. 

    간간히 미니퀴즈, 연습문제들은 약간의 긴장감을 주면서 제대로 코딩 연습을 다시 해 보게 되는 좋은 학습 동기가 된다. 

     

    예제만 따라해본다해도 결코 난이도가 낮지 않는 그러면서도 많이 높지도 않은 그러면서도 지루하지도 않는 데이터 분석의 맛을 느낄 수 있는 책인거 같다.

     

  •  

     
     

    한빛미디어에서 나온 '이것이 OO다' 시리즈 책을 많이 갖고 있다.

    '이것이 리눅스다', '이것이 오라클이다' 등등 Programming language나 운영 체제, DBMS 등의 기본석 역할을 하는 시리즈인 것 같다. 그래서 도움을 많이 받았고, 회사에서도 '이것이 C#이다'라는 책으로 본인의 메인 컴퓨터 언어가 된 C# 프로그래밍을 하고 있다.

     

    KakaoTalk_20200321_234218944.jpg

     

     

    이 시리즈 특유의 표지 디자인이 있다. 그런데 이번엔 조금 다르다. 보통이라면 로봇이나 기계 같은 것이 등장하고 형광빛을 내는 제목이 새겨져 있는데 기존 시리즈를 아는 사람이면 누구나 알 것이다. 이번 표지는 많이 다르다는 것을 사실 나도 의아했다. 책도 '이것이 파이썬이다' 같은 것으로 나올 줄 알았는데 데이터 분석 책이 이 시리즈로 출간이 되었다. 그래도 이 시리즈는 믿고 본다.

     

     

     

    이 책을 볼때 유념할 점은 파이썬에 대한 지식이 어느정도 있다는 것을 가정하고 진행된다. 개발 환경 구축 같은 것은 스크린샷을 통해 친절히 안내하고 있지만 말이다.

     

     

    그래서 초반에는 파이썬 언어에 대한 내용보다는 파이썬 설치라든지, 파이썬 라이브러리, 아나콘다와 같은 환경 설정에 초점을 둔다. 이 책이 파이썬 언어 책이 아니기 때문에 파이썬 언어에 대한 중요 개념 정리도 지면 관계상 다 싣지는 못한 것으로 보인다. 그래서 파이썬 기초 책을 먼저 보고 이 책을 보면 좋을 것이다.

     

     

    그래도 다른 컴퓨터 언어에 대한 지식이 있으면 그렇게 어렵지 않고 자연스럽게 이해는 될 수준이다. 환경 구축은 상세히 설명해주니 이 부분만 보고 따라한다면 데이터 분석 프로세스에 집중하여 공부를 해나가면 될 것 같다.

    이 책은 꽤 다양한 케이스를 가지고 실습을 진행한다. 그냥 코드만 보여주는 막무가내식 실습이 아니라 '탐색→ 인사이트 발견 → 탐색적 분석 → 통계적 분석'으로 단계별로 데이터 분석을 진행한다.

     

     

    책에서 다루고 있는 케이스를 살펴보면 프랜차이즈 주문데이터, 국가별 음주 데이터, 소셜 네트워크 분석, 영화 평점 예측, 중고나라 휴대폰 거래가격 예측 등이 있다. 데이터 분석을 하기에 매우 흥미로운 사례 등이다.

     

    그리고 데이터 분석에 그치지 않는다. 데이터 분석을 하려면 데이터가 있어야 한다. 데이터를 21세기의 원유라고 하던데 그 원유가 있어야 가공을 하거나 연료로 사용할 것이 아닌가.

     

    그래서 웹 크롤링 하는 방법에 대해서도 중간에 설명이 되어 있다. 파이썬으로 웹 크롤링 하는 방법을 배우고 싶다면 이 책을 선택해도 좋다. 실제로 크롤링한 데이터를 가공하고 분석하는 일은 실무에서도 정말 많이 사용된다고 들었다. 그외에도 Pandas, Numpy 등 매우 중요한 라이브러리 활용을 많이 하고 있으니 이 참에 확실히 배워두면 두고 두고 사용할 곳이 많을 것이다.

     

     

    중간중간 통계적 용어 및 기법들을 사용한다. 그렇지만 해당 용어와 기법의 근본이 되는 이론이라든지, 증명 방식, 수식 등 깊은 설명은 하고 있지 않다. 그러니까 이 파이썬이라는 도구를 가지고 얻고자 하는 결과물을 내놓는 것에 이 책이 의미가 있는 것이다.

     

     

    텍스트마이닝, 데이터 분류, 미래 예측 분석 등 데이터 분석 범주에 속하는 다양한 방법들이 소개된다. 개인적으로 나무위키를 크롬의 개발자 도구를 통해 URL 정보를 따온뒤, BeautifulSoup이라는 아주 유명한 웹 크롤링 라이브러리로 데이터를 수집해보고 말뭉치를 만들어 워드 클라우드까지 완성하는 부분이 관심을 끌었다.

     

     

    정리하자면, 이 책의 장점과 차별성은 하나의 방법론처럼 '단계별 분석'을 적극적으로 활용하고 있다는 점이다. 데이터 분석을 해야하는데 어떻게 해야할지 모르는 사람들에게는 이런 분석 방법을 사용해야 좀 더 체계적으로 데이터를 통해 인사이트를 얻을 수 있다.

     

     
     
     
     

    찾아보니 저자의 동영상 강의도 포함되어 있다. 개념이 너무 어렵다면 유튜브에 공개된 동영상 강의를 참고하는 것도 좋을 것 같다. 특히 파이썬이 익숙하지 않은 사람은 더욱 동영상 강의가 필요할지도 모른다.

     

    이 책으로 공부해보니 R에서 했던 데이터 분석을 모두 파이썬에서 똑같이 할 수 있을 것 같다. 그리고 다른 사례의 데이터를 분석하게 될 기회가 주어진다면 책의 가장 비슷한 사례를 벤치마킹하는 것도 큰 도움이 되지 않을까?

     

    

  • image.png

    데이터 분석, 데이터 과학쪽을 가고 싶다고 고등학교때 부터 꿈꿔 대학교에 컴공으로 진학을 했지만, 대학교에서 배우는 과목으론 데이터 분석을 다 배우긴 힘들어 혼자서 공부를 해야한다는 필요성을 느끼게 되었습니다. 어떤 책으로 공부를 하면 좋을지 이것저것 찾아보다가 독학을 하던 도중 이 책을 만나게 되었습니다.

     

    이 책의 제일 좋은 점은 확실히 실생활과 밀접한 예시가 많다는 것입니다. 데이터 분석이라 해도 과학적인 자료를 이용해서 분석을 하는 경우가 많거나 데이터 셋을 구하기 힘들어 분석을 하는데 어느정도 힘들었는데, 이 책은 예제로서 자료도 충분히 있을 뿐더러 설명을 하는 예시들도 비트코인이나 맛집 분석등 실생활에서 들어볼 법한 익숙한 소재들을 활용해 더욱 친숙하다는 느낌을 받았습니다.

     

    또한 강의로도 친절하게 설명을 해주어서 책으로만 이해하기 힘든 내용도 쉽게 배울 수 있다는 점이 무척이나 좋았습니다. 하다가 막히는 부분이 있어도 영상을 보며 문제를 해결할 수 있을 뿐더러 질문을 하면 답도 해준다 하니 강의를 보면서 차근차근 배워볼까 싶습니다.

    단점이 있다면 이 책은 파이썬을 어느정도 안다는 전제하에 공부를 하면 더욱 좋을 것 같았습니다. 마침 이책을 만날때 즈음 파이썬 공부를 다 했기에 라이브러리 설치나 이해가 원활했지만 완전 초보자가 본다면 파이썬을 활용하는데서 막힐게 조금 있을 것이라 생각되기에 기본적인 파이썬 구문과 라이브러리를 해석하는 정도의 실력을 갖추면은 좋을거라 생각이 되네요.

     

     

    책에서도 강의에서도 볼 수 있듯 이 책의 제일 좋은 점은 이론이 아닌 흐름을 배우는 겁니다. 대부분의 데이터 분석에서 중요하게 얘기하지만 이 책에서는 특히 더 어떻게 분석을 하고, 결과를 해석할지에 대한 전반적인 사고력을 더 중요시 여깁니다. 이 사고 방식을 얻는 것만으로도 이 책에서 충분히 얻을 건 다했다는 생각이 듭니다. 데이터 분석으로 무얼 공부해야할지 망설이는 사람들에게 적극적으로 권장하고픈 도서이며, 강의를 보면서 천천히 공부하면 책을 덮은 뒤에 실력이 늘어난 자기자신을 볼 수 있다고 생각됩니다.

     

  • 이 책은 데이터 분석 입문자들을 위해 만들어진 책입니다 

    필자의 노고가 많이 담겨 있고 데이터분석 입문자들의 입장에서 책이 작성되어서 

    파이썬으로 데이터 분석을 도전해보고 싶은 분들에게 많은 도움이 될것입니다 

     

    단! 데이터분석에 있어서 수학적인 부분과 파이썬의 기초적인 부분은 다루지 않으니 

    미리 알고 오신다면 더욱 도움이 될 것입니다

     

    조금더 자세한 리뷰를 보고싶으시면 

     

    https://allhpy35.tistory.com/45 

     

    위의 링크를 참조해주세요

  • 책 표지를 통해 '데이터분석', '파이썬', '입문' 이라는 키워드를 통해 데이터 분석에 관심있는 입문자들을 위한 도서라는 걸 알 수 있었고, '실생활 예제', '단계별 분석', '구조적' 이라는 키워드를 통해 이 책은 우리 생활과 밀접한 예시들을 사용하려 하고, 이를 체계적으로 다루려는 인상을 받았다. 마지막으로 4시방향에 있는 동영상 강의 무료 제공은 타겟팅을 입문자로 잡다 보니, 혹시나 진입에 두려워할 사람들을 위해 제공하는거 같다는 느낌이 들었다.

    1. 단계적으로 학습 : 5개의 Chapter 안에 각 단계가 step으로 구성되어 체계적으로 공부 할 수 있음.

    2. 이론 보다는 흐름을 배움 : 저자는 이론보다는 문제 해결 과정에 집중하기 위해, 수식보다는 직관적인 설명만 담음.

    3. 대상 독자 : 파이썬을 조금 접해본 사람(조금의 기준 : 변수, 자료구조, 객체와 같은 개념정도)를 추천하며, 저자는 프로그래밍 개념이 전혀 없거나, 데이터 분석 수학적, 통계적 개념을 깊게 이해하고 싶거나, 최신이론에 관심있는 사람은 다른 책을 추천한다고 한다.

    4. 책을 읽는 방법 : 깃허브에 올려놓은 코드를 통해 실행해보며 공부하는 걸 추천한다.

    교과서처럼 각 챕터 별 배울 핵심개념들을 미리 소개 하고 있다.

    표로 정리하고 퀴즈 및 연습문제로 각 쳅터 별 배운 개념들을 확인한다.

    책 만으로 해소 안되는 부분을 동영상 강의 및 Q&A를 유투브로 해결해주시는 모습이 인상적이다.

    목차

    Chapter 00. 들어가기 전에

    0.1 개발환경 구축하기

    0.2 데이터 분석을 위한 라이브러리

    Chapter 01. 데이터에서 인사이트 발견하기

    1.1 탐색적 데이터 분석의 과정

    1.2 멕시코풍 프랜차이즈 chipotle의 주문 데이터 분석하기

    1.3 국가별 음주 데이터 분석하기

    연습문제

    Chapter 02. 텍스트 마이닝 첫걸음

    2.1 웹크롤링으로 기초 데이터 수집하기

    2.2 나무위키 최근 변경 페이지 키워드 분석하기

    2.3 특정 키워드가 있는 게시물 크롤링을 위해 API 사용하기

    2.4 트위터 API로 ‘손흥민’과 연관된 키워드 분석하기

    연습문제

    Chapter 03. 미래를 예측하는 데이터 분석

    3.1 프로야구 선수의 다음 해 연봉 예측하기

    3.2 비트코인 시세 예측하기

    3.3 미래에 볼 영화의 평점 예측하기

    연습문제

    Chapter 04. 데이터 분류 모델

    4.1 타이타닉의 생존자 가려내기

    4.2 강남역 맛집 리뷰로 알아보는 감성 분류

    연습문제

    Chapter 05. 데이터 분석 종합 예제

    5.1 중고나라 휴대폰 거래가격 예측하기

    5.2 구매 데이터를 분석하여 상품 추천하기

    목차를 통해 알 수 있듯이 데이터 분석에 있어 EDA, 텍스트 마이닝, 웹 크롤링, 예측, 분류 등에 관심이 있

    는 분들에게 한빛미디어의 '이것이 데이터 분석이다'를 추천드리고 싶다.

    리뷰어클럽 서평단 자격으로 작성한 리뷰입니다.

결재하기
• 문화비 소득공제 가능

배송료 안내

  • 책, 아이템 등 상품을 1만원 이상 구매시 무료배송
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
이것이 데이터 분석이다 with 파이썬
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
이것이 데이터 분석이다 with 파이썬
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
이것이 데이터 분석이다 with 파이썬
구입처*
구입일*
부가기호*
부가기호 안내

* 회원가입후 도서인증을 하시면 마일리지 500점을 드립니다.

* 한빛 웹사이트에서 구입한 도서는 자동 인증됩니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한됩니다.

* 절판도서, eBook 등 일부 도서는 도서인증이 제한됩니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실