메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

나도 하는 파이썬 데이터 분석

도시 생활 데이터를 활용한 데이터 분석 방법

한빛미디어

집필서

판매중

  • 저자 : 김규석 , 김현정
  • 출간 : 2023-03-10
  • 페이지 : 328 쪽
  • ISBN : 9791169210775
  • 물류코드 :11077
  • 초급 초중급 중급 중고급 고급
4.8점 (23명)
좋아요 : 2

10일 완성 나도 하는 데이터 분석!

 

도시 생활 데이터 기반의 다양한 사례를 실습하며

데이터 분석 인사이트를 키우는 실전 데이터 분석!

 

‘코로나 시대에 한적한 여행지는 어디일까?’, ‘대출 이율이 오르면 집값은 어떻게 변할까?’, ‘부동산 가격을 예측할 수 있을까?’ 이 책은 친숙한 도시 생활을 주제로 파이썬을 이용한 데이터 분석 방법을 익힐 수 있도록 도와준다. 별다른 개발 환경을 구축할 필요 없이 구글 콜랩을 통해 PC, 스마트폰 등 다양한 스마트 기기에서 데이터를 수집하고 분석하며 자신만의 데이터 분석 인사이트를 키워보자.

김규석 저자

김규석

한국항공대학교에서 정보통신공학 학사와 아주대학교에서 정보통신공학 석사 과정을 거쳐 서울대학교에서 도시계획학 박사 과정을 수료했다. LG전자와 LG유플러스 연구소의 근거리 무선 통신 및 홈 미디어 서비스 분야에서 근무했으며, 2020년부터는 한국폴리텍대학 데이터융합SW과의 조교수로 재직 중이다. 현재는 사랑하는 아내, 딸과 함께 살아갈 도시, 환경 등의 사회과학 분야 빅데이터를 실증 분석하고 인공지능을 통해 예측하는 연구와 강의를 진행하고 있으며, 유튜브 채널 ‘김규석의 빅데이터 카페’에도 짧은 강의를 업로드하고 있다. 저서로는 『나도 하는 파이썬 데이터 분석』 (한빛미디어, 2023)이 있다.

 

김현정 저자

김현정

한동대학교 창의융합교육원 교수. 도쿄 대학에서 도시공학으로 박사 학위를 취득하고 Esri Korea에서 공간정보 기반 스마트 시티를 연구했다. 이후 서울대학교에서 도시공학 전공 강의를 담당하며 공간AI, 스마트 시티 관련 여러 국책 연구를 수행했다. 주요 연구 분야는 공간정보 기반 스마트 시티, 도시 빅데이터 분석, 데이터 기반 도시 계획 등이다. 현재 도시해석연구실(Urban Analysis Lab)을 운영하고 있다.

0장 들어가며

_0.1 1부 소개 

_0.2 2부 소개 

_0.3 데이터 분석을 위한 개발 환경 준비 

 

PART 1 생활 데이터로 배우는 파이썬 기초 문법


1장 4차 산업혁명과 빅데이터

_1.1 4차 산업혁명과 기술의 변화

_1.2 빅데이터란? 

 

2장 연필 없이 복잡한 수학 문제를 풀어보자_연산자, 변수, 자료형

_2.1 1 더하기 1은? 

_2.2 a 더하기 b는? 

_2.3 1+1=2는 True or False? 

Google Colab on Smartphone 

 

3장 갖고 싶은 위시 리스트 아이템 있어?_튜플, 리스트, 딕셔너리

_3.1 내가 갖고 싶은 물건은 확실하다! 

_3.2 내가 갖고 싶은 물건은 변할 수 있다! 

_3.3 내가 갖고 싶은 물건이 얼만지 알고 싶어? 

Google Colab on Smartphone 

 

4장 철수야, 맨날 학원 가고 독서실만 가니?_조건문, 반복문

_4.1 파이썬 도서, 다 읽었어? 

_4.2 오늘은? 내일은? 모레는? 

Google Colab on Smartphone 

 

5장 업무는 효율이 핵심이야!_함수, 클래스

_5.1 작년에 용돈 얼마 썼어? 

_5.2 요리는 내가 직접 한다 

_5.3 냉장고를 정리하자 

Google Colab on Smartphone 

 

PART 2 데이터 수집 및 분석하기


6장 코로나 시기에 한적한 곳으로 여행 가고 싶다면?_정형 데이터 분석

_6.1 정형 데이터 수집하기 

_6.2 지역별/연령별 방문객 순위는? 

_6.3 지도 위에 표현해보자 

_6.4 코로나 확진자 수 통계 분석하기 

Google Colab on Smartphone 

 

7장 우표 수집하니? 난 데이터 수집한다!_비정형 데이터 분석, 크롤링

_7.1 웹 기반의 비정형 데이터 수집하기 

_7.2 애국가에서 '대한'은 몇 번 등장할까? 

_7.3 나만의 빅데이터 저장소를 만들자 

Google Colab on Smartphone 

 

8장 너와 나의 연결고리_상관관계 분석

_8.1 M세대와 Z세대의 취업률 상관계수는? 

_8.2 대출 이율이 오르면 우리 집값은? 

_8.3 집이 비어 있을 땐 허수아비라도 설치해야 할까? 

Google Colab on Smartphone 

 

9장 아니 땐 굴뚝에 연기 날까_회귀 분석

_9.1 모든 일에는 다 이유가 있다 

_9.2 집 앞에 어린이집이 생기면 집값에 어떤 영향을 미칠까? 

_9.3 내일은 비가 올까요? 

_9.4 회귀 분석과 인공지능 예측 차이 

Google Colab on Smartphone 

 

10장 앞만 보는 것이 아니라 뒤도 살펴봐야 한다_시계열 분석

_10.1 과거는 미래에 영향을 줄까? 

_10.2 ARIMA와 인공지능 기반 시계열 예측의 차이 

_10.3 이 아파트를 지금 팔아야 할까? 보유해야 할까? 

Google Colab on Smartphone 

 

8. 관련 서적 (제목 + ISBN)

<파이썬 증권 데이터 분석> / 9791162243206

<어쩌다 데이터 분석 with 파이썬> / 9791169210317

<데이터 과학을 위한 파이썬과 R> / 9791169210430

다양한 실습으로 데이터 분석 방법의 감을 익히고

파이썬으로 ‘나도’ 데이터 분석을 해보는 활용서

 

이제는 기업부터 개인까지 어떠한 결정을 내리는 데 ‘데이터’를 활용한다. ‘데이터 분석’의 중요성을 언급하는 시기는 이미 지났다. 어떤 언어나 도구로 데이터 분석을 해야 하는지, 더 심층적인 데이터 분석 방법은 무엇인지, 그러한 방법을 활용해 원하는 결과를 도출할 수 있는지 고민하는 시기다. 

 

이 책은 1부에서 파이썬 문법을 쉽게 안내하고 연습문제로 확인한 후, 2부에서 다양한 실습을 통해 데이터 분석 방법을 체득하도록 도와준다. 흔히 들어보기만 했던 정형 데이터 분석, 비정형 데이터 분석, 상관관계 분석, 회귀 분석, 시계열 분석을 파이썬으로 해본다. 또한 이러한 분석을 통해 도출된 결과를 간단히 해석해보기도 하며 여러분의 데이터 분석 실력을 키우는 데 다리 역할을 한다. 

 

실습한 모든 코드(그림, 예제)와 데이터(CSV, 엑셀)를 깃허브에서 쉽게 내려받아 구글 콜랩(Google Colab)에서 실습해보자. 쉽게 준비할 수 있는 구글 콜랩 개발 환경에서 다양한 실습을 통해 데이터 분석의 감을 익히기 바란다.

  최근에 파이썬의 기세는 무섭다. 간단한 코딩과 엄청나게 많은 라이브러리로 인해서 정말 빠른 개발이 가능해졌다. 최근에는 RPA에서 파이썬은 많은 역할을 하고 있는 분위기다. 자료를 받아와 분석하고 데이터를 만들고 보여주는 것은 물론이거니와 인터넷에서 자동으로 자료를 취득하는 것도 가능하다. 일련의 과정은 C++과 비교해 보면 정말 경이롭다.

 

  파이썬을 배워보려고 주피터 노트북도 깔아보고 Visual Code로도 해봤지만 역시 가장 귀찮은 것은 라이브러리 설치다. 명령어만 치면 설치되긴 하지만 가끔은 설정이 꼬이기도 하고 반응하지 않기도 했다. 하지만 책에서 소개한 구글의 Colab을 이용하면 대부분의 라이브러리를 지원해서 좋았다. 처음 시작할 때 시간이 약간 걸리는 것을 제외하면 파이썬을 공부하기에 좋은 환경을 제공해 주었다. 코랩의 좋은 점은 웹상에 존재하기 때문에 PC에서 하다가 태블릿으로 하다가 심지어 폰으로도 할 수 있다는 것이다. 

 

다운로드.png

 

 

  이 책은 파이썬을 이용하여 데이터 분석을 하는 예제들을 포함하고 있다. 지방청이나 국가에서 제공하는 자료 등을 이용해서 데이터를 분석하고 지도로 표시해 보는 것부터 데이터를 수집하는 크롤링, 그리고 직접 하려면 난감한 상관분석, 회귀분석, 시계열 분석에 대해서도 다룬다.

 

  직접 코드를 짜보기 때문에 일단 재미가 있다. 그리고 지도와 그래프를 이용하여 결과를 바로바로 볼 수 있으니 그 또한 즐겁다. C++로 이걸 해내려면 상상도 하기 싫다. 물론 라이브러리를 이용하면 조금 더 편하긴 하겠지만.. 힘든 일을 이렇게 간편하게 해내니 조금만 해도 벌써부터 고수가 된 느낌도 든다. 예제가 있다는 건 활용은 쉽게 할 수 있다는 얘기니까.

 

  앞부분에 간단한 설명이 있지만 이 책은 기본적인 언어적 지식은 있어야 할 것 같다. 파이썬을 하지 않았더라도  다른 코딩을 해봤다면 분명 쉽게 접근할 수 있을 것 같다. 파이썬의 간단한 코드를 짜봤다면 더 쉽게 접근할 수 도 있다. 사실 DB와 연동해서 보여주는 것도 궁금했는데 그 부분은 찾질 못했다. 대신에 크롤링은 재미나게 했다.

 

  저자가 준비해 둔 자료를 가지고 작업하는 게 아니라 어디서 자료를 찾을 수 있는지도 알 수 있어서 좋았다. 국가 기관에서 이런 데이터를 제공하고 있었고 그 종류도 무척이나 다양했다. 데이터 분석이 필요한 여러 사람에게 간단하게 접근하기 좋은 책이었다. 매뉴얼과 조금만 비교해서 코딩하면 훨씬 다양한 앱도 가능할 듯했다.

 

*한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

>> 이 책에 대하여 검색해 봤을 때, 가장 눈에 띄었던 문구는 '10일 완성'이었다. 책을 받자마자 확인해보니 생각보다 더 가볍고 컴팩트한 도서라고 느꼈다. 금방 다 볼 수 있을 것 같은 느낌? 하루에 한 챕터씩 하면 10일이면 끝난다는 말인 것 같았다 :

 

>> 파이썬의 아주 기본부터 다루기 때문에 프로그래밍 자체를 처음 입문하는 독자들도 쉽게 읽고 흐름을 따라갈 수 있다. 다만 줄글로 표현되어 있는게 호불호가 갈릴 수는 있을 것 같다. 방대한 양은 아니라 독서하듯이 키워드 별로 쭉쭉 읽으면서 자잘한 연습문제를 따라하면서 이해할 수 있을 듯하다. 중간 중간에 자주 나오는 키포인트와 연습문제(예제)에 대한 풀이가 상당히 자세히 되어 있는 점이 좋은 것 같다. 영상보다 텍스트로 공부하는 것을 선호하는 사람으로써 아주 만족스러웠다.

 

>> 특이한 점이 또 있었다면, 챕터 하나가 끝나면 나오는 연습문제 중 마지막 문제는 Google Colab on Smartphone이라는 이름으로 PC가 아닌 스마트폰으로도 가볍게 코딩을 하면서 복습을 할 수 있었다. 물론 PC로 진행해도 상관은 없음

 

>> 단, PART1은 파이썬이나 다른 언어를 한 번이라도 공부한 사람들은 하루만에 가볍게 훑고 뒤로 넘어가는 것이 좋겠다고 느꼈다. 그렇게 심도 있는 내용을 다루지 않기 때문이죠..ㅎ

 

>> Part2는 목차만 봐도 알 수 있다시피 각각의 흥미진진한 테마들로 다양한 분석 방법을 학습이 가능하다. 특히, 가상의 데이터가 아닌 공공 데이터를 활용했기 때문에 더 몰입감 있게 따라갈 수 있었다.

 

>> 몇 달 전에 다른 교재로 파이썬으로 데이터 분석하는 공부를 했었는데 체감 난이도는 이 책이 더 쉬운 것 같다. 부담감도 적구! (이건 그 책을 먼저 봤어서 이게 쉽다고 느낄 수도 있음... 개인적인 의견!)

 

* 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

데이터분석을 배울 때 파이썬으로 시작을 합니다. 분석을 하고 싶지만 어떻게 해야 할지 방법을 모르는 경우가 많습니다.

리뷰하는 도서는 그런 문제를 조금은 헤쳐나갈 수 있게 해 줍니다.

실제 사례를 가지고 데이터를 분석하는 방법에 대해서 설명을 해 줍니다.

IMG_6020.jpg

 

도서의 특이한 점이라고 생각한게 단순히 문법을 설명하기 위해서 딱딱한 제목이 아닌 연관된 내용을 이용해서 설명을 하려고 했다는 점입니다. 문법이 재미가 없지만 그나마 연관성을 두어서 약간의 흥미를 유발하게 한게 재미있었습니다.

2부인 6장부터 실제적인 데이터를 이용하여 분석하는 내용이 나옵니다.

 

reviewer_202304_02.png

내용을 보고 따라하면 대부분 어렵지 않게 결과가 나오는 형태로 되어 있습니다. 대신 코드가 따로 적어져 있는게 아니라 캡쳐 형태로 되어 있어서 일부 구간에서는 글씨가 작게 보이는게 책만 보고 따라 치는게 조금은 어려운 경우가 있습니다.

물론 제공해주는 git에 가면 소스와 데이터가 있어 비정상적이거나 어려울 때 해당 소스에서 받은 데이터로 진행을 할 수 있어서 기능을 익히는데 어려움은 없습니다.

여러가지 유형의 분석 과제를 설명해 주어서 필요한 부분을 익히고 추가로 다른 것을 공부할 수 있게 하는 역할을 하는데 좋아 보였습니다.

분석이라는 것은 언제나 데이터를 수집하고 정합성을 맞추고 하는 어려움의 연속이지만 그래도 재밌게 연습할 수 있는 도서라고 생각이 됩니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

이 책으로 인해 같은 주제지만 다른 관점으로 접근한 책도 읽어야 한다는 것을 새삼 깨닫게 되었다. 즉, 개발자가 쓴 데이터 분석, 데이터 분석가가 쓴 데이터 분석, 개발자가 쓴 파이썬 언어, 데이터 분석가가 바라본 파이썬 언어.

같은 얘기를 하는데, 다른 얘기를 하는 것 같으면서도 모두 맞다. ㅎㅎ

 

이 책의 대상 독자는 비전공자를 대상으로 한다고 적혀있는데, 개인적으로 난이도는 초급 이상이다. 지면(328페이지)에 비해 다루는 분야가 어마어마하다.

 

파이썬 문법, 데이터 분석 라이브러리(넘파이, 판다스), 시각화, 머신러닝 라이브러리, 통계 라이브러리, 통계 이론, 엑셀, 정규식, 셀레니움, NLP, DB, 상관관계 분석, 선형 회귀, 로지스틱 회귀, 시계열 분석 등등 (ㅋㅋ)

 

하지만, 읽으면서 데이터 분석에 대한 접근 방식이 반복적이어서 잘 읽힌다. 예제가 쉽다. 그리고 아주 꼼꼼하게 잘 설명해 준다. 스마트폰에서도 할 수 있다. 지도위에 시각화하는 방법도 어렵지 않았다.

 

특히, 마음에 드는 것은 데이터를 제공하는 출처를 자세하게 알려준다는 것이다. 공공데이터포털, e-나라지표, KOSIS, 한국은행, 서울시 교통정보등 실생활에 밀접한 공개 데이터가 어디 있는지 알 수 있다.

 

파이썬에 대한 접근 방식도 마음에 든다. "내장 함수는 모두 외울 필요는 없습니다. 필요한 기능을 가진 함수는 검색을 통해 빠르게 찾을 수 있습니다."가 'KEY POINT_'로 알려주는 내용이다. 아주 시원하다. 매우 공감이 간다.

 

데이터 설명도 짧은 지면이지만, 매우 쉽게 설명하여 이해가 잘 되었다. 분석 과정이나 설명도 두말하면 잔소리

분석 과정에서 주의할 점도 꼼꼼히 알려준다.

 

책의 구성은 크게 2개의 파트로 구분하고 있는데,

'PART 1. 생활 데이터로 배우는 파이썬 기초 문법'에서는 파이썬 문법에 관해서 설명하고

'PART 2. 데이터 수집 및 분석하기'에서는 실생활과 밀접한 주제를 대상으로 다양한 분석하는 방법을 제시한다.

 

0장에서는 책의 전반적인 설명과 개발 환경에 관해서 설명하고

PART 1의 1장은 기술의 변화와 빅데이터, 인공지능에 관해서 설명한다.

2장은 파이썬의 연산자, 변수, 자료형에 과해서 설명하고,

3장은 튜플, 리스트, 딕셔너리,

4장은 조건문과 반복문,

5장은 함수와 클래스로 마무리한다.

PART 2의 6장은 정형 데이터 분석을 주제로 분석 예제를 다룬다.

7장은 비정형 데이터에 대해서 크롤링하는 방법과 자연어 처리에 대한 주제를 설명하고,

8장은 데이터 특성 간의 상관관계에 대한 예제를 설명한다.

9장은 선형 회귀, 로지스틱 회귀, 인공지능, 딥러닝과 관련된 주제로 예제를 설명하고

10장은 시계열 분석으로 예측과 관련된 주제 설명으로 마무리한다.



PART 1의 각 장은 먼저 이론을 소개하고 연습 문제 및 풀이, 스마트폰 실습 순으로 구성되어 있다. 연습 문제 풀이 중간중간 'KEY POINT_'로 참고 사항이나 주의사항을 알려준다.

PART 2는 분석할 데이터를 수집하는 방법, 전처리, 분석 방법 소개, 연습 문제 및 풀이로 진행하며, 비슷한 분석 방법에 관한 3~4가지 주제를 반복적으로 설명한다. 마지막으로 스마트폰 실습 순으로 마무리한다. PART 1과 마찬가지로 연습 문제 풀이 중간중간 'KEY POINT_'로 참고 사항이나 주의사항을 알려준다.

 

데이터를 분석하는 방법은 매우 많다. 그래서 데이터에 맞는 가장 적절한 분석 방법을 사용해야 하는데, 이 책은 주제별로 많은 예제를 반복적으로 학습시켜 주니까 도움이 많이 되었다.

분석을 위한 주제 선택이 아닌, 주제에 맞는 분석 기법을 설명하고, 그 주제는 주위에 있음 직한 내용이어서 재미있고, 어렵지 않았다.

 

아쉬운 점은 각 장의 제목에 신경을 많이 쓴 것 같은데, 내용과 매치가 잘되지 않았다.

하지만 각 장의 소제목은 너무 매력적이고 나의 흥미를 붙잡는데 성공 했다.

그리고 책에서 사용하지 않는 파이썬 문법까지 너무 깊게 들어간 건 아닐까? 하는 의구심도 생겼다. 대신 PART 2를 더 늘려주세요~

개인적으로 'KEY POINT_'의 내용이 인상 깊었으며, 하지만 스마트폰 실습은 생산성이나 효율적인 면에서 의미가 없다고 생각되었다. 스마트폰 브라우저로 구글 콜랩을 실행하는 거 아닌가?

마지막으로 0장의 도입부는 매우 좋았는데, 10장 마무리는 뭐지? 이렇게 끝나나? 다음 책도 기대되는데 ㅠㅠ

 

책 커버와 디자인도 깔끔하고, 코드나 'KEY POINT_' 구성은 높은 점수를 주고 싶다. 보기 편했다.

  

마지막은 프로그래밍 언어에 대한 내 개인적인 생각과 매우 닮아서 책 내용의 일부를 인용하며 마무리한다.

읽어주셔서 감사합니다.



한 개의 프로그래밍 언어만 제대로 사용할 수 있다면 다른 언어는 쉽게 배울 수 있습니다. 이는 표준어를 사용하는 사람이 방언을 쓴 사람과 의사소통에 큰 어려움이 없다는 것과 일맥상통합니다. 

0장 들어가며, p21

 

"한빛미디어<나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

사실 파이썬 책은 엄청 많은데, 종류도 많고 난이도도 그 만큼 다양합니다. 개인적으로 파이썬 책을 참 많이 봤는데, 요리로 비유하자면 간단한 김치볶음밥과 같은 집밥을 만드는 책도 있고, 호텔에서 쓰는 요리를 만드는 책도 있고, 분자요리를 만드는 책, 디저트를 만드는 책 만큼 정말 다양합니다. 

 

그래서 파이썬을 배우고 싶은 사람은 자신이 평일 점심시간에 메뉴를 고를 때 무슨 요리를 좋아하는지, 무엇을 먹을지 정해야 하는 것 처럼 먼저 카테고리를 정해야 합니다. 

 

그런 의미에서 이 책은 "도시 생활 데이터"를 활용한 데이터 분석 방법을 다루게 됩니다.  그래서 평소에 이러한 데이터를 다루었던 독자나, 저와 같이 매일 컴퓨터 데이터를 다루는 사람들에게 새로운 별미 같은 데이터를 다뤄보기를 원하는 독자에게 추천합니다. 

 

모든 파이썬 책이 그렇듯  책의 첫 파트는대략적인 개요와 함께, 기본적인 파이썬 언어를 다룹니다.

 

파이썬 실행은 보통 PC에 직접 설치하여 구동하거나, 클라우드 처럼 무료로 제공해주는 구글 Colab 으로 할 수 있는데, 이 책에서는 구글 Colab을 사용하도록 권장합니다. 프로그래밍 언어를 배울 때 설치와 구동에서 막히면 정말 막막한 경우가 많은데, 이렇게 클라우드에서 직접 실행하면 복잡한 과정을 생략할 수 있습니다.  

 

파이썬이 어느 정도 익숙한 독자라면  2부인  "데이터 수집 및 분석하는 단계" 부터 읽어보는 것을 권장합니다. 번역서와 다르게 국내 데이터를 기준으로 만들어졌기 때문에 우리에게 더 친숙하고 이해를 쉽게 할 수 있습니다. 예를 들어 번역서의 경우 보통 스타워즈 인물도나, 영화, 혹은 외국인 이름에 대한 데이터를 가지고 예시를 두게 되는데, 이 책에서는 국내의 "경기도 수원시 어린이보호구역 내 일평균 유동인구 데이터" 처럼 바로 어떤 데이터인지 이해도 쉽고, 이걸 가지고 어떻게 요리 하면 좋을지 상상력을 자극하는 데이터들을 다룹니다. 

 

이렇게 정적인 데이터를 다른 방식으로 표현하는 데이터 처리도 재밌고, 웹에서 직접 크롤링하여 비정형 데이터를 전처리 하여 처리하는 것도 좋지만, 개인적으로 이 책의 가장 재밌었던 부분은 두 가지 이상의 서로 다른 데이터를 조합하여 그 사이에서 관계성을 찾아내는 과정 이었습니다. 

 

그리고 이러한 상관관계를 분석하기 위하여 다양한 기법(피어슨, 스피어먼, 켄달) 을 소개해주는 점도 좋았습니다.

그 뒤로 시계열분석이나, 주식분석에 관한 이야기도 맛보기 만큼이지만, 상세하게 다루는 점도 좋았습니다. 

책을 리뷰하면서 번역서가 줄 수 없는 국산데이터를 다룬 다는 점과, 쉽고 재미있게 설명되어 있는 점에 높은 점수를 주고 싶습니다.

 

​"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

#파이썬 #데이터분석 #한빛미디어 #도시생활데이터 #국산데이터

KakaoTalk_20230423_232234434.jpg

 

 

바야흐로 데이터 분석의 시대다. 많은 회사/조직에서, 기반 데이터를 사용해 유의미한 분석 결과를 도출하여 사용한다.

 

그렇다면 데이터 분석을 어떻게 시작할 수 있을까? 이 지점에서 많은 답안으로 나오는게 파이썬을 활용한 데이터 분석이다. 다른 코딩 언어에 비해서 파이썬은 문법이 간단하고, numpy,pandas와 같은 빅데이터 분석 / 인공지능 예측등과 같은 라이브러리가 잘 구성되어있다는 장점이 있다.

 

본 책은, 이러한 파이썬과 데이터분석을 쉽고 간단하게 알려준다.

 

파트1은 자료형/조건문,반복문/함수,클래스 등과 같은 파이썬 기초 문법을 설명한다.

파트2는 정형,비정형 데이터 분석/크롤링/상관관계,회귀,시계열 분석들을 다룬다.

 

설명과 실습에 사용된 모든 소스 코드와 실습 데이터는 별도의 Git Repository를 통해 제공된다.

쉽게 준비할 수 있는 구글 콜랩 환경에서, 여러 시나리오를 상정한 데이터 분석 실습을 통해 기본기를 익히기에는 충분할 듯 하다.

다만 기초 파이썬 문법부터 실제 라이브러리 활용까지 이 한권으로 익히기에는 조금 어려움이 따를 수 있을 듯하다.

본 책을 통해 기본적인 개념과 흐름을 파악한 뒤, 조금 더 심화 영역에 관심이 생기면 해당 부분에 대한 공부를 이어가는것이 적절할 듯 하다.

 

> “한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

 

[서론]
 
<나도 하는 파이썬 데이터 분석>은 파이썬을 이용하여 데이터 분석에 입문하고자 하는 초보자를 대상으로 쓰인 책이다. 데이터 분석은 현재 매우 인기 있는 분야이며, 파이썬 역시 데이터 분석을 위한 언어로 널리 사용된다. 이 책은 이러한 분야에 관심 있는 사람들이 쉽게 따라 할 수 있는 방식으로 파이썬 데이터 분석의 기초부터 실전까지 다룬다.
 
[문체]
 
이 책의 문체는 쉽게 이해할 수 있도록 구성되어 있다. 초보자들도 이해하기 쉬운 단어와 문장으로 구성되어 있으며, 파이썬의 기본 문법을 이해하고 있다면 쉽게 따라할 수 있다. 또한, 데이터 분석의 개념을 이해하는 데 필요한 내용들도 쉽게 설명되어 있어 초보자들도 어렵지 않게 이해할 수 있다.
 
[내용]
 
초보자들을 특별히 배려한 책이다. 1부에는 연산자, 변수, 자료형, 조건문, 반복문, 함수, 클래스라는 파이썬 기초 개념에 대해서 130페이지를 할애하며 충분히 기초 설명을 진행한다.
 
2부에는 전형 데이터 분석, 비정형 데이터 분석, 상관관계 분석, 회귀 분석, 시계열 분석의 순으로 진행되며, 데이터 수집, 전처리, 시각화, 분석까지 다양한 내용을 다룬다.
 
[장점]
 
초보자들이 파이썬을 이용하여 데이터 분석을 처음 접하는 경우에 매우 유용한 책이다. 파이썬을 이용한 데이터 분석에 대한 개념과 기본 문법부터 실제 데이터를 수집하고, 전처리하고, 시각화하는 방법 등 다양한 내용을 다룬다. 또한, 다양한 실제 예제들이 제공되어 있어 실습을 통해 초보자들도 쉽게 이해할 수 있다. 또한, 책에 포함된 데이터와 코드를 이용하여 실제로 데이터 분석을 직접 해보는 것이 가능하여, 실제로 적용해보고 경험할 수 있는 좋은 기회가 된다.
 
[단점]
 
이 책은 초보자들을 대상으로 쓰인 책이기 때문에, 데이터 분석의 전반적인 내용을 간략하게만 다루고 있다는 점이 단점으로 꼽힐 수 있다. 방대한 데이터 분석의 분야를 모두 체험하기 어렵다는 점이 살짝 아쉽고, 독자의 이해도를 높이기 위해서 numpy 나 pandas에서 간결한 방식으로 처리할 수 있는 부분도 일부 반복문으로 풀어쓴 부분이 장점이자 동시에 단점으로 작용한다.
 
[결론]
 
이 책은 초보자들이 데이터 분석을 시작하기 위한 좋은 출발점이 될 수 있는 책이다. 파이썬을 이용하여 데이터 분석을 처음 시작하려는 분들에게는 적극 추천할만하다. 전반적으로 내용 구성이 보기에 깔끔하게 잘 구성되어 있다. 다만, 독자가 타이핑하면서 작성해야하는 소스코드 부분이 모두 화면 캡처로 처리되어, 긴 코드는 글씨가 너무 작아진 점이 일부 불편한 점이 있다.
 
 
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
 

 

** 본 리뷰는 한빛미디어 <나는 리뷰어다> 리뷰어 활동으로 도서만을 제공받아, 리뷰어의 주관적인 견해로 작성된 리뷰입니다. **

나도 하는 파이썬 데이터 분석 책은 크게 1부, 2부로 나누어져 있습니다.

1부 - 생활 데이터로 배우는 파이썬 기초 문법

 

1부.jpg

 

2부 - 데이터 수집 및 분석하기

2부.jpg

 

이 책은 비전공자이면서 파이썬, 데이터 분석이 무엇인지 전혀 모르는 분들에게 적합한 아주 좋은 책이라고 생각합니다.

1부의 제목을 보면 짐작할 수 있겠지만 파이썬으로 데이터 분석을 어떻게 하는지, 데이터 분석을 하는데 필수 기초 문법을 아주 쉽게 설명하고 있습니다. 그래서 문과생이라는 분들에게 강력히 추천합니다.

본격적인 데이터 분석은 2부에서 시작합니다.

* 정형 데이터 분석 : 공공데이터포털에서 데이터 수집

* 비정형 데이터 분석 : 웹 크롤링으로 데이터 수집

* 상관관계 분석 : 구글 검색으로 데이터 수집

* 회귀 분석 : (깃허브에서)제공된 데이터를 이용하고 엑셀과 연동한 분석

* 시계열 분석 : (깃허브에서)제공된 데이터를 이용하여 분석

 

이 책이 다른 데이터 분석 책과 비교할 때의 특징이 있습니다.

폰에서 구글사용.jpg

 

첫 번째, 위의 그림과 같이 스마트폰에서 구글 콜랩에 접속하여 어디서나 시간이 나는대로 실습하고 공부할 수 있다는 아주 큰 장점을 제공합니다.

두 번째, 도시 생활 데이터를 활용한 데이터 분석 실습 및 공부를 할 수 있습니다.

 

마지막으로 비전공자도 아주 쉽게 실습하고 공부할 수 있게 구성이 되어 있습니다. 많이 두껍지도 않아서 잘 넘어갑니다.

데이터 분석 공부를 파이썬으로 처음 시작하고자 하시는 모든 분들에게 강력하게 추천드립니다.

이상으로 리뷰를 마칩니다.

 

꼭 웹 개발 등을 위해서가 아니라 데이터 분석 및 활용에 효율적인 프로그래밍 언어이기 때문에 요즘은 중, 고등학교에서도 파이썬을 배울 만큼 파이썬 사용량이 갈수록 늘어나고 있는데요. 저도 빅데이터 시대에 데이터를 효율적으로 분석하고 다루는 법을 알고 싶다는 생각에 <나도 하는 파이썬 데이터 분석> 도서를 틈틈이 공부하고 있어요. 

 

한빛미디어 <나도 하는 파이썬 데이터 분석> 도서는  꼭 내가 데이터 전공자이거나 통계학 전공자가 아니더라도 나에게 필요한 그리고 내 업무를 더 효율적으로 하기 위한 파이썬 데이터 분석법을 배우고 다양한 실제 데이터로 분석을 어떻게 하는 것인가 A to Z를 제대로 배울 수 있는 책인데요. 

 

파이썬 기초 문법부터 개발 환경 세팅이 필요 없는 구글 CoLab 실습환경 안내 그리고 실제 생활 데이터를 어디서 수집하고 어떻게 분석하고 해석하는지에 대한 모든 내용이 담겨있습니다.

 

20230423_195013.png

 

앞부분에서 파이썬 기본 문법을 익히고, 가상의 데이터가 아닌 실제 데이터를 활용해 파이썬으로 데이터 분석하는 법을 익힐 수 있는데요. 정형 데이터, 비정형 데이터, 상관관계 분석 기법, 회귀 분석 모델, 시계열 분석 등 통계학에 대한 지식이 없더라도 다양한 유형의 데이터를 어떻게 분석하는지를 전부 배울 수 있습니다. 

 

그래서 <나도 하는 파이썬 데이터 분석> 각 장의 실습을 차근차근 따라 하다 보면 당장 내 업무에 필요한 데이터 분석에도 큰 어려움이 없을 것 같아요. 각 장마다 연습문제들도 있기 때문에 데이터 분석 실습에 관한 내용은 전혀 부족함이 없더라고요.  

 

코랩.png

 

특히 이 책을 보면서 좋았던 것은 컴퓨터가 필수가 아니고, 별도의 IDE를 설치하거나 각종 라이브러리를 설치할 필요가 없이 파이썬 데이터 분석을 실습할 수 있는 방법을 알려준 부분인데요. 구글 코랩을 이용하여 스마트폰, 태블릿, pc 등 인터넷 환경만 갖추어져 있다면 간단하게 파이썬 실습할 수 있다는 걸 처음 알았습니다! 코딩 학습을 처음 하는 분들이라도 작업환경 세팅에 고생할 필요가 없어 진입장벽이 낮습니다. 필요한 건 구글 아이디와 인터넷 환경뿐이어서 정말 틈틈이 시간 날 때 학습할 수 있어요.

 

또한 나에게 필요한 데이터를 어디서 어떻게 수집할 수 있는지에 대한 예시가 잘 나와있는 것도 굿! 공공 데이터 포털, 서울 열린 데이터 광장 등 이미 잘 정리된 데이터를 모아놓은 곳들이 있기 때문에 꼭 책에 나온 데이터가 아니라 나에게 필요한 데이터를 찾아 바로 활용할 수 있습니다. 

 

데이터 분석에 관심이 있는 분들이라면 파이썬 기초 문법부터 실제 데이터를 수집, 분석, 해석하는 방법을 총망라하여 나만의 데이터 분석 방법을 만들기 어렵지 않게 도움을 주는  한빛미디어 <나도 하는 파이썬 데이터 분석> 도서로 데이터 분석에 입문해 보시길 추천드립니다! 

 

** 본 리뷰는 한빛미디어 <나는 리뷰어다> 리뷰어 활동으로 도서만을 제공받아, 리뷰어의 주관적인 견해로 작성된 리뷰입니다. **

 

수많은 데이터 분석 관련 쿡북들이 쏟아져 나오는 요즘이다. 그래서 양질의 책을 선별하는 것도 굉장히 어려워 졌다. 현재 뒤늦게 통계학 석사학위를 받는 나에게는 여러 고민들이 많은데 그 중 하나가 '실무적 분석방법론의 부재' 이다. 대학원에서 다루는 데이터 관련 예제들은 굉장히 일반적인 내용, 혹은 이론에 치우쳐져 있는 경우가 많다. 박사 진학에 큰 관심이 없는 나는 실제로 내 본업의 프로젝트에 어떻게 데이터 분석을 활용할 수 있을지가 더 궁금하다. 그래서 책을 고를 때 그 부분을 유심히 따지는데, 이 책에 실린 데이터와 예제들을 봤을 때 꽤나 놀랐다. 도시형 데이터를 사용하여 실제 생활에서 정말 필요하고 알고 싶은 문제들을 직접 구현해볼 수 있다는 게 너무 좋았다. 이 책을 몇번 정독하고 난 뒤에는 여기 나오는 프로젝트들을 기반으로 다음 학기부터 공모전 등에도 도전할 수 있지 않을까 하는 기대가 든다.

 

그렇다면 책의 구성은 어떨까? 책은 크게 두 부분으로 나뉘어 있는데, PYTHON 기초 문법 + 데이터 분석으로 보면 될 듯 하다. 1부는 Python을 모르는 입문자도 천천히 따라하면서 학습을 할 수 있도록 쉽게 설명이 되어 있고 앞서 말한 것 처럼 예제가 풍부하다. 무엇보다 Python은 C나 자바에 비해 진입장벽이 낮은 언어이니 프로그래밍을 아예 모르는 사람이라도 괜찮을 것이라 생각한다. 물론 쿡북의 한계는 항상 생각해야 한다. 진짜 실력을 기르기 위해서는 절대적 시간투여가 필수적이다. 이는 비단 프로그래밍에 국한된 사항은 아니므로 굳이 설명할 필요는 없을 것 같다.

 

2부인 데이터 분석 부분은 이 도서의 핵심파트로 데이터 분석에 유용하게 쓰이는 Python 라이브러리를 기본으로 간단한 예제를 통해서 적용을 알아본 다는 점이 특징이라 할 수 있다. 구성은 정형 데이터 분석, 비정형 테이터 분석, 크롤링, 상관 관계 분석, 회귀분석, 시계열 분석으로 나누어 설명하는데, 선형대수, 미적분 등 기초수학에 대한 배경지식이 없어도 이해하기 쉬운 문장으로 설명이 되어 있어 괜찮을 것이라 생각한다. 물론 본인이 고급 데이터 분석을 하고 싶다면 통계학 및 기초수학은 피할 수 없는 숙명이다.

 

책의 또다른 장점은 역시 Google Colab을 이용하여 프로그램 설치 없이 쉽게 따라살 있다는 점이다. 데이터의 양이 기하급수적으로 늘어난다면 코랩의 한계가 드러나겠지만, 교육용 서적을 마스터하는 정도라면 코랩의 기능은 부족함이 없다. 특히 프로그래밍 언어의 특성상 PC환경에 따라 설치 조차 어려운 경우가 많다. 많은 리뷰들이 예전 버전을 기초로 설명하고 있기에, 생각지도 못한 오류가 나올 때가 있기 때문이다. 그러나 이 책은 철저히 독자가 초보자라고 가정하고 설명하므로 설치부터 쉽게 시작할 수 있고, 데이터 분석도 실생활에서의 예제들을 통해 설명하여 진도를 나아간다. 결론적으로 데이터 분석을 처음 시작하는 사람들에게 입문서로 추천해 주고 싶은 책이다.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

한빛미디어 출판사의 <나도하는 파이썬 데이터 분석> 리뷰

파이썬 + 데이터 분석의 조합이라니! 파이썬과 데이터 분석 모두 트렌드인데 이 둘을 동시에 배울 수 있다 ?

그 점에서 이 책을 추천한다.

다른 프로그래밍 언어와 다르게 파이썬은 데이터 분석과 가장 밀접하게 언급되는 언어이다. 비전공자들이 가장 쉽게 접할 수 있으며 영어 문법과 구조가 비슷하여서 친숙하게 접근할 수 있다는 것이다. 마치 일본어가 한국어와 어순이 같아서 친숙한 것처럼..

 

이 책의 구조는 크게 2 파트로 나누어져있다.

1부.파이썬 기초 문법

2부. 데이터 분석 스킬

2부가 이 책의 핵심이라고 생각하면 될 듯하다.

 

1부에선 파이썬 기초 문법들이 개념 설명과 실습 예제등이 나와있어 따라하며 익히기 좋다. 프로그래밍 문법의 기본적인 키워드 중심으로 서술되어있고, 아마 개발자이거나 c나 java 언어 프로그래밍 언어를 학습해본 사람들은 거의 유사한 개념 구조로 쉽게쉽게 파악하고 넘어갈 수 있을 것이다. 문법만 조금 다를 뿐 파이썬도 프로그래밍 언어이다.

(특이하게 이 책에서는 구글 콜랩 사용법도 서술되어있다. 나는 처음알게된 사실이여서 신선했다.. 역시 최신 도서를 읽어야한다. 스마트폰이나 태블릿으로도 간단한 파이썬 코딩이 가능하다. 그래서 1부의 실습들도 쉽게 할 수 있을 것 같다. )

 

2부가 이 책의 핵심이라고 생각한다. 데이터 수집 방법 및 분석 방법.

책에서 다루고 있는 것 : 정형 데이터 분석, 비정형 데이터 분석, 크롤링, 상관관계 분석, 회귀 분석, 시계열 분석.

이런 어려운 분석법들을 실생활의 언어로 호기심을 이끌어내어 개념을 서술하고 있다.

 

파이썬과 데이터 분석을 동시에 입문해보고 싶다면 이 책이 많은 도움이 될 것같다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

파이썬을 통해 어떻게 데이터를 다루는지에 대해서 예제를 통해 쉽게 배우기 좋은 책입니다.

1,2부로 나뉘어 전반 1부에서는 기초적인 파이썬의 개념들에서 필수적인 개념들과 약간의 예제들로 이루어져 빠르게 파이썬을 학습할 수 있으며, 이해되지 않는다면 부분은 수업이나 검색을 통해 채울 수 있을 만큼.

강의나 독학용으로 좋다 느껴졌습니다.

2부에서는 파이썬을 통해 여러 데이터를 어떻게 처리해야하는지를 알수 있습니다.

단순한 파이썬 개념 책이라면 문법 학습과 약간의 예제로 끝이지만, 이책은 절반 가량의 분량으로 앞서 1부로 학습한 파이썬 개념을 실제 활용하여 어떻게 하면 데이터 분석가로서 혹은 본인의 업무에 도움이 되고 활용하는지를 느낄 수 있게 해주는 책입니다.

 

단순히 책 제공을 통해서 드는 생각이 아니라 이런 형식의 책들도 많이 나오면 좋겠다는 생각이 들더군요

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

책 소개

 

 

  • 책 제목: 나도 하는 파이썬 데이터 분석
  • 글쓴이: 김규석, 김현정
  • 출판사: 한빛미디어
  • 초판 1쇄: 2023년 3월 10일

 

파이썬, 사랑받는 프로그래밍의 시작이 되다.

 

 

 

몇년 전만해도 파이썬이 유명하지 않았던 시기가 있었다.

(라떼를 내리고 싶지는 않지만 쉬운 예를 들자면 본인의 대학 때, 프로그래밍 입문이라는 강의는 스몰 베이직이라는 것을 이용해 그림을 그리고 게임을 만들었던 기억이 있으나, 그것은 몇년 후 파이썬으로 언어가 바뀌게 되었다.)

 

그러나, 어느새 파이썬은 프로그래밍 언어 순위 1위를 3년째 기록할 만큼 사랑받는 언어가 되었다. 감히 그 이유에 대해 말해보자면, 다소 쉬운 편으로 진입 장벽이 낮고, 데이터 분석에 용이하기 때문도 크다고 생각한다.

 

처음 프로그래밍 언어를 고를 때, 데이터 분석에 쉽게 사용할 수 있다는 것은 매우 큰 장점이다. 

그리고 해당 책은 그런 장점을 어필하는데 매우 특화되어있기에 그에 맞추어 소개해보고자한다.

 

 

 

다루는 예제들의 유혹. 이래도 안볼거야?

보통 책을 사기 위해 볼 때, 어떤 것을 우선적으로 보는가? 본인의 경우는 리뷰들을 먼저 보는 경우도 있지만, 대다수의 경우는 목차에서 구성이 어찌 되어있는지 어떤 내용들을 다루고 있는지들을 중요시 하곤 한다. 그런면에서 만일 어떤 파이썬 책을 살지 고르고 서점에 간 것이 아니라면 해당 책은 내가 주저하지 않고 사게될 책이었을 것 같다는 생각이 강하게 들었다.

 

그 이유는 아래 목차만 보아도 느낄 수 있을 것이다.

프로그래밍 기본서들에서 예제들을 정말 중요한 것이다. 내가 직접 해보며 학습하게되는 주체이기 때문에, 흔히 사용되는 타이타닉 생존자 계산하기 이런 예시들을 보게 되면 그냥 지루하게 하게되고는 한다. 그러나, 해당 목차만 보아도 느끼는 바가 있지 않은가?

M 그리고 Z 세대의 취업률 상관 계수, 어린이집이 집값에 끼치는 영향, 아파트를 팔아야할까? 이런 실제 생활과 직접적으로 관련있는 주제들은 마치 네이버 메인의 기사 제목 같이 센스있다. 클릭 해보고 싶고 궁금하게 만드는 제목들이다. 실제로 내가 해보며 그 답을 알고 싶을정도로 독자들이 묘하게 궁금할 것들을 정확하게 잘 짚어내었다.

 

위에 예시들을 기사로 들었는데, 내용이 간혹 낚시라고 생각되는 기사들과는 달리 해당 책은 내용 또한 정확하다.

흥미로운 제목 하위에는 해당 분석 방법을 사용하는 이유, 데이터 수집을 위한 csv 파일을 구하는 과정까지 자세히 설명되어있다.

 

처음부터 끝까지 예제들이 하나같이 흥미로웠기 때문에 처음 책을 펼친 그 두근거리는 텐션 그대로 끝까지 완독할 수 있도록 잘 짜여져있으며, 그 내용 또한 알차다는 큰 장점으로 데이터 분석의 재미를 독자에게 알려주기 최고의 책일 것이다.

 

 

 

 

 

필요한 것은 다 있는 개념 설명

저렇게 흥미로운 제목들로 하고 싶은 마음은 가득하지만 실제로 프로그래밍 조차 처음이라서 막막한 독자들이 있을 것이라고 생각한다.

해당 책도 파이썬이 프로그래밍 입문 언어로써 그러한 독자들이 많다는 것을 충분히 인지하고 프로그래밍 언어의 히스토리부터 빅데이터 까지 전형적인 시작하는 내용부터 프로그래밍 언어의 기본 내용들까지 베이스로 알아야하는 것들을 전부 포함하고 있다.

약 130 pg 정도의 설명으로 간략하지만 그렇다고 부족한 내용은 하나도 없을 정도로 알차고 확실하게 담고 있다.

 

그리고, 데이터 분석도 csv 등 데이터들을 수집할 수 있는 사이트들 심지어는 검색하는 방법들까지 설명해주고 있기 때문에 차후 직접 분석하고자 하는 주제를 찾아 스스로 수행하기도 전혀 무리가 없게 독자들을 이끌어간다.

 

그렇기에 해당 책으로 파이썬의 처음을 시작하고 데이터 분석으로 흥미를 키우는 역할을 매우 충분히 수행하고 있다고 느꼈다.

 

추천 대상

해당 책은 프로그래밍과 데이터 분석에 흥미를 유발하는데 최적화되어있기 때문에,

데이터 분석을 해보고 싶은 사람들과 심지어는 프로그래밍 자체가 처음인 독자들에게 추천하고 싶다.

 

 

한줄평

파이썬 데이터 분석, 해보고 싶게 만드는 최고의 센스를 발휘하다



 

Author: 김규석, 김현정 지음

출판사: 한빛미디어

요즘 우리는 AI광풍의 시대에 살고 있다. TV나 매체에서 얘기하는 것들을 들어보면 게임이나 공상과학 영화에서나 생각할법했던 일들이 어느새 실현되고 있는 느낌을 받는다. 여기서 AI의 정의를 간단하게 생각해보자면 우리가 하는 일들 (사고하고 적절한 행동을 하는 것)을 기계에게 학습시켜서 그대로 행하게 하는 것이다. 광의적인 개념이지만 궁극적으로 생각하면 마블영화 아이언맨의 자비스를 생각하면 된다.

자! 그럼 자비스를 만들어 보려고 하는데 무엇부터 해야할까? 아직 우리는 강 인공지능(아이언맨 자비스)이 아니라 약 인공지능(시킨것도 아직 제대로 못함, 사람의 개입이 필요)의 세계에 살고 있다. 다시 줄여서, 약 인공지능의 시작은 어떻게 해야하는 걸까? 간단하다. 데이터다. 
기계는 데이터로부터 패턴을 학습하고 예상 결과를 내 놓는다. 그리고 요즘 핫한 인기인 파이썬과 더불어 데이터 분석을 할 수 있으면 좋을것 같다.

그런 의미에서 나도 하는 파이썬 데이터 분석은 지금 막 데이터 분석을 시작하려고 하는 예비 데이터 과학자나 개발자들에게 매력적인 책이다. 일부 데이터 관련 도서는 파이썬은 이미 알고 있다는 것을 가정하고 시작하는 경우가 많다. 하지만 이 책은 파이썬에 대한 기본을 책의 1/3정도 이상의 분량을 할애해서 제공하고 있다. 파이썬 + 데이터 분석 책인 셈이다.
이 분야에서는 아직 초보인 내 입장에서도 파이썬 문법을 다시 한번 짚어주고 데이터 분석을 할 수 있어서 좋았다.

이 책의 또다른 장점은 친절하다. 요즘 안그런 책이 어디있겠냐만, 이 책의 친절함 한부분을 소개하자면 데이터와 소스코드 부분을 명확하게 분리해서 독자들을 혼란스럽게 하지 않는다는 점이다. 데이터가 이미 다운로드 되어 있기 때문에 인터넷 검색을 거쳐 다시 데이터를 csv형태로 다운로드 받지 않아도 된다. 물론 다운로드 받는 방법도 상세히 설명하고 있다.

마지막 장점은 무겁지 않다 라는 것이다. 업무와 공부를 병행하는 직장인들 입장에서는 시간을 내서 공부하는 것도 어려운데 특히, 데이터 분석 분야는 수학으로 시작해서(어려운 수학은 아니지만 다시 공부하려면 초기 투자가 많이 필요) 수학으로 끝난다. 물론 기초수학이 중요하긴 하지만 그건 데이터 분석에 재미를 붙이고 해도 늦지 않다. 이 책은 수학은 철저히 배제했다. 직장인 또는 비전공자의 진입장벽을 낮춰 누구나 언제나 데이터 분석을 할 수 있는 범용 데이터 과학자를 지향하는 것 같은 느낌을 받았다. 개인적으로는 기꺼운 방향이었다.

시간이 부족한 직장인 또는 비전공자들에게 이 책으로 데이터 분석을 시작하길 권한다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평임."

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

아주 마음에드는 파이썬 또는 데이터 분석 책자가 나온것 같다.

크롤링에 관심있는 나로서는 아주 적절한 예시를 가져온것으로 보이며, 프로그램 과정과 디버깅 과정이 마치 내가 작업하는 방법을 그대로 모사한듯한 방식으로 진행하는 내용이어서 눈을 반짝이면서 보게되었다.

모호한 가상의 데이터나 외국 링크를 끌어와서 데이터는 이렇게합니다하는 다른 여타 서적에서의 데이터분석 책자들에서 부족하다(답답하고, 어렵다..) 싶었던 부분을 가장 확실하게 해소해주는것 같다,

크롤링에 관심있는 사람은 더 재미있게 이책을 접 할 수 있을것 같다.

 

20230422_162322.jpg

 

 

당연히 데이터 분석부분은 뒤쪽에서 본격적으로 다룬다, 다만 어렵고 깊은 내용은 아니다.

실생활에 필요한 웹사이트 데이터 분석을 통한 가장 실무적인 데이터 분석이 아닐까 싶다.

이 책을 데이터 분석이 어렵다고 느낀 모든 분께 권한다.



[도서 소개]

10일 완성 나도 하는 데이터 분석!

도시 생활 데이터 기반의 다양한 사례를 실습하며

데이터 분석 인사이트를 키우는 실전 데이터 분석!


‘코로나 시대에 한적한 여행지는 어디일까?’, ‘대출 이율이 오르면 집값은 어떻게 변할까?’, ‘부동산 가격을 예측할 수 있을까?’ 이 책은 친숙한 도시 생활을 주제로 파이썬을 이용한 데이터 분석 방법을 익힐 수 있도록 도와준다. 별다른 개발 환경을 구축할 필요 없이 구글 콜랩을 통해 PC, 스마트폰 등 다양한 스마트 기기에서 데이터를 수집하고 분석하며 자신만의 데이터 분석 인사이트를 키워보자.


[대상 독자]

- 데이터 분석에 관심이 있고 파이썬을 배워 데이터 분석을 하고 싶은분



[주요 내용]

1 부 생활 데이터로 배우는 파이썬 기초 문법

- 연산자, 변수, 자료형

- 튜플, 리스트, 딕셔너리

- 조건문, 반복문

- 함수, 클래스


2 부 데이터 수집 및 분석하기

- 정형 데이터 분석

- 비정형 데이터 분석, 크롤링

- 상관관계 분석

- 회귀 분석(선형 회귀, 로지스틱 회귀)

- 시계열 분석  


[서평]

“나도 하는 파이썬 데이터 분석" 책은 Python을 사용하여 데이터를 분석하는 방법을 배우려는 모든 사람에게 유용한 안내서입니다. 


이 책은 크게 두 부분으로 나뉘는데, 첫 번째 부분은 파이썬 기초 문법에 초점을 맞추고 두 번째 부분은 독자들에게 다양한 데이터 수집 및 분석 방법을 자세히 설명합니다.


이 책의 1부에서는 초보자가 파이썬 문법을 배우기에 좋은 자료로, 연산자, 변수, 데이터 유형, 제어문, 함수 및 클래스 등 파이썬의 기본 개념을 명료하고 이해하기 쉽게 설명합니다. 

이 섹션에서 제공되는 연습문제를 통해 배운 개념을 복습하고 강화하는 데에도 도움이 됩니다.


2부에서는 정형 및 비정형 데이터 분석, 상관관계 분석, 회귀 분석, 시계열 분석 등 다양한 데이터 분석 방법을 다룹니다. Python을 사용하는 각 방법의 실용적인 예제를 제공하여 데이터 분석 프로젝트에서 이러한 기술을 쉽게 이해하고 적용할 수 있도록 합니다. 또한 이 책은 데이터 기반 의사 결정을 내리는 데 중요한 이러한 분석 결과에 대한 명확한 인사이트를 제공합니다.


이 책의 강점 중 하나는 전체적으로 생활 데이터 기반 실제 사례를 사용한다는 것입니다. 저자는 일반적인 데이터 분석 문제의 예제와 Python을 사용하여 이를 해결하는 방법을 제공합니다. 또한 이 책에는 Github에서 다운로드 가능한 코드와 데이터셋이 포함되어 있어 독자가 제시된 개념을 쉽게 따라하고 연습할 수 있습니다.


전반적으로 Python을 사용하여 데이터를 분석하는 방법을 배우려는 모든 사람에게 이 책을 강력히 추천합니다. 이 책은 잘 구성되어 있고 따라하기 쉬우며 데이터 분석 방법의 실용적인 예제를 제공합니다. 초보자이든 숙련된 Python 사용자이든 이 책은 데이터 분석 기술을 개발하는 데 유용한 교재로 추천 합니다.

 

 "한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

한빛미디어 <나는 리뷰어다> 활동을 위해서책을 제공받아 작성된 서평입니다.”

 

그림1.jpg

 

Contents

0장 들어가며

0.1 1부 소개

0.2 2부 소개

0.3 데이터 분석을 위한 개발 환경 준비

 

PART 1 생활 데이터로 배우는 파이썬기초 문법

 

1 4차산업혁명과 빅데이터

1.1 4차 산업혁명과 기술의 변화

1.2 빅데이터란?

 

2장 연필 없이 복잡한 수학 문제를 풀어보자연산자, 변수, 자료형

2.1 1 더하기1?

2.2 a 더하기b?

2.3 1+1=2True or False?

Google Colab on Smartphone

 

3장 갖고 싶은 위시 리스트 아이템 있어?튜플, 리스트, 딕셔너리

3.1 내가 갖고 싶은 물건은 확실하다!

3.2 내가 갖고 싶은 물건은 변할 수 있다!

3.3 내가 갖고 싶은 물건이 얼만지 알고 싶어?

Google Colab on Smartphone

 

4장 철수야, 맨날 학원 가고 독서실만 가니?조건문, 반복문

4.1 파이썬 도서, 다 읽었어?

4.2 오늘은?내일은? 모레는?

Google Colab on Smartphone

 

5장 업무는 효율이 핵심이야!함수, 클래스

5.1 작년에 용돈 얼마 썼어?

5.2 요리는 내가 직접 한다

5.3 냉장고를 정리하자

Google Colab on Smartphone

 

PART 2 데이터 수집 및 분석하기

 

6장 코로나 시기에 한적한 곳으로 여행 가고싶다면?정형 데이터 분석

6.1 정형 데이터 수집하기

6.2 지역별/연령별방문객 순위는?

6.3 지도 위에 표현해보자

6.4 코로나 확진자 수 통계 분석하기

Google Colab on Smartphone

 

7장 우표 수집하니? 난 데이터 수집한다!비정형 데이터 분석, 크롤링

7.1 웹 기반의 비정형 데이터 수집하기

7.2 애국가에서 '대한'은 몇 번 등장할까?

7.3 나만의 빅데이터 저장소를 만들자

Google Colab on Smartphone

 

8장 너와 나의 연결고리상관관계 분석

8.1 M세대와Z세대의 취업률 상관계수는?

8.2 대출 이율이 오르면 우리 집값은?

8.3 집이 비어 있을 땐 허수아비라도 설치해야할까?

Google Colab on Smartphone

 

9장 아니 땐 굴뚝에 연기 날까 _회귀 분석

9.1 모든 일에는 다 이유가 있다

9.2 집 앞에 어린이집이 생기면 집값에 어떤영향을 미칠까?

9.3 내일은 비가 올까요?

9.4 회귀 분석과 인공지능 예측 차이

Google Colab on Smartphone

 

10장 앞만 보는 것이 아니라 뒤도 살펴봐야한다 _시계열 분석

10.1 과거는 미래에 영향을 줄까?

10.2 ARIMA와 인공지능 기반 시계열예측의 차이

10.3 이 아파트를 지금 팔아야 할까? 보유해야 할까 ?

Google Colab on Smartphone

 

 

photo_123.JPG

 

 

 

< 후 기 >

이 책은 비전공자가 쉽게 빅데이타분석을 하기 위해 배워야 하는

파이썬을 이해하기 쉽고 잘 따라 할 수 있도록 쓰여졌다.

요즘에는 전공자이든 비전공자이든 빅데이타분석을 활용해야 하는 시대가

온 것 같다.

정보화시대에서 수많은 데이터를 분석해 유익한 정보로 잘 활용해야 것은

두말하면 잔소리이다

프로그램언어를 사용하는 것이 전공자의 몫이라고 생각했던 시대는 이미

지나갔다.  이제 이 책 한권으로 파이썬을 시작한다면 나도하는 파이썬

데이터분석처럼 어렵지 않게 입문을 할 수 있을 것이다.

이 책이 좋은 것은 초보자에게 딱딱하지 않은 쉬운 설명과 비유 그리고

따라하기 편한 예제들로 쉽게 쉽게 진도를 나갈 수 있는 점이다.

구글 콜랩으로 복잡한 프로그램 설치 없이도 쉽게 시작할 수 있다

파이썬을 시작할 때에 PC환경에 따라 프로그램설치가 어려운 경우도

있으나  이 책은 초보자가 프로그램설치부터 쉽게 시작할 수 있도록 하고

또 데이터분석의 예도 실생활에서의 예제들을 통해 이해하고 진도를

따라가는데 쉬운 길로 인도하고 있다

데이터분석을 처음 시작하는 사람들에게 입문서로 추천해 주고 싶은

책이다

처음엔 쉽게 시작해서 조금씩 어려지긴 하겠지만 하나씩 하나씩

차근히 하다보면 어느새 초보데이타분석가가 되어 있을 것이다.

나도 하는 파이썬 데이터분석이 책이면 바로 가능하리라 본다.

 

photo_0 (2).JPG

 

 

이 책은 1부에서 파이썬 문법을 쉽게 안내하고 연습문제로 확인한 후,

2부에서 다양한 실습을 통해 데이터 분석 방법을 체득하도록 도와줍니다.

흔히 들어보기만 했던 정형 데이터 분석, 비정형 데이터 분석,

상관관계 분석, 회귀 분석, 시계열 분석을 파이썬으로 해볼 수가 있습니다.

또한 이러한 분석을 통해 도출된 결과를 간단히 해석해보기도 하며

데이터 분석 실력을 키우는 데 아주 유용한 다리 역할이 되어줄 듯 합니다.

실습한 모든 코드(그림, 예제)와 데이터(CSV, 엑셀)를 깃허브에서 쉽게 내려받아 구글 콜랩(Google Colab)에서 실습해볼 수 있고,

쉽게 준비할 수 있는 구글 콜랩 개발 환경에서 다양한 실습을 통해 데이터 분석의 감을 익힐 수 있습니다.

 

 

다양한 실생활 주제를 접목하여

예시를 들어주는게 좋았고

데이터를 다양한 각도로 분석하는 방법을 데이터 수집,

전처리를 통한 데이터 정제, 데이터 분석, 시각화까지 전체 빅테이터 분석 과정을

어려운 단어의 나열이 아닌 쉬운 설명으로 이해를 할 수 있게 하여서 좋았습니다

:-)

IMG_6519.jpg

 

중요한 부분은 KEY POINT로 핵심을 잘 짚어 줍니다.

 

IMG_6517.jpg

 

사진과 같이 다양한 연습문제들이 실려 있습니다.

IMG_6518.jpg

 

 

 

 

 

한빛미디어 <나는 리뷰어다> 활동을 위해서

책을 제공받아 작성된 서평입니다.

 

 

드디어 제가 오랫동안 기다렸던 파이썬 기초 책이 출간되었습니다. 바로 한빛미디어 신간인 나도 하는 파이썬 데이터분석입니다. 제가 왜 이처럼 기다린 책인지 도대체 나도 하는 파이썬 데이터분석이 그렇게 수많은 파이썬 책이 출간되었음에도 불구하고 지금 이 시점에 유의미한지에 대해서 오늘 자세히 리뷰하도록 하겠습니다.
 


나도 하는 파이썬데이터 분석 앞표지

나도 하는 파이썬 데이터분석은 파이썬을 이용하여 도시 생활 데이터를 수집하고 분석하는 방법을 배울 수 있는 실전 지향적인 책입니다.
 

그런데 대부분의 사례를 활용한 책들은 기초를 생략하는 경우가 많고 또한 파이썬의 기본지식을 안다고 전제하에 책을 집필하는 경우가 많습니다. 그러다보니 개발에 대해서 완전히 모르는 초보자들이 보기에는 어려운 경우가 많습니다.

 

또한 대부분의 파이썬은 파이참이나 아나콘다와 같은 개발환경에서 쓰여진 경우가 많습니다.

 

하지만 비전공자들은 PC컴퓨터 앞에서 개발에 전념을 할 수 있는 시간이 그리 많지 않습니다.

대부분은 파이썬을 한번 배워볼까? 혹은 저처럼 교육현장에서 비전공자로서 데이터리터러시 관련 프로젝트를 진행하고 싶은데 한번 경험해보려는 상황이 많습니다. 이런 경우에는 PC컴퓨터를 그리 많이 하지 않습니다.

 

이런 경우 모바일로 파이썬 코딩을 하면 너무 좋은데, 그게 바로 구글 콜랩입니다.

하지만 대부분의 기존 파이썬 책들은 구글 콜랩을 활용하지 않습니다.

 

그러다보니 기존이 파이썬 책을 활용해서 구글 콜랩에 적용하려고 하면 처음에 라이브러리 모듈 불러오는 것부터 막히고, CSV 파일 불러오는 것부터 막힙니다.

 

결국 제대로 하지 못하게 되는 것이죠.

 

이러한 어려움이 많았는데 이번에 드디어 그동안 갈증을 완전히 해소해줄 파이썬 책이 등장한 것입니다.

 

바로 나도 하는 파이썬 데이터분석입니다. 그러면 구체적으로 나도 하는 파이썬 데이터분석에 대해서 살펴보도록 하겠습니다.

 

나도 하는 파이썬 데이터분석에 대해서 간략히 소개하면 다음과 같습니다.


나도하는 파이썬데이터 분석은 김규석과 김현정이 지은 파이썬을 이용한 데이터 분석 입문서입니다. 이 책은 구글 콜랩을 활용하여 도시 생활 데이터를 수집하고 분석하는 방법을 다양한 사례와 함께 설명합니다. 정형 데이터와 비정형 데이터의 수집 및 분석, 상관관계 분석, 회귀 분석, 시계열 분석 등의 주요 데이터 분석 기법을 쉽게 익힐 수 있습니다. 

 

먼저 저자부터 살펴보도록 하겠습니다.

 

저자 김규석은 항공대와 아주대에서 학위를 받은 뒤에 서울대에서 박사를 수료했습니다. 다양한 기업 경험을 쌓은 뒤에 현재는 폴리텍 대학에서 조교수로 재직중입니다. 사회과학 분야 빅데이터에 관심이 많아 지속적으로 연구를 하고 있습니다.

 

김현정 저자는 현재 한동대 교수로 도쿄 대학에서 도시공학 박사학위를 취득했습니다. 서울대에서 강의도 하면서 스마트 시티 관련 국책 연구를 수행해왔습니다. 현재는 도시해석연구실을 운영하며 다양한 도시 빅데이터 분석을 하고 있습니다.


나도하는 파이썬데이터 분석 저자

이 책의 대상독자는 데이터 분석에 관심이 있지만 파이썬이나 개발 환경에 익숙하지 않은 비전공자입니다. 이 책은 구글 콜랩이라는 온라인 개발 플랫폼을 활용하여 PC가 없어도 모바일로 파이썬 코딩을 할 수 있게 해줍니다. 따라서 출퇴근 시간이나 여가 시간에도 파이썬 데이터 분석을 공부할 수 있습니다. 이 책은 파이썬의 기본 문법부터 시작하여 도시 생활과 관련된 다양한 데이터를 수집하고 분석하는 방법을 단계별로 알려줍니다. 이를 통해 데이터 분석의 핵심 개념과 실무 능력을 습득할 수 있습니다.


이 책의 대상독자

 

나도 하는 파이썬 데이터분석은 파이썬을 이용하여 도시 생활 데이터를 수집하고 분석하는 방법을 배우는 책입니다. 이 책의 특징은 다음과 같습니다.
 

  • 파이썬 기초부터 실전 예제까지 단계별로 설명합니다. 개발에 대해 모르는 초보자도 쉽게 따라할 수 있습니다.
  • 구글 콜랩을 활용하여 PC가 없어도 모바일로 파이썬 코딩을 할 수 있습니다. 라이브러리 모듈과 CSV 파일을 불러오는 방법도 자세히 알려줍니다.
  • 도시 생활과 관련된 다양한 데이터를 활용하여 실생활에 적용할 수 있는 인사이트를 얻습니다. 코로나 시대의 여행지, 대출 이율과 집값, 부동산 가격 예측 등의 주제를 다룹니다.

 

나도 하는 파이썬 데이터분석은 파이썬을 한번 배워볼까 하는 비전공자나 교육현장에서 데이터리터러시 관련 프로젝트를 진행하고 싶은 분들에게 적합한 책입니다. 이 책을 통해 파이썬의 기본적인 문법과 데이터 분석의 핵심 개념을 익히고, 실제 데이터를 다루는 능력을 키울 수 있습니다.

 


나도 하는 파이썬 데이터분석은 구글 콜랩이 주요 개발 환경

나도 하는 파이썬 데이터분석은 구글 콜랩이 주요 개발 환경입니다.



구글 콜랩은 구글이 제공하는 온라인 개발 플랫폼입니다. 구글 콜랩을 사용하면 웹 브라우저에서 파이썬 코드를 작성하고 실행할 수 있습니다. 구글 콜랩의 장점은 다음과 같습니다.
 

  • 별도의 개발 환경을 설치할 필요가 없습니다. 인터넷 연결만 있으면 언제 어디서나 파이썬 코딩을 할 수 있습니다.
  • 구글의 클라우드 서버를 이용하여 코드를 실행할 수 있습니다. 무료로 GPU와 TPU를 사용할 수 있어 머신러닝과 같은 고성능 연산을 할 수 있습니다.
  • 구글 드라이브와 연동하여 데이터를 저장하고 불러올 수 있습니다. 또한 다양한 데이터 소스와 연결할 수 있습니다.
  • 구글 콜랩은 Jupyter 노트북과 호환되며, 텍스트, 이미지, HTML, LaTeX 등을 함께 작성할 수 있습니다.
  • 구글 콜랩은 구글 드라이브에 저장되며, 공유와 협업이 용이합니다. 다른 사람과 댓글을 달거나 실시간으로 코드를 수정할 수 있습니다.


구글 콜랩은 데이터 분석, 머신러닝, 인공지능 등의 분야에서 파이썬을 배우고 실습하고자 하는 학생, 취미가, 연구자들에게 유용한 도구입니다. 구글 콜랩을 사용하려면 다음 링크를 클릭하면 됩니다.

 

구글 코랩이라고도 합니다.

 


구글 콜랩


위와 같이 구글 콜랩을 실행하고 링크의 소스 코드와 실습데이터 링크를 통해서 자료를 받아 수행할 수 있습니다.



 

구글 콜랩에서 파일 업로드하는 법

구글 콜랩에서 파일 업로드하는 코드입니다.

 

from google.colab import files file_uploaded = files.upload()


이 코드를 실행하면 파일을 선택할 수 있는 버튼이 나타납니다. 원하는 파일을 선택하거나 드래그 앤 드롭하면 업로드가 완료됩니다. 업로드된 파일은 코랩의 작업 디렉토리에 저장됩니다.

이 방법은 로컬 드라이브에서 파일을 업로드하는 가장 간단한 방법입니다. 

 

나도 하는 파이썬 데이터분석은 이처럼 매우 기초적인 부분도 상세히 다룹니다. 사실 비전공자는 이러한 것도 모릅니다.

 

 

다른 방법으로는 구글 드라이브를 코랩에 마운트하여 파일을 불러오는 방법이 있습니다. 이 방법은 구글 드라이브에 저장된 파일을 코랩에서 바로 사용할 수 있어 편리하지만, 인증 과정이 필요하고 세션이 만료되면 다시 인증해야 하는 단점이 있습니다. 그리고 나도 하는 파이썬 데이터분석에서는 이와 같은 복잡한 방법은 아예 배제함으로써 독자를 세심하게 배려하고 있습니다.
 


folium 라이브러리

나도 하는 파이썬 데이터분석에서 다루는 folium 라이브러리는 파이썬에서 Leaflet.js를 이용하여 지도를 시각화하는 라이브러리입니다. Leaflet.js는 인터랙티브한 웹 지도를 만들 수 있는 자바스크립트 라이브러리입니다.

 

folium은 파이썬에서 데이터를 다루는 강점과 Leaflet.js에서 지도를 표현하는 강점을 결합한 라이브러리입니다.

folium을 사용하면 웹 브라우저에서 파이썬 코드로 지도를 작성하고 실행할 수 있습니다. folium은 다양한 타일셋을 제공하며, 구글 드라이브와 연동하여 데이터를 저장하고 불러올 수 있습니다.

 

 folium은 코로플레스 맵, 마커, 선, 원, 이미지, 비디오, GeoJSON, TopoJSON 등의 오버레이를 지도에 추가할 수 있습니다.

folium은 데이터 분석, 머신러닝, 인공지능 등의 분야에서 지리적인 데이터를 시각화하고자 하는 사람들에게 유용한 도구입니다. 이처럼 저와 같은 비전공자들도 파이썬을 활용한 데이터 분석 시각화 프로젝트를 할 수 있도록 상세하게 라이브러리를 가르쳐주고 있습니다.

 

그리고 실제로 원소스 데이터를 어디서 구할 수 있는지까지 상세하게 알려주면서 소스 파일을 깃을 통해 함께 제공합니다. 이에 따라 독자가 쉽게 소스 데이터에 접근할 수 있으면서 추후에 다른 프로젝트로 다른 소스 파일을 구할 수 있는 방법까지도 자연스럽게 배우게 됩니다.

# 나도 하는 파이썬 데이터 분석

여느 책들과 마찬가지로 파이썬에 대한 기본적인 문법들을 파트 1에서 다루고 다음 장에서부터 본격적인 파이썬을 다루기 시작하는데 책의 목차를 보면 알겠지만 흥미를 유발하는 부분들이 많이 있는데 수집 가능한 정보의 다양성에 다시금 놀랐다.

- 지역별/연령별 방문객 순위
- M세대와 Z세대의 취업률 상관계수
- 집이 비어 있을 땐 허수아비라도 설치해야 할까?
- 회귀 분석과 인공 지는 예측 차이
- 집 앞에 어린이집이 생기면 집값에 어떤 영향을 미칠까?

책에서 다루는 데이터 분석은 크게 정령 데이터 분석, 비정형 데이터 분석 크롤링, 상관관계 분석, 회귀 분석, 시계열 분석으로 나뉘어 있는데 데이터를 얻기 위해 공공데이터를 수집하는 방법도 검색부터 실제 필요한 데이터를 다운로드하는 과정도 상세히 다루고 있다. 단순히 숫자들의 나열로만 보일 수도 있지만 그 속에서 알맹이들을 잘 뽑아내는 것이 데이터 분석가들의 일인 만큼 어떤 식으로 정보를 취합하고 활용하는지를 따라 해 볼 수 있는 것만으로도 책의 주요 대상인 초중급자들에게 도움이 될 것 같다. 개인적인 역량차이가 분명 있기 때문에 단정은 어렵지만, 입문자에게는 어려울 수 있겠다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

ICBM용어를 처음 들었을 때 대륙간 탄도미사일과 무슨 연관이 있을까 라는 생각을 한 적이 있다. ICBM은 Internet of Things(사물 인터넷), Cloud(클라우드), BigData(빅테이터), Mobile(모바일)의 첫 문자로 구성된 용어로 4차 산업 혁명의 핵심 기술로 미래창조과학부가 2014년 4월 사물인터넷 기본 계획을 발표한 자료에 처음 출현 한 것을 알고 있다. 개인적으로 대륙간 탄도미사일과 같은 파괴력으로 다가왔다. 우연이겠지만 진짜 이름 잘 짓는다.....

ICBM용어를 풀어서 이야기하면 자동차, CCTV, 온도센서, 습도 센서와 같은 장비와 같은 사물에서 데이터를 수집하여 클라우드에 저장하고 저장된 데이터를 빅테이터 분석 기술로 분석하여 위치 기반 서비스, 통계 서비스, 식물공장 등 다양한 서비스 형태로 모바일 기기를 통해서 제공하는 것입니다,

나도 하는 파이썬 데이터 분석"은 빅테이터 분석 영역에 해당하는  파이썬 기반으로 데이터 분석에 대한 전반적인 방법을 소개하는 도서로 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

도서의 구성은 PART 1 생활 데이터로 배우는 파이썬 기초 문법, PART 2 데이터 수집 및 분석하기로 나뉘어 있습니다,.

PART 1 생활데이터로 배우는 파이썬 기초 문법 영역은 4차 산업 혁명과 빅테이터애 대한 설명을 쉽게 이야기하고 있고 파이썬 기본 문법을 쉬운 문장으로 이해하기 쉽게 설명하고 있습니다. 

PART 1 생활데이러로 배우는 파이썬 기초 문법의 도서 일부 내용

파이썬을 처음 접하거나 프로그램 언어에 대한 이해가 부족한 독자는 이런 것이 프로그램 언어이고 파이썬이구나 정도 간단하고 간결하게 설명을 하고 있고 파이썬 학습을 예제와 연습 문제를 통해서 따라 하기 학습을 유도하고 있어 파이썬 기초 문법을 익힐 수 있을 정도로 구성이 되어 있지만  PART 2 데이터 수집 및 분석하기의 이해를 높이기 위해서는  한빛 미디어에서 출판한 혼자 공부하는 파이썬(개정판) 정도를 같이 학습하면 많은 도움이 될 것 같습니다.

프로그램 언어를 알고 있고 파이썬을 알고 있지만 오랫동안 하지 않은 독자는 PART 2 데이터 수집 및 분석을 들어가지 전에 파이썬 기본 문법이 이런 것 들이었지 하는 생각을 할 수 있을 정도로 쉽게 이야기하고 있다. 지하철 출근길 1시간 30분 동안 쉽게 읽었습니다.

PART 2 데이터 수집 및 분석하기 영역은 이 도서의 주제 영역으로 정혁 데이터 분석, 비정형 테이터 분석, 크롤링, 상관 관계 분석, 회귀분석, 시계열 분석에 대해서 이야기하고 있다. 데이터 분석을 할 때 가장 중요한 것은 데이터의 확보인데 도서에서 인터넷에서 데이터를 수집하는 방법, 데이터 분석을 위한 파이썬 라이브러리 사용 방법을 쉬고 간단한 설명하고 있으며 연습 문제를 통해서 학습을 유도하고 있습니다. 또한 분석한 데이터를 지도에 표시, 액셀로 표시 등 다양한 유형으로 시각화하는 방법까지 학습을 하도록 구성이 되어있습니다. 빅테이터 분석은 통계로 많은 수학 지식이 선행이 되어야 하는 것으로 알고 있어 힘들 것으로 예상했는데 도서에서는 통계 용어 및 수학 지식을 쉽게 설명 하고 있어서 학습을 하는데 도움이 많이 되었고 분석 및 시작화에 사용한 파이썬 라이브러리에 대해서 핵심 요소를 간결히 정리, 쉬운 용어로 설명하고 있습니다. 

도서에서 분석 데이터에 대한 다양한 시각화

프로그램 학습에서 중요한 것은 선택한 언어의 이해도와 많은 연습을 통해 언어를 깊게 이해 하고 프로그램을 개발할 주제(이 도서는 빅테이터 분석)에 맞는 예제를 통해서 학습하는 것입니다. 이 도서는 기본 예제와 연습 문제로 독자에게 쉽게 접근할 수 있도록 유도하고 있습니다.

도서의 일부 내용 - 연습문제

출근길, 퇴근길에 3일 정도 도서를 정독 하고 퇴근 후 하루에 1씩 투자하여 1주일 투자하여 데이터 분석의 기본을 학습할 수 있었습니다. 개인적으로 통계 전공이 아닌 독자에게 데이터를 다양한 각도로 분석하는 방법을 데이터 수집, 전처리를 통한 데이터 정제, 데이터 분석, 시각화까지 전체 빅테이터 분석 과정을 어려운 단어의 나열이 아닌 쉬운 설명으로 이해를 할 수 있게 하여서 좋았습니다. 물론 수학적 선 지식이 없어 수학적 용어에 대해서 구글링을 많이 했지만... 한 문장으로 도서를 이야기 한다면

" 나도 하는 파이썬 데이터 분석은 IT , 통계 비전공자가 업무 또는 생활에서 간단히 파이썬을 통해 데이터 분석을 가이드 해 주는 도서이다."

 

 



 

· 빅데이터(bigdata) 란

 

단순히 데이터가 큰 것이 아니다. 빅데이터의 특징 5V(Volume, Velocity, Veracity, Value)에 크기에 해당하는 Volume이 있지만, 빅데이터는 이러한 특징을 가진 데이터를 추출하고, 결과를 분석하는 과정을 포함한 전부를 의미한다.

 

· 다양하게 사용되는 프로그래밍 언어

 

- 하드웨어(H/W) 를 담당하는 추상화 계층(abstraction layer) 에선, 연산 속도가 빠른 C , C++ 언어를 사용한다.

- 최종적으로 사용자가 접하는 애플리케이션과 하드웨어를 연결 해주는 역할을 하 는 애플리케이션 프레임워크 계층에서는 JAVA를 사용한다.

 

- 책 내용 中 -

 

 

KakaoTalk_20230412_233005697.jpg

 

 

 

 

 

· PART 1에선 빅데이터에 관한 내용과 python 기본 문법을 알기 쉽고 간략하게 설명해준다. 기본 문법은 두꺼운 책으로 볼 때도 이해가 잘 안됐던 부분들이 조금씩은 있었는데, 이 책에선 굉장히 간략한 표현으로 잘 설명되어 있어서 인상적이었다.

 

 

KakaoTalk_20230412_233005697_02.jpg

파이썬은 주로 파이참이나 다른 IDE를 사용 했는데 책에 나오는 구글colab을 사용해보니 별 다른 설치 없이 분석에 필요한 모듈까지 사용 할 수 있어서 편했다. 다만.. 기존 IDE에선 예약어가 바로바로 로딩 되어서 편하게 사용 할 수 있었지만 colab은 바로바로 나오진 않는다는게 좀 불편했다. 그렇지만 설치 없이 툴과 모듈까지 사용 할 수 있다는 점에선 Good!

 

1.png

· PART2 부터는 본격적으로 데이터 분석에 대한 것들이 나왔고, 나는 인천의 인구동태에 대한 자료를 받아서 책의 예시대로 따라 했더니 csv파일을 2분 안에 보여줬다. colab... 공부할 때 많이 사용하게 될 것 같다.

 

2.png

크롤링 예시는 colab이 아닌 파이참에서 실습해보았는데 (셀레늄 모듈 설치 필요) 어디서든 무난하게 실행 할 수 있도록 설치 파일 예시도 같이 적혀 있어서 내용 대로 따라하니 잘 작동한다. 이참에 크롤링에 대한 것도 공부 해봐야겠다.

 

KakaoTalk_20230412_233005697_01.jpg

함수에 대한 설명과 이름, 사용법까지 핵심만 딱 적혀 있어서 굉장히 편하게 따라 할 수 있는 책이었다. 데이터 분석 입문자들에겐 정말 강추하는 도서다. 

'한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.'

 

1.JPG

 

이번달에도 어김없이 한빛미디어에서 만나본 새로운 도서를 소개해드려볼까해요!

개인적으로 꼭 자격증때문이 아니더라도

새로운 분야에 대한것들을 배워보는것도 나쁘지 않더라구요

물론 한번 보다가 재미있다고 느껴지면

조금 더 깊게 파보는것도 좋은 것 같구요

 

2.JPG

 

도시 생활 데이터를 활용한 데이터분석 방법

나도 하는 파이썬 데이터 분석 이라는 책이구요

김규석, 김현정 두분의 공동저자 집필 도서이더라구요

 

대상 독자는 데이터분석에 관심은 있으나 프로그래밍 언어에 대한

기초가 없는 비전공자를 대상이라는 말이 저한테도 딱 해당되기때문에

요즘 빅데이터 이런게 꽤 많이 들려오고있어서

조금이라도 알아두는게 확실히 좋을 것 같다는 생각을 하게되었다죠

 

또 바쁜 직장인분들도 출퇴근 시간을 활용해서 할 수 있게 도와주니깐 굿굿

 

3.JPG

 

크게 파트2로 나뉘어있구요

또 각 파트별로 5장씩 세분화 되어있기때문에

초보라도 차근차근 따라가보면은 기초문법부터 데이터수집과 분석까지 할 수 있을 것 같더라구요

 

4.JPG

 

4차 산업혁명과 빅데이터

최근에 챗GPT? 이걸 기사로도 많이 봤던 것 같고

유튜브에서도 종종 알고리즘이 추천해주는걸 보긴했었는데요

 

5.JPG

 

빅데이터는 전통적인 데이터처리방법으로는 다룰 수 없는 대규모 양을 가진 데이터를 의미하는데

비정형화된 것도 포함이 되어있다고해요

여기서 비정형화 데이터는 지금 이순간에도 여러분이 스마트폰을 사용해서 남겨지는

웹페이지 접속기록, 구매기록, 반응 기록 뿐 아니라

다양한 장치기록 등 일상의 모든데이터라고 볼 수 있구요

그렇다보니 빅데이터는 자료와 정보의 의미 뿐만 아니라

이를 처리하는 일련의 기술도 포함한다고 보시면 된다고해요

그렇기때문에 일단 여기서부터 제대로 이해하고 넘어가시는게 좋겠죠?

 

6.JPG

 

2파트에서는 데이터수집 및 분석하기이구요

정형 데이터분석, 비정형 데이터분석 / 크롤링, 상관관계 분석, 회귀분석, 시계열분석 등을

볼 수 있는데요 그 중에서도 저는 너와 나의 연결고리

상관관계분석부분을 살짝 보여드려보려고해요

책에 그림으로 표가 딱 나와있는데 이걸 그냥 보면 뭐지? 싶은데요

그래도 나도 하는 파이썬 데이터 분석 이책이 도움이 될 수 밖에 없는 이유가

바로 연습문제를 통해 직접 실습을 해볼 수 있기 때문이랍니다

 

SE-d32f8d0a-1e82-4161-8313-3f5c238f582e.jpg

 

파이썬 기본문법도 함께 학습하면서 코딩스킬도 향상시키고 싶거나

실제 생활 속 데이터를 이용한 실습서를 찾고 계시는 분들에게

예제를 통해 직접 따라해보시면 이해도 더 빠를 것 같아서

나도 하는 파이썬 데이터 분석 기초문법부터 활용까지 한번에 할 수 있는

책을 찾으시는 분들에게 추천해드릴께요!
























한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 도서명 :
나도 하는 파이썬 데이터 분석
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
나도 하는 파이썬 데이터 분석
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
나도 하는 파이썬 데이터 분석
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실