시장 조사, 고객 분석, 매출 예측, 보고서를 한 번에 코드 한 줄, 수식 계산 없이 기초 통계부터 고급 데이터 분석까지!
이 책은 데이터 분석을 경험해 본 적이 없는 사람 또는 데이터 분석에 AI를 적용하려는 사람을 위해 AI를 활용한 데이터 분석의 전 과정을 쉽게 익힐 수 있도록 구성했습니다. 단순히 데이터 분석 과정을 훑는 것이 아니라 실무에서 데이터 분석 프로젝트가 어떻게 시작되고 마무리되는지 체감할 수 있도록 데이터 분석을 시작하는 ‘김대리’와 ‘박차장’이라는 인물을 활용했습니다. 이제 막 데이터 분석을 시작해 데이터의 개념, 챗GPT 사용법부터 고급 데이터 분석과 시각화까지 한 단계씩 나아가는 김대리를 통해 실무에서 흔히 마주치는 데이터 분석 문제를 살펴볼 수 있습니다. 이 과정에서 여러분은 실무에 바로 적용 가능한 지식과 기술을 습득할 수 있는 것은 물론이고 실제 분석 과정에서 자주 부딪치는 문제를 해결하는 방법도 알 수 있습니다.
더불어 누구나 이 책에서 다루는 모든 프로젝트를 직접 실습할 수 있도록 데이터 파일을 제공합니다.
실습 파일: aitechupdate.com/월20달러-데이터-분석-실습
누구나 프로처럼, 나만의 데이터 분석가를 월 20달러로 고용하는 방법 챗GPT는 누가 어떻게 쓰느냐에 따라 무궁무진한 가능성을 가진 도구입니다. 때로는 SNS 콘텐츠를 뽑는 유능한 콘텐츠 기획자였다가, 의뢰인의 상담을 도와주는 변호사면서 막힘 없이 데이터 분석 주제 제안부터 보고서 작성까지 깔끔하게 정리해 주는 똑똑한 분석가가 되기도 합니다. 이 모든 역량을 가진 뛰어난 파트너를 챗GPT라는 하나의 도구로 고용하는 방법을 알려드립니다.
저자소개
저자
테리엇
영업 부서에서 사회생활을 시작해, 지금은 증권사 데이터 사이언티스트로 일하고 있다. 파이썬의 간결한 문법과 다양한 활용성에 반해 실생활에 유용하게 활용하는 방안을 연구하고 있다. 인공지능을 활용해 자동화하는 일에도 관심이 많다. 개인 블로그 'AI테크 업데이트(aitechupdate.com)'를 운영 중이다.
저자
Bob Lee
금융 분석 연구원으로 시작했으나 데이터 분석에 매력을 느껴 데이터 사이언티스트로 전향해 지금은 금융사에서 데이터를 분석 업무를 하고 있다. 데이터 조직의 시작부터 데이터 인프라 세팅, 데이터 엔지니어링, 분석 기반 서비스 배포까지 데이터 분석 영역 전반의 업무를 고루 경험했다. 진행했던 프로젝트로는 추천 알고리즘 개발, 고객 심리 분석, 추천 상품 분석, 고객 자산 관리 솔루션 개발 등이 있다. 현재는 블록체인을 활용한 거래 시스템을 개발하고 있으며, 에듀테크 스타트업에 합류해 생성형 AI 엔진 개발과 앱 개발 전반을 리드하고 있다.
목차
1부 데이터 분석을 위한 도구, 챗GPT & 데이터 애널리스트
01장 데이터 분석 도구로서 생성 AI 챗GPT의 탄생 데이터 분석 GPT, 데이터 애널리스트 회사 데이터 분석도 가능할까?
02장 챗GPT 사용 가이드 챗GPT 시작하기 사용자 맞춤 설정하기 더 나은 대화를 위한 프롬프트 엔지니어링 다양한 GPT 살펴보기 API를 활용한 나만의 GPT 만들기 챗GPT와 음성 대화하는 방법
03장 데이터 애널리스트 사용 가이드 데이터 애널리스트 시작하기 PDF 파일로 PPT 보고서 만들기 코드 파일로 코드 리뷰하기 CSV 파일로 데이터 분석하기 데이터 애널리스트의 한계
2부 데이터 분석의 기초 쌓기
04장 데이터는 어디에 있죠? - 데이터와 데이터베이스 데이터 & 데이터베이스 DBMS와 SQL 원시 데이터
05장 무엇을 분석하나요? - 분석 주제 선정 방법 데이터로 할 수 있는 일 분석 과제 도출 방법 하향식 접근 방법 상향식 접근 방법 원활한 인터뷰를 위한 4단계
06장 어떻게 분석할까요? - 데이터 유형에 따른 분석 방법 정형 데이터와 비정형 데이터 범주형 데이터와 수치형 데이터
07장 데이터가 크면 어떻게 하죠? - 다양한 데이터 분석 환경의 이해 데이터 샘플링 데이터 분석 플랫폼
3부 챗GPT로 데이터 분석 쉽게 하기
08장 분석 주제 질의하기 데이터 파악을 위한 메타 데이터와 ERD 분석 주제 탐색 및 확장 단계별 접근 및 문제 해결 기법 적용 주제를 평가하는 새로운 관점 보고서 초안 작성
09장 데이터 확인 및 검증하기 데이터 애널리스트를 활용한 데이터 확인 분석 창을 활용한 코드 확인 중복 데이터
10장 결측값 처리하기 결측값과 EDA 결측값 처리 방법 결측값 대체하기 결측값 삭제하기
11장 데이터 분포 파악 수치형 데이터 특성 파악하기 데이터 시각화하기 데이터 샘플링하기
12장 이상치 처리 방법 이상치 찾기 이상치 처리하기
13장 범주형 데이터 분석 범주형 데이터 분석하기 범주형 데이터와 수치형 데이터 결합하기 데이터 시각화 패키지
14장 데이터 재범주화 데이터 재범주화란? 데이터 재범주화하기
15장 통계 검정 통계 검정이란? 데이터 분포 시각화하기 통계 검정하기
16장 데이터 변환 데이터 변환이란? 범주형 데이터 변환하기 ① 범주형 데이터 변환하기 ② 데이터 취합하기
4부 챗GPT와 고급 데이터 분석 도전하기
17장 고액 연봉 개발자 예측하기 고급 데이터 분석과 머신러닝 알고리즘 상관관계 분석이란? 예측을 위한 통계 기법, 회귀 분석 회귀 분석으로 모델링하기 스케일링하기 트리 모형으로 모델링하기
18장 멤버십 회원 확대 방안 분석 의사결정나무란? 데이터 처리하기 알고리즘 학습시키기 트리 구조 시각화하기 트리 구조 텍스트화하기 결과 정리하기
19장 이탈 회원 분석 군집 분석과 LDA 알고리즘 데이터 처리하기 알고리즘 학습시키기 의사결정나무로 시각화하기
20장 타기팅 분석 분류 분석과 회귀 분석 타기팅 모델링하기 리프트 게인 차트로 모델 평가하기 앙상블과 부스팅 모델 LightGBM으로 모델링하기
21장 선호하는 채널 분석 챗GPT API란? 오픈AI 플랫폼 둘러보기 챗GPT API 사용하기 배치 사용하기 분석하기
‘Nocode, 데이터분석의 새로운 트렌드’ _ 지난주에 데이터분석 경험자 관련 인터뷰가 필요하다고 해서, 새로운 서비스 개발의 프로토타입을 만들고 검증중인 한 스타트업의 대표이사와 해당 서비스 체험을 진행하고 왔습니다. 해당 서비스의 고객들은 데이터를 다루고, 이를 분석하고, 리포트로 의사결정을 받는 사람들인데, 데이터 분석가라고 해서 전부 코딩을 할 줄 아는 것은 아니고, 그보다는 데이터에서 인사이트를 발견하고, 이것을 주요 업무와 제품 및 서비스에 적용하는 것이 필요하다는 것에서 기인한 것입니다. 불과 2년전만 해도 데이터 분석가들의 경우 최소 파이썬을 통한 코드 베이스로 데이터를 뽑아낼 줄 알아야 하는데 이제 이것을 대체하는 인공지능이 빠르게 발달하고 있다는 반증입니다. 그리고 최근 만난 <월 20달러로 고용하는 데이터분석가 with 챗GPT>도 이러한 트렌드를 아주 잘 반영하고 있습니다.
본서는 ‘코드 한 줄 수식 계산 없이 기초통계부터, 고급 데이터 분석’까지 생성형 AI를 통해 활용하는 법을 설명하는 서적입니다. 여기서 일단 중요한 것을 한가지 말해봅니다. ‘코딩’을 할 필요가 없다고 해도 생성형 AI를 통한 프롬프트를 할 줄 알아야 하니 코딩이 사라질지언정, 프롬프트 엔지니어링이라는 또다른 학습도구를 배워야 한다는 것입니다. 이를 기초로 본서는 챗 GPT등이 데이터 애널리스트를 어째서 대체하는지 그리고 데이터 분석의 기초 쌓기와 더불어 분석에 필요한 최소한의 파이썬과 고급 데이터 분석까지의 과정들을 기술합니다. 두번째로 알 수 있는 것은 코딩이 필요없다고 했지만 어느정도의 파이썬을 얘기하고, 데이터 기초 분석의 툴을 알아야 하니, 센스가 있는 독자라면 여기서 생각할 거리를 아래와 같이 정리할 수 있겠습니다.
첫번째는, 세상에 완전 무결한 도구는 없다는 것입니다. 코딩이 필요없다고 하지만 어느정도의 코딩을 모르면 인공지능을 제대로 활용할 수가 없습니다. 제가 최근에 하고 있는 것도 자바스크립트로 상호운용성 웹관련 내역을 챗 GPT등에 요청을 하는 것인데 생성형 AI가 코딩을 잘해줄 것 같지만, 디버깅이 한 두개가 나오는 게 아닙니다. 그것도 가장 최근의 버전에서 발생하는 일입니다. 두번째, 실력의 기초는 구조파악입니다. ‘00사 제품의 데이터 분석해줘’라고 요술의 방망이가 아니라는 겁니다. 생성형 AI는 아직까지 공개된 데이터에서 끌어오는 서비스고, 데이터 분석은 결국 수집-전처리-재분류-분석기법도입-검증-배포의 절차를 수행해야합니다. 이런 프로젝트 경험이 없이 사용해봤자 아무의미 없습니다. 마지막으로 도구는 계속 변화합니다. 이에 따라 실력있는 데이터분석가들은 결국 끊임없이 조금은 학습을 해야합니다. 과거 C언어와 PHP의 스페셜리스트들이 아직도 웹시장에서 살아남는 이유이기도 합니다.
따라서 ‘월 20달러’가 데이터 분석의 모든 것을 책임질거라는 착각에 빠지면 안됩니다. 그러면 생성형 AI는 데이터 분석가에게 어떤 도움을 주냐. 그것은 본인이 어느정도 실력이 갖춰졌을 때 ‘시간을 절약해준다는 것’입니다. 이는 텍스트나 이미지, 영상등의 멀티모달을 활용하는 것에 마찬가지입니다. 만일 정말 프롬프팅 몇 개로 내가 원하는 결과물을 뚝딱 만들어주는 AGI기능이 완벽하다면 월 20달러로 사용할 수 있을까요? 저는 기본 100배정도의 가격이 늘어나야 한다고 봅니다. 세상에 공짜 점심은 없는 법이니까요.
기존의 AI와 생성 AI의 차이점은 이제 많은 사람들이 알고 있을 것 같다. 할루시네이션을 주의해야 한다는 것도.
이 책은 챗GPT를 사용하기 위해 계정을 만드는 것부터 하나 하나 알려준다.
기본적인 프롬프트를 입력하는 방법부터 Data Analyst를 이용하는 방법, GPTs를 만들고 활용하는 방법도 차근차근 설명한다. 다음은 Data Analyst를 활용하는 사례이다.
PDF파일의 내용을 요약하고, PPT개요를 구성해서 다운로드 할 수 있는 파일 형태로 저장해주도록 할 수도 있다. 물론 다시 손보지 않아도 될 정도로 예쁘게 만들어 주는 것은 아니고 가장 기본적인 내용들을 채워준다. 내용을 다듬거나 더 풍성하게 하는 것은 사용자의 몫.
일단 책의 진행이 처음부터 두 사람의 대화로 이루어져 있는데, 두께가 좀 있는 책인데 계속 대화식으로 진행되니 나는 읽으면서 좀 답답한 면이 있었다. 앞부분은 대부분이 이미 알고 있는 내용들이라서 일단 큰 제목들만 훑었다. 하지만 아주 많은 사람들이 챗GPT를 한 번도 사용해 본 적이 없고, 어디에서 사용하는 건지, 어떻게 사용하는 건지조차 알기가 어려워서 그렇다는 말도 들었다. 그런 사람들에게는 친구나 상사가 옆에 딱 달라붙어 하나하나 가르쳐주는 것 같은 느낌을 받을 수도 있겠다. 즉, 챗GPT를 단 한 번도 사용해 본 적이 없는 사람에게도 진입 장면이 없다.
1/3 지점부터는 본격적으로 데이터 분석에 관한 이야기가 나온다. 용어에 대한 설명도 깨알같이 하고, 데이터의 종류, 그래프의 종류, 데이터 샘플링에 관한 이야기. 이 책에서 언급하고 있는 기능들을 다 사용해 보려면 제목처럼 '월 20달러(부가세 포함 22달러)'를 지불해야 하는 부담은 있다.^^
분석의 절차에 대해서도 알려주기는 하지만 사실 독자는 챗GPT에게 분석 절차나 주의할 점 등을 물어볼 수 있다. 챗GPT는 항상 친절하다. 어떤 때는 기대했던 것 이상의 답변을 준다. (수다스럽다) 이때 필요한 것이 프롬프트를 잘 쓰는 능력이다. 그리고 또 하나 앞에서도 언급했던 할루시네이션을 잘 구별해 내는 능력이다. 데이터 분석의 초보자에게는 할루시네이션의 늪에 빠지지 않기 위해 좋은 책이 필요한 것 아닐까. 비록 할루시네이션이 있다고 해도 때로는 챗GPT가 내가 생각하지 못했던 새로운 관점을 보여주기 때문에 충분히 활용할 가치는 있다. 게다가 이제는 '검색' 기능이 추가되지 않았나.
데이터를 파일 형태로 업로드하고 기술 통계량 확인, 중복 데이터 처리, 결측값 처리, 이상치 처리, 데이터 샘플링 등 전처리를 한 결과를 파일 형태로 다운로드 할 수도 있다.
본격적인 데이터 분석이 시작되는 부분부터는 본인이 관심 있는 데이터세트를 가지고 직접 실습을 따라하면 된다. 앞에서도 얘기했듯이 두 사람의 대화 형태로 계속 이어가기 때문에 내 입장에서는 읽기에 조금 답답한 면이 있었다.
내가 생각하는 챗GPT를 이용한 데이터 분석의 가장 큰 미덕은, 원시데이터로부터 기술통계량을 뽑아내는 것이 프롬프트 한 줄이면 된다는 것, 각 항목이 무엇을 의미하는지 모르면 대화형으로 바로 다시 질문할 수 있다는 것, 전체 데이터를 다 읽지 않아도 데이터로부터 인사이트를 뽑아준다는 것, 파이썬, AWS, MySQL, Django 등이 뭔지 전혀 몰라도 분석과 예측이 가능하다는 것이 아닐까 싶다. 물론 이보다 장점이 더 많다. 단, 결과를 사용하는 것은 사용자의 몫이다.
#️⃣ 데이터도, Chat GPT도 잘 몰라요. 그런데 분석이 하고 싶어요. 영업지원부서에서 일을 할 때 단순 데이터를 정리하는데 그치고 싶지 않고 분석을 해보고 싶다는 생각에 무작정 책도 사고, 자격증 공부도 해보고, 통계 무료 강의를 찾아서 듣기도 했다.
사실 요즘은 이렇게 무식하게 할 필요가 없다.
코로나를 기점으로 이미 데이터분석과 관련된 커리큘럼과 학습 환경이 매우 잘 조성되었기 때문이다. 그 중에서도 가장 간단하게 현업에 적용해볼 수 있는 방법은 Chat GPT를 활용하는 것이다. 파이썬이 데이터 분석에 적합하고 GPT가 이를 사용하고 있기 때문에 이미 하위 서비스로 제공하고 있다.
다만, 내가 아는 게 없는 그야말로 '미지'의 상태라면 시작하기 어려우니, 시동을 걸 수 있는 부스터가 필요하다. 그게 오늘 리뷰할 책이다.
#️⃣ 데이터 분석을 한다고 원리까지 다 알 필요는 없잖아요? 위 명제는 데이터를 공부하시는 수 많은 사람들에게 상당히 실례되는 표현이지만, 통계학자가 아니라고 해서 데이터 분석을 하면 안되는 법은 없다고 생각한다.
이 책은 철저히 데이터 분석을 '활용하는' 관점에서 설명하고 있다. 당연히 각 개념에 대한 설명과 원리에 대해서 언급하지만 복잡한 증명이나 상세한 이론을 풀어놓지 않는다. 예를 들어 '랜덤 포레스트 회귀 모델'을 소개하면서 트리 구조를 상세히 설명하거나 파이썬으로 동작하는 사이킷런(sklearn) 라이브러리를 이용한 코드 예제를 나열하지 않는다. 대신 간단한 알고리즘 개념만으로 빠르게 실무에 적용할 수 있도록 안내한다.
물론 이런 실용적 접근에는 한계가 분명히 존재한다. 결론을 도출하고 분석 결과를 해석하고, 또 의사결정하는 과정에서 분석자가 알고리즘의 원리를 깊이 이해하지 못하거나 데이터의 특성을 충분히 고려하지 않을 경우, 잘못된 결론에 도달하거나 과도한 일반화를 할 수 있기 때문이다.
#️⃣ 데이터를 입문할 때 가장 빠르게 흥미를 붙일 수 있는 책 그럼에도 데이터 분석을 처음 입문하는 사람이면 다소 분석 주제를 선정하는 일부터 전처리, 이상치 처리, 분석, 예측까지의 프로세스를 경험해보는 게 '흥미'면에서 아주 도움이 된다.
또한, 책의 구성이 실제 현업을 수행하는 팀의 역할극으로 구성되어 있기 때문에 캐주얼하고 쉽게 느껴진다. 특히 위에서 언급한 것 처럼 복잡한 코드를 나열하지 않고 실제 GPT의 프롬프터를 보여주고 있어 책과 함께 실습을 하지 않고 먼저 책만 읽어보고 학습을 할 수 있다. 예제 코드가 있는 책과는 달리 장점이라 느껴지는 부분이다.
추천독자 추천 독자는 당연히 데이터 분석을 처음하는 모든 직장인이다. 내가 어떤 직무를 하건, 데이터 분석을 빼놓을 수 없는 시대에 살고 있다. 이 책을 통해 Chat GPT와 데이터 분석을 함께 입문하면 좋을 것 같다.
**"월 20달러로 고용하는 데이터 분석가 with 챗GPT"**는 데이터 분석의 문턱을 낮추고 누구나 쉽게 AI를 활용해 전문적인 데이터 분석을 수행할 수 있도록 돕는 실용적이고 혁신적인 가이드입니다. 초보자와 실무자를 모두 아우르는 이 책은 챗GPT를 도구로 활용하여 데이터 분석의 기본부터 고급 기술까지 체계적으로 배울 수 있는 기회를 제공합니다.
1. 친근하고 실무 중심적인 구성
이 책의 가장 큰 특징은 실무에 초점을 맞췄다는 점입니다. 저자는 ‘김대리’와 ‘박차장’이라는 실무 캐릭터를 통해 실제 회사 환경에서 데이터 분석이 어떻게 시작되고 마무리되는지를 구체적으로 보여줍니다. 이는 독자들이 데이터를 단순히 이해하는 것을 넘어, 실제 업무 상황에서 데이터 분석 프로젝트를 성공적으로 수행할 수 있는 자신감을 갖도록 돕습니다.
특히, 데이터를 수집하고, 처리하며, 분석 결과를 시각화해 보고서를 작성하는 과정이 상세히 묘사되어 있어, 초보자도 데이터 분석의 전 과정을 쉽게 체감할 수 있습니다.
2. 챗GPT의 잠재력을 극대화하는 실용적인 접근
챗GPT는 단순한 대화형 AI를 넘어 데이터 분석 도구로서 무한한 가능성을 가지고 있습니다. 이 책은 다음과 같은 실질적인 활용 방법을 제시합니다:
데이터를 정리하고 결측값 및 이상치를 처리하는 방법
기본적인 데이터 시각화부터 고급 통계 분석, 머신러닝 모델 구축까지
챗GPT API를 활용해 맞춤형 분석 환경을 구축하는 기술
이러한 과정을 통해 독자는 챗GPT를 마치 개인 비서처럼 활용하며 데이터 분석을 효율적으로 수행할 수 있습니다.
3. 초보자와 전문가를 위한 맞춤형 학습
이 책은 데이터 분석을 처음 접하는 독자뿐만 아니라, AI 기술을 실무에 접목하려는 전문가들에게도 유용합니다. 초보자는 책에서 제공하는 쉬운 설명과 단계별 가이드를 통해 데이터 분석의 기초를 쌓을 수 있고, 전문가들은 챗GPT와 Python을 결합해 고급 데이터 분석을 자동화하거나 새로운 인사이트를 얻는 데 도움을 받을 수 있습니다.
또한, 독자들이 실습할 수 있도록 제공되는 데이터 파일과 예제는 학습 효과를 극대화하는 데 중요한 역할을 합니다.
4. 데이터 분석의 한계를 뛰어넘다
이 책은 챗GPT를 활용한 데이터 분석이 기존의 복잡한 프로세스를 어떻게 단순화할 수 있는지 보여줍니다. 단, 대규모 데이터 처리나 고도화된 모델링에는 추가적인 도구나 전문성이 필요하다는 점도 명확히 언급하며, 챗GPT의 한계를 솔직하게 다룹니다. 이로써 독자는 챗GPT의 장점과 한계를 이해하고, 이를 적절히 활용할 수 있는 방법을 배울 수 있습니다.
5. 누구나 실무형 데이터 분석가가 될 수 있는 길잡이
"월 20달러로 고용하는 데이터 분석가 with 챗GPT"는 단순히 데이터 분석 기술을 가르치는 것을 넘어, AI와 함께 일하는 새로운 방식에 대한 통찰을 제공합니다. 챗GPT라는 혁신적인 도구를 통해, 기존의 고비용 데이터 분석 솔루션 없이도 누구나 실무형 데이터 분석가로 성장할 수 있음을 보여줍니다.
추천 독자:
데이터 분석에 처음 입문하려는 초보자
데이터 기반 기획과 마케팅이 필요한 실무자
생성 AI를 실무에 적용하려는 IT 및 비즈니스 전문가
데이터와 AI에 관심이 있는 누구나
결론
이 책은 데이터 분석의 새로운 가능성을 열어주는 실용적이고 혁신적인 가이드입니다. 코드나 복잡한 수식을 몰라도 챗GPT를 활용해 데이터 분석 전 과정을 손쉽게 수행할 수 있는 방법을 알려주는 이 책은, 데이터 분석에 관심 있는 모든 이들에게 필독서로 추천할 만합니다. "누구나 프로처럼" 데이터 분석을 시작하고 싶다면, 이 책이 바로 그 첫걸음이 될 것입니다.
지금 리뷰하는 '월 20달러로 고용하는 데이터 분석가 with 챗GPT' 책 서문에 나오는 말이다. AI시대를 어떻게 받아들여야 하는지를 이해하는데 좋은 비유라고 생각한다.
자동차가 나오기 전까지 모든 사람들은 서울에서 부산까지 걸어갔다. 자동차가 나온 후에는 서울 부산을 걸어가는 사람이 없다. 차를 타고 가지. 세상에 자동차가 있고, 내가 멀리 이동해야 할 일이 있으면 자동차를 사용해야 한다.
지금의 AI는 자동차와 같다. 세상에 AI는 존재하고, 이걸 이용해 생산성이 극적으로 증가한다면 AI를 사용해야 한다.
'월 20달러로 고용하는 데이터 분석가 with 챗GPT'는 그래서 나온 책이다. AI시대의 데이터 분석가라면 챗GPT 같은 생성형 AI를 사용해야 한다. 예전처럼 a부터 z까지 사람이 모든 작업을 사람이 다 할 수는 없게 되었다. 왜냐하면 같은 직군의 경쟁자들은 AI를 쓰기 시작할 것이기 때문이다.
대상 독자 현재 데이터분석가이면서 AI를 필요로 하는 사람 데이터 분석 경험은 없지만 관심있는 사람 1번, 2번 모두 이 책을 통해 목적 달성을 할 수 있다. AI를 사용해 보지 않은 사람을 위해 책 1부에서는 챗GPT 사용 가이드가 들어가 있다.
데이터 분석 경험이 없어도 이 책을 따라가면 기본적인 관련 지식을 습득하게 된다. 책 2부 부터는 데이터 분석의 기초부터 시작하며 4부 고급 데이터 분석까지 실습한다. (심지어 데이터 분석에 꼭 필요한 프로그래밍 언어인 파이썬의 문법까지 부록으로 실려있다.)
책의 구성은 마치 사수와 부사수처럼 가상의 두 인물이 나와 문답하는 형식으로 되어있다. 나는 데이터분석 경험이 없는 사람이라 복잡한 통계 개념이 나오면 이해하는 게 어려웠는데, 책의 재밌는 구성 덕분에 내용이 아주 딱딱하게 느껴지지는 않았다. 개인적으로는 잘 모르는 분야지만 도전해 볼만하다는 느낌을 받았다.
데이터 분석을 공부 중이거나 이미 현직에 있는 사람이라면 책이 쉬울 것이라 생각한다. 일하는 속도면에서 이전과 비교할 수 없는 퍼포먼스가 생기지 않을까 싶다.
AI 사용이 가속화되면서 미래의 삶의 패턴이 어떻게 바뀔지 궁금해진다. AI를 사용해 빨리 일을 마치고 남은 시간을 여유롭게 보내게 될지, AI를 사용해 해야하는 일이 더 늘어나게 될지. 처음엔 전자처럼 되다가 결국엔 후자처럼 될 거 같기도 하고.
앞으로는 알 수 없다. 하지만 당장 생존하려면 내 분야에 AI를 활용해야 하는 건 어쩔 수 없는 흐름인 것 같다.
이 책은 월 20달러인 ChatGPT Plus 버전을 데이터 분석에 활용하는 방법에 대한 책이다. 데이터 분석을 처음 시작하는 사용자를 대상으로 개념과 ChatGPT를 이용한 분석 방법에 대해 설명한다. 데이터 분석에 대해 처음 배우는 '김대리'와 데이터 분석에 대해서 가르쳐주는 '박차장'이 대화를 나누는 형식으로 쓰여있다.
대화 형식의 장점은 '김대리'와 '박차장'의 대화와 ChatGPT의 프롬프트와 답변으로 구성되어 있어 전체 내용을 빠르게 내용을 훑어볼 수 있다. 또한, ChatGPT를 실무에 어떻게 사용할 수 있는지 사례를 통해 살펴볼 수 있고, 데이터 분석에 대한 기초 지식을 얻을 수 있다. 단점은 대화 형식으로 되어 있어 모든 대화를 읽어야 내용이 파악된다는 점이다.
만약 한달에 20달러를 자유롭게 쓸 수 있다면 어디에 쓸 것인가? 요새 환율이 올라서 약 3만원에 가까운 돈이긴한데... 물론 각자의 필요에 맞게 쓰겠지만, 나는 당연히 chatGPT plus를 구독하는데 쓸 것이다. 이 20달러라는 가격이 바로 chatGPT plus를 구독하는데 필요한 비용인데, 이번 포스트에서 소개할 책의 제목에서 설명하는 것이 ChatGPT plus를 구독함으로써, 우리에게 주어진 데이터에 대해서 분석해줄 수 있는 AI 에이전트를 활용하자는 것이다.
월 20달러로 고용하는 데이터 분석가 with 챗GPT
사실 책의 표지에서 담고 있는 것처럼 코드 한 줄없이 기초 통계부터 예측을 할 수 있다는 키워드에 꽂혀서 책을 선택하게 되었다. 만약 내가 활용하고 있는 센서 데이터도 이런데 올리면 뭔가 abnormality나 상관관계같은 것을 알아서 분석을 해줄 수 있을까 하는 막연한 기대감을 가지고 말이다. 그리고 실제로 책에서도 그런 관련 정보를 얻기까지의 과정을 예시 데이터를 통해서 소개하고 있었다.
여타 책과 다르게 이 책이 좀 특이한 부분은 책의 진행이 대화형으로 이뤄진다는 것이다. 일반적인 책들이 단순히 지식을 쭉 서술하고, 관련 코드 설명하고 이런 방식이었다면, 이 책에서는 가상의 인물인 김대리와 박차장이 주어진 데이터를 가지고 분석을 할때 챗GPT를 활용하는 방안을 소개하고 있다. 그리고 책 표지에 나와있다시피, 책의 내용속에는 데이터 분석에 필요한 코드가 거의 없다. 그렇기 때문에 이 책은 어떻게 보면 통계에 활용할 수 있는 프롬프팅 가이드북이라고 보면 좋을 것 같다.
사실 어떤 데이터를 가지고 분석을 하기 위해서는 기본적인 통계 지식이 필요한 편이다. 데이터 유형이 어떤지, 아니면 내가 세운 가설이 맞는지 통계 검정도 해봐야 하고, 앞에서 언급한 것처럼 이상치 탐지도 하기 위한 방안도 고민해야 한다. 그래서 이 책은 그런 관련 내용을 각각의 장으로 나눠서 챗GPT와 함께 분석하는 과정을 소개하고 있다. 그래서 생각보다 각 장의 내용이 짦게 되어 있지만, 딱 통계에서 필요한 정보를 얻기 위해 챗GPT를 활용하는 방안을 잘 소개하고 있다. 특히 후반부에 소개되는 API를 활용한 자동화 과정은 앞의 데이터 분석 과정을 발전시켜 조금 더 실전적으로 활용할 수 있는 방법에 대해서 설명해주고 있다.
다만 개인적으로 좀 아쉬운 부분은 챗GPT 활용 방안에 대해서 세부주제별 장을 나눠놓다 보니, 조금 통계 관련 기본 이론이 같이 설명되어 있으면 좋겠다는 생각이 들었다. 물론 챗GPT이 알아서 잘 분석해주겠지만, 어느덧 책을 읽으면서 "이게 통계책인지, 데이터 분석책인지, 아님 프롬프트책인지.." 좀 독자 타겟이 애매할 것 같다는 생각이 들었다. 그래도 데이터 분석을 하는데 있어서 이렇게 챗GPT를 활용할 수 있구나 하는 신선한 주제의 책이었기에 나름 책을 재미있게 읽었다.
이 책은 데이터 분석에 관심은 있지만 경험이 없거나 챗GPT를 활용해 보고 싶지만 막막함을 느끼는 사람들에게 훌륭한 가이드가 되어줍니다. 데이터 분석의 기술적인 부분만을 다루는 데 그치지 않고, 챗GPT라는 혁신적인 도구를 활용해 데이터 분석을 쉽게 접근할 수 있는 새로운 패러다임을 제시합니다.
친근한 구성으로 풀어낸 데이터 분석의 여정 이 책의 가장 큰 장점 중 하나는 '김대리'와 '박차장'이라는 가상의 실무자를 등장시켜 데이터 분석 과정을 현실적인 시나리오로 풀어낸 구성입니다. 독자는 이 두 인물 간의 대화를 통해 데이터 분석 프로젝트가 어떻게 시작되고, 어떤 과정을 거쳐 마무리되는지 자연스럽게 따라갈 수 있습니다. 챗GPT의 기본 사용법, 데이터 전처리, 통계 분석, 머신러닝 활용, 시각화 등 단계별로 체계적으로 구성되어 있어, 입문자도 어렵지 않게 접근할 수 있습니다.
실무에서 바로 활용 가능한 실용성 책의 또 다른 강점은, 단순히 이론에 머무르지 않고 실무에서 즉시 활용 가능한 시나리오와 기술을 제시한다는 점입니다. 챗GPT를 활용한 SQL 작성, 데이터 시각화 코드 생성, 결측값 처리 등의 내용은 실제 업무에 곧바로 적용할 수 있을 정도로 실용적입니다. 추가적인 복잡한 코딩 없이도 고급 분석 기술을 구현할 수 있다는 점은 특히 주목할 만합니다. 또한, 제공된 실습으로 독자가 직접 따라하며 학습할 수 있어, 단순한 읽기로 끝나는 것이 아니라 실질적인 경험을 쌓을 수 있게 합니다.
알아두어야 할 단점 이 책은 입문자에게는 훌륭하지만, 몇 가지 주의해야 할 점도 있습니다. 챗GPT의 유료 플랜을 사용해야만 책에서 제시된 일부 기능을 원활하게 따라 할 수 있습니다. 복잡한 현실 문제를 모델링하거나 심도 깊은 이론을 전달하는 데는 한계가 있습니다. AI를 활용한 분석 결과는 전문가의 검토와 해석이 필수적입니다. 챗GPT가 모든 문제를 해결해주는 '은총알'은 아니라는 점을 염두에 두어야 합니다. 특히 AI의 할루시네이션 문제 등 잠재적인 오류를 감안해 결과를 검증하는 작업이 필요합니다.
데이터 분석의 새로운 시작점 그럼에도 불구하고, 이 책은 데이터 분석을 처음 접하는 입문자부터 실무자까지 폭넓게 읽어볼 가치가 있는 책입니다. 챗GPT를 활용해 데이터 분석 도구로 첫발을 내딛고 싶은 사람들에게 강력한 조력자가 되어 줄 것이며, AI를 활용한 데이터 분석의 새로운 시작점을 마련해 줄 것입니다.
AI 활용의 확장된 가능성 현재 AI 기술은 이노베이터의 단계를 넘어 일반 사용자에게까지 널리 퍼진 상태입니다. 월 20달러라는 저렴한 비용으로, 효율적이고 창의적인 데이터 분석의 세계를 경험하는 것은 이제 선택이 아니라 필수적인 흐름이 되고 있습니다. 데이터 분석의 진입 장벽을 낮추고 싶거나, 챗GPT를 활용해 데이터를 다루는 새로운 방식을 체험해 보고 싶다면 이 책이 그 여정을 함께할 훌륭한 동반자가 될 것입니다.
데이터 분석을 시작하고 싶지만 어디서부터 해야 할지 막막하다면, 이 책이 당신의 히치하이커 가이드 역할을 해줄 것입니다. 가볍게 첫발을 내디디고, 챗GPT를 통해 데이터 분석의 세계로 여행을 떠나보세요.
예전이라고 각 분석담당자의 경험이나 개인 노하우로 하진 않았습니다. 통계기법과 여러 툴들 주로 수기로 활용하는 방법들이 많이 활용되었습니다. 사실 수기로 하든 컴퓨터로 하든 다 관계 없이 동일한 goal을 향해 나아갈 수 있다면 관계없을 겁니다.
하지만 더 편리한 도구가 있고 그 도구라 노동력과 시간이라는 자원을 아껴주는 것은 물론 더 정확하고 다양한 지표들을 뽑아내 준다면 적극 적으로 활용하지 않는 게 이상하겠죠
GPT로 이것저것 만들어보는 (ex 어플) 책도 읽어봤지만 이 책은 최근 제가 하고 있는 업무와 연계되어 더욱 집중하며 읽게되었습니다. AI시대라는 게 왔는데
아니 왔다고 하는 데 아직 활용해보지 못한 분들 어디서부터 시작해야될 지 모르는 분들 벌써 이렇게 많은 지침서가 나와있으니 활용하는 것은 독자의 의지 첫페이지를 여는 데 달려있겠습니다.
책에는 다양한 예제와 두 주인공의 업무와 데이터를 다루는 과정을 그리고 있어 정말 술술 읽히는 데 각 예제마다 실제로 활용해 볼 수 있는 data가 제공되어 더욱 흥미롭습니다. 실습도 해보고 그냥 읽고 넘어가는 부분도 있었는 데요 인터넷만 되는 환경이면 간단하게 해볼 수있어 크게 부담이 없습니다.
파이썬으로 코드가 작성되는 부분이 있을 건데 직접 코딩하는 건 없고 기본적인 문법만 이해하면 됩니다. 파이썬 기본 문법을 반드시 선행해서 읽어야하는 것은 아니니 따로 공부하시면 되겠습니다. 그러나 비전이나 AI쪽을 다룰 때 파이썬이 많이 활용되니 기본 문법 정도는 익히시길 추천드립니다. 일단 코드를 읽을 수 있게되면 작성은 자연스럽게 따라옵니다.
책은 초보자분들도 읽을 수 있게 많은 배려가 되어있어 난이도가 높지는 않습니다. 실무 과제를 수행하는 데 도움이 되는 김대리의 여러프로젝트가 있어서 좀 더 깊이 파고 싶으신 분들은 역시 실전이 좋겠죠 업무에서 엑셀이나 계산툴 같은 것을 활용하고 계신다면 도구를 바꿔보는 것만으로도 AI시대에 한 층 더 가깝게 가는 것이라 생각됩니다.
데이터 애널리스트라는 데이터 분석툴을 기본으로 시작합니다. 분석할 데이터를 수집하고 주제에 맞는 데이터를 정리하고, 데이터를 전처리(사용하기 알맞게 다듬기)하고 시각화합니다. 그리고 분석 결과 보고서를 작성하고 예측모델을 구축합니다. 이후 들어오는 데이터로 예측 모델을 돌릴 수 있습니다.
아주 예전에 회사에서 세미나로 만든 특강에서 데이터 분석 수업을 들어갔다가 통계이론, 확률에 원투 펀치를 얻어맞고 분석툴 사용하는 데 계산식을 이해 못해 좌절 했던 기억이 있는 데요 (필수라고는 알고 있지만 이렇게 시작하는 접근법은 반대입니다 허허)
그런 툴을 앞에 말씀드린 순서대로 간단한 프롬프트로도 작성할 수 있습니다. 데이터를 분석하고 예측하는 역량이 미래에 꼭 필요합니다. 접근법은 다양하겠지만 AI활용 데이터 분석법한번 시작해보는 것도 꼭 필요하겠어요
다시 말씀드리지만 파이썬이나 코딩,수학적 이론보다는 실무중심입니다. 과거 교육법과는 달리 실무예제를 해보고 필요한 이론을 하나씩 역으로 알아가는 게 현재에는 더 맞는 교육법이라고 생각합니다.
저는 파이토치를 활용해 직접 코딩하는 것부터 시작했었는 데요 그나마도 하다 말아 잠시 미뤄둔 상태에서 이 책을 만났습니다. 그게 불과 작년인데 벌써 AI 툴이 나오다니....
정말 격세지감입니다. 책으로 한번 접해보시는 AI 데이터 분석의 세계 분명 놀라실 부분이 있으실 겁니다.
"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다." chatGPT, data analyst의 사용법을 자세하고 쉽게 따라가면서 배울수 있고, 데이터 분석의 기초부터 고급까지 알기 쉽게 소개한 책 https://developer-as-job.tistory.com/57
《월 20달러로 고용하는 데이터 분석가 with 챗GPT》는 데이터 분석에 AI를 활용하는 새로운 접근법을 제시하는 책이다. 최근 AI와 관련된 서적이 쏟아지고 있는 상황에서, 이 책은 “ChatGPT를 활용한 데이터 분석”이라는 실용적인 주제를 한 단계 파고든다는 점이 돋보인다.
책은 초보자를 대상으로 하되, 전문적인 데이터 분석을 배우기 “직전” 단계까지 나아가는 것을 목표로 잡았다고 생각한다. 초반에는 GPT 사용법과 기본적인 설정부터 시작해, 파일 업로드와 데이터 질의 과정을 설명한다. 필요한 실습 파일은 저자가 제공해 독자들이 직접 따라 할 수 있도록 구성되어 있다. 이러한 초반 내용은 일반적인 ChatGPT 활용서와 유사하지만, 책은 여기서 멈추지 않고 한 걸음 더 나아가 데이터 분석 기법을 실제로 ChatGPT를 통해 구현하는 방법을 다룬다.
예를 들어 선형 회귀, 랜덤 포레스트 같은 머신러닝 기법과 데이터 시각화를 통해 실질적인 분석 과정을 보여준다. 필요에 따라 추가 패키지를 설치하는 방법(e.g. whl 파일 업로드로 한글 범례를 그래프에 추가하기)까지 안내하며, 독자가 ChatGPT를 더욱 심화된 분석 도구로 활용할 수 있도록 돕는다.
다만 몇 가지 아쉬운 점도 있다. 책 제목이 암시하듯 ChatGPT의 유료 플랜이 필요하다는 점이다. 무료 플랜 사용자는 업로드 제한으로 인해 원활한 학습이 어려울 수 있다. 또한, ChatGPT의 빠른 업데이트로 인해 일부 UI가 이미 변경된 부분도 존재한다. 이는 저자의 잘못은 아니지만, 독자에게 약간의 혼란을 줄 수 있다.
그럼에도 불구하고, 이 책은 데이터 분석을 처음 시작하는 독자에게 탁월한 입문서다. ChatGPT의 강력한 기능을 활용해, 초보자도 데이터를 이해하고 분석할 수 있도록 잘 구성다. 본격적인 통계 전공자가 아니더라도 실무에서 충분히 활용 가능한 스킬을 익힐 수 있다는 점에서 많은 독자들이 자신의 업무에 활용할 수 있을 거라고 생각한다.