메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

쓸모 있는 AI 서비스 만들기

사전 학습 모델로 빠르게 구현하는 실전 AI 프로젝트 가이드

한빛미디어

집필서

판매중

  • 저자 : 김경환
  • 출간 : 2024-07-18
  • 페이지 : 320 쪽
  • ISBN : 9791169212557
  • eISBN : 9791169218368
  • 물류코드 :11255
  • 초급 초중급 중급 중고급 고급
4.8점 (24명)
좋아요 : 145

 

현직 개발자가 다양한 예제로 알려 주는
쉽고 빠른 나만의 AI 서비스 개발 가이드

 

각종 AI 서비스가 넘쳐 나는 요즘, 이론만 배운 상태에서 곧바로 나만의 AI 서비스를 개발하려 한다면 구현 순서를 헷갈리거나 예상치 못한 상황에 당황하는 등 여러 어려움에 직면할 수 있습니다. 이 책은 이러한 어려움을 극복하고 실용적인 AI 서비스를 구현하려는 초보 개발자를 위해 만들어졌습니다. 꼭 배워야 할 활용도 높은 AI 서비스를 엄선하고, 유스케이스 작성과 같은 기획 단계부터 사전 학습 모델과 파이썬을 활용한 실습 단계까지 한 권에 담았습니다. 특히 단계별로 따라 하다 보면 자연스럽게 쓸모 있는 AI 서비스를 개발할 수 있다는 점이 이 책의 큰 장점입니다.
이 책은 현업 개발자부터 AI/머신러닝 분야 취업 준비생까지 다양한 학습 경험을 가진 독자를 대상으로 합니다. 사전 학습 모델과 애플리케이션의 기초부터 활용까지 폭넓게 다루고, 서비스 분야별 시장 규모와 전망, 활용 사례까지 소개해 트렌드를 읽는 안목과 인사이트를 기를 수 있는 기회를 제공합니다.
이 책을 읽고 나면 나만의 아이디어로 실용적인 AI 서비스를 개발할 수 있다는 자신감을 충분히 가질 수 있습니다. 실제 AI 서비스 구현을 통해 아이디어를 실현하는 즐거움을 체험하려는 모든 이에게 강력하게 추천합니다.

 

김경환 저자

김경환

머신러닝 엔지니어이자 소프트웨어 개발자로서 의료 AI 소프트웨어 개발 기업 메디픽셀(Medipixel), 산업 설비 AI 소프트웨어 개발 기업 원프레딕트(OnePredict) 등 다양한 분야의 기업에서 근무하며 경험을 쌓았다.
또한, 파이썬 입문, 강화학습 등의 주제로 삼성 소프트웨어 아카데미, LG, 멀티캠퍼스 등에서 강의를 진행했다.
현재는 게임/엔터테인먼트 기업인 스마일게이트(Smilegate)에서 AI 서비스를 개발하는 중이며, 머신러닝과 딥러닝 모델을 서빙 및 배포하는 업무를 담당하고 있다.
평소 사용자와 직접 소통하며 실용적인 서비스를 개발하는 것을 지향하며, 머신러닝 기술을 서비스에 응용하는 데 관심이 많다. 또한, 효율적인 협업을 위한 팀 문화와 시스템 구축에도 많은 관심을 기울이고 있다.

저자의 말
AI 개발 트렌드와 현재 ‘쓸모 있는’ AI
- AI의 발전
- 파운데이션 모델과 활용 사례


키워드로 살펴보는 학습 로드맵
순서로 살펴보는 학습 로드맵

chapter 1 괴발개발 손글씨도 읽어 내는 OCR 서비스

1. 1  OCR 개념과 사례
- 개념 이해
- 활용 사례
 

1. 2  알아야 하는 기술 키워드
- 인코더-디코더
- 토크나이저
 

1. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

1. 4  모델 선정하기
- 사전 학습 모델의 장점
- 허깅페이스에서 모델 탐색하기
- 모델 선정하기 - TrOCR
- 모델 정보 얻기
- 모델 테스트하기 - 예제 이미지
- 모델 테스트하기 - 임의의 손글씨 이미지
- 모델 사용법 확인하기
 

1. 5  모델 실행하기
- 실습 환경 설정하기
- TrOCR 모델 실행하기
 

1. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 이미지 파일 업로드 UI 구현하기
- TrOCR 추론기 클래스 구현하기
- 추론 기능 구현하기
- 캔버스 UI 구현하기

chapter 2 사진 속 알맹이만 쏙쏙, 배경을 제거해 주는 이미지 세그멘테이션 서비스

2. 1  이미지 세그멘테이션 개념과 사례
- 개념 이해
- 활용 사례
 

2. 2  알아야 하는 기술 키워드
- 클래스
- 세그멘테이션 마스크
- 바운딩 박스
 

2. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

2. 4  모델 선정하기
- 모델 선정하기 - Segment Anything Model
- 모델 구조 및 특징 파악하기
 

2. 5  모델 실행하기
- 실습 환경 설정하기
- SAM 모델 실행하기
 

2. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 애플리케이션 UI 구현하기
- 마우스 클릭 이벤트 구현하기
- SAM 추론기 클래스 구현하기
- 추론 및 배경 제거 후처리 구현하기

chapter 3 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스

3. 1  자연어 처리 개념과 사례
- 개념 이해
- 활용 사례
 

3. 2  알아야 하는 기술 키워드
- 자연어
- 언어 모델
- 초거대 언어 모델
- 프롬프트와 프롬프트 엔지니어링
- 업스트림 태스크와 다운스트림 태스크
- 웹 스크래핑
- API
 

3. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

3. 4  모델 선정하기
- 모델 선정하기 - GPT
- GPT API
 

3. 5  모델 실행하기
- OpenAI API 키 사용하기
- 실습 환경 설정하기
- GPT 모델 실행하기
 

3. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 챗봇 UI 구현하기
- GPT API로 기본적인 챗봇 구현하기
- News API를 활용해 뉴스 기사 정보 가져오기
- 함수 호출 기능을 활용한 뉴스 기사 탐색 챗봇 구현하기
- 뉴스 기사 요약 및 번역 UI 구현하기
- 뉴스 제목 리스트 선택 기능 구현하기
- 뉴스 기사 스크래핑하기
- 뉴스 기사 요약 및 번역 기능 구현하기

chapter 4 영상 속 대화를 글로 변환해 주는 음성 인식 서비스

4. 1  음성 인식 개념과 사례
- 개념 이해
- 활용 사례
 

4. 2  알아야 하는 기술 키워드
- 자동 음성 인식
- 스펙트로그램
- SRT 포맷
 

4. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

4. 4  모델 선정하기
- 모델 선정하기 – 위스퍼
- 위스퍼 모델의 구조
 

4. 5  모델 실행하기
- 실습 환경 설정하기
- 위스퍼 모델 실행하기 - 라이브러리 활용
- 위스퍼 모델 실행하기 - API 활용
- 유튜브 영상의 음성을 자막으로 만들기
 

4. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 애플리케이션 UI 구현하기
- 유튜브 링크에서 영상 가져오기
- Writer 클래스를 활용해 SRT 자막 파일 만들기 - 라이브러리 활용
- Writer 클래스를 활용해 SRT 자막 파일 만들기 - API 활용
- 위스퍼 추론기 구현하기

chapter 5 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스

5. 1  이미지 생성 개념과 사례
- 개념 이해
- 활용 사례
 

5. 2  알아야 하는 기술 키워드
- 오토인코더
- 잠재 공간
 

5. 3  서비스 기획하기
- 유스케이스 작성하기
- 애플리케이션 구성 구체화하기
 

5. 4  모델 선정하기
- 디퓨전 모델의 기본 개념
- 디퓨전 모델의 발전
- 모델 선정하기 – 스테이블 디퓨전
 

5. 5  모델 실행하기
- 실습 환경 설정하기
- 스테이블 디퓨전 모델 실행하기
- 다양한 스테이블 디퓨전 모델 다운로드하기
 

5. 6  애플리케이션 구현하기
- 환경 설정하기
- 시나리오 최종 확인하기
- 스케치 투 이미지 생성 UI 구현하기
- 모델 다운로드 UI 구현하기
- 모델 다운로드 기능 구현하기
- 모델 불러오기 UI 및 기능 구현하기
- 스케치 투 이미지 생성 기능 구현하기

찾아보기 

빠르게 변하는 AI 서비스의 트렌드를 따라 잡고 싶다면
서비스 구현 방법을 기초부터 활용까지 배우고 싶다면
AI 이론 학습 후 다양한 실전 개발 경험이 필요하다면

 

》 하나, 키워드로 한눈에 파악하는 원리와 트렌드
AI 서비스 구현 방법을 배우는 진정한 목적은 원리를 이해하고 나만의 서비스를 만들어보는 데 있습니다. 특히 구현한 서비스가 시장성이 높은, 즉 쓸모 있는 서비스라면 더할 나위 없이 좋습니다. 이 책은 이러한 부분까지 나아갈 수 있도록 실습 외에도 주제별 개념과 사례, 서비스를 구현하는 키워드 기술을 알려 주어 학습자들이 서비스의 원리를 이해하고 유용한 서비스를 구현할 수 있도록 돕습니다.
이에 더해 주제의 시장성과 전망 분석을 제공하여 요즘 서비스 트렌드를 읽는 눈과 다양한 AI 서비스 중에서도 필수 서비스를 파악하는 통찰력을 키울 수 있습니다.

 

》 둘, 체계적인 개발 가이드로 개발 사이클 이해
5가지 AI 서비스를 구현하는 과정에서 주요 순서를 3단계에 걸쳐 반복 학습하면서 실제 구현 과정을 자연스럽게 이해하도록 구성했습니다. ① 해당 서비스 구현에 적합한 사전 학습 모델을 탐색하고 선정하는 방법을 배우며, ② 사전 학습 모델의 사용법을 익히고 서비스 구현 준비를 합니다. ③ 실제 서비스 구현 및 검증 과정을 거쳐 최종적으로 완전한 서비스를 구현합니다. 이 책의 학습 로드맵을 따라가다 보면 하나의 AI 서비스를 구현하는 과정이 자연스럽게 머릿속에 새겨집니다.

 

》 셋, 쉽게 이해하면서도 깊이 있는 실습을 위한 다양한 구성
초보 독자들이 쉽게 이해할 수 있도록 각종 그림과 따라 하기 구성을 적용했습니다. <유스케이스 다이어그램>을 그림으로 표현해 최종 사용자의 요구사항과 화면, 기능들을 기획하는 과정을 직접 보여 주고, 저자가 구현해 놓은 코랩 예제를 따라 하다 보면 빠르고 정확하게 서비스를 구현할 수 있습니다.
저자 깃허브에서 추가 학습을 위한 각종 예제 파일을 제공하고 있으며, 궁금한 점은 언제든지 질문할 수 있어 더 깊이 있고 다양한 학습이 가능합니다. AI 서비스를 쉽고 빠르게 구현하면서 모르는 부분은 저자와 소통하며 배워 나갈 수 있으니, 지금 바로 도전해 보세요.
▶ 저자 깃허브: https://github.com/mrsyee


이 책은 누구를 위한 책인가요?
》 현업 AI 서비스 (주니어) 개발자
》 AI/머신러닝 분야 취업 준비생
》 생성형 AI의 빠른 변화를 따라잡고자 서비스를 구현해 보려는 개발자
》 AI 이론을 학습했으나 개발 경험은 부족한 개발자

이 책은 AI 서비스 개발에 첫 발을 내딛는 이들을 위한 실용적으로 작성되었습니다. 
'쓸모 있는 AI 서비스 만들기 사전'이라는 제목에 걸맞게, 현업에서 활용도가 높은 5가지 AI 프로젝트를 통해 독자들이 실제 서비스를 구현해볼 수 있도록 안내합니다.

각 장마다 특정 AI 기술(OCR, 이미지 세그멘테이션, 자연어 처리, 음성 인식, 이미지 생성)을 다루며, 개념 설명부터 시작해 서비스 기획, 모델 선정, 실제 구현까지 단계별로 상세히 설명합니다. 


프로젝트를 구성하면서 학습하는 형태로 되어 있기 때문에 유스케이스 작성과 같은 기획 단계를 포함되어 있습니다.

제가 생각하기에 이 책의 가장 큰 장점은 실습 위주의 접근법입니다. 
각 프로젝트를 따라하며 자연스럽게 AI 서비스 개발 과정을 익힐 수 있습니다. 
또한 한국 저자가 집필해 문장이 매끄럽고 이해하기 쉽다는 점도 큰 장점입니다.
참고로 저는 음성인식 관련된 토이프로젝트를 할 때 읽었는데, 실질적인 도움이 되었고 쉽게 이해되었습니다.

다만, 이책은 AI 기술의 깊이 있는 이론이나 고급 기술을 다루지는 않습니다. 
대신 앞서 말한 것 처럼 실용적인 서비스 구현에 초점을 맞추고 있어, AI 개발에 입문하는 이들이나 실제 서비스를 빠르게 만들어보고 싶은 이들에게 적합합니다.

결론적으로, 이 책은 AI 서비스 개발에 첫 발을 내딛는 이들에게 훌륭한 출발점이 될 것입니다. 
실습을 통해 기본 개념과 개발 과정을 익힌 후, 더 깊이 있는 학습을 위해 다른 자료로 나아가는 것이 효과적인 학습 방법이 될 것입니다.

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
 

예전에는 e커머스같은 서비스가 핫했다면, 최근 가장 이슈가 되고 있는 IT 서비스는 ChatGPT같은 생성형 AI를 활용한 서비스가 될 것이다. 사실 예전같으면 어떤 웹서비스를 하려면 능력있는 개발자가 빵빵한 자원을 가지고 이리저리 실험하면서 잘 구축한 시스템 환경상에서 운영하는게 필요했을텐데, ChatGPT가 그런 능력있는 개발자 역할을 하게 되면서, 어떤 아이디어만 있으면 금방 서비스화할 수 있는 시대까지 도래했다. 실제로 생성형 AI를 활용한 서비스를 실제로 출시해 수익을 거둔 사례는 조금만 검색해봐도 많이 찾을 수 있다. 그럼 문제는 "나도 과연 그런 서비스를 만들 수 있을까?" 가 될 것이다.

쓸모 있는 AI 서비스 만들기

이번에 소개하는 책은 앞에서 언급했던 "나도 과연 AI 서비스를 만들 수 있을까?"에 대한 어느 정도의 답을 제공하는 책이다. 딱 어느 하나에 한정된 서비스에 대한 예제뿐만 아니라 어떤 AI 서비스를 런칭하고자 할때 고민해야될 사항들, 예를 들어 유스 케이스에 대한 내용이 포함된 기획부터 실제 서비스하기 위한 코드 구현, 실제 실행까지 서비스 운용에 필요한 전반적인 내용을 다루고 있다. 어떻게 보면 AI 서비스부분만 빼면, 실제 웹서비스를 배포할때 필요한 일련의 과정들이 쭉 소개된 책이라고 봐도 될만큼 내용이 정형화되어 있었다. 책에서 크게 다루고 있는  AI 서비스 예제는 다음과 같다.

  • TrOCR을 활용한 광학 문자 인식 서비스
  • SAM (Segment Anything Model)을 활용한 배경 제거 서비스
  • GPT 서비스를 활용한 이슈 요약 서비스
  • Whisper 모델을 활용한 동영상 내 자막 생성 서비스
  • Stable Diffusion을 활용한 이미지 생성 서비스

딱 내용만 봐도 AI가 가장 잘 활용될 수 있는 영상, 자연어 처리, 음성에 대한 서비스를 직접 기획도 해보고 (물론 돈이 들기는 하지만) 실제 서버를 통해서 서비스를 구현도 해볼 수 있기 때문에 생성형 AI에 대한 막연한 두려움을 가지거나 뭔가 시작을 어디에서 시작해봐야 할지 모를 사람에게는 좋은 책이라고 할 수 있다.

개인적으로도 코드는 논외로 치더라도, 책에서 다루는 내용이 다양한 AI 모델을 실제로 서비스화하면서 고민해볼 만한 사항들을 책으로 녹여져 있다는 부분이 참 좋았던 것 같다. 특히 앞에서 언급했던 것처럼 다양한 예제들을 소개해보고 직접 해볼 수 있는 기회를 제공한다는 것 자체가 해당 서비스를 기획하고 어떻게 하면 더 좋은 기능을 제공할지 고민하는 기획자에게 정말 좋은 실습 과정을 제공하는 것이라고 생각했다. 그렇다고 책에서 다루는 내용이 어떤 원론적인 이론 내용이나 수식을 담고 있지 않아서 크게 어렵지 않다.

나도 ChatGPT 서비스를 실제로 구독하고, 물론 도움도 많이 받긴 했었지만 이걸가지도 어떻게 사람에게 유용한 서비스를 만들 수 있을까 하는 고민을 종종 하곤 했는데, 그래도 이 책이 어느 정도의 실마리를 제공해서 조금씩 생각하는 것을 시도해보려고 한다. 

한빛미디어에서 출간된 쓸모있는 AI 서비스 만들기 책은 OCR, Image Segmentation, NLP, 음성인식, 이미지 생성 등의 도메인에 대해 AI 이론을 학습한 이후에 다음 단계에 어떤 것을 해야하는지 고민하는 분들을 위해서 쓰여졌다. 흔하디 흔한 이론 설명이 아닌 실제로 AI 서비스를 어떻게 구현하고 활용해야하는지에 대한 책이라 기대가 많이 되었다. 과연 쓸모있는 AI 서비스란 어떤 것일까? 이 책에서는 OCR 기술(약 185억 달러), 이미지 세그먼테이션 기술(약 50억 달러), 자연어 처리 기술(약 345억 달러), 음성 인식 기술(약 268 달러), 이미지 생성 기술(약 67 달러) 등 시장 규모를 따져 쉽게 상용화가 가능한 AI 기반 서비스를 구현하는 것을 목표로 하고 있다. 물론 이 책 하나만으로 현존하는 AI 서비스 범위를 다 파악할순 없겠지만, 대략적으로 시장 사이즈를 파악하고 어떤 서비스가 흥해왔는지 흐름을 읽기에는 충분해보였다.
 
더불어 이 책을 개발자가 꼭 읽어봤으면 하는 이유가 있다. 서비스 도메인 마다 '서비스 기획하기' 파트가 있는데, 여기서 유스케이스를 작성하고, 애플리케이션 구성을 구체화 해가는 작업에 대해 기술해놓았다. 이 파트를 읽으면 기획자의 의도를 조금이라도 더 잘 파악해서 개발하는데 더욱 더 확장된 시각으로 볼 수 있지 않을까? 싶었다. 앞으로 이렇게 AI 서비스를 만드는 기업은 더욱 더 많아질 것이고, 앞으로는 기업이 만드는게 아니라 '개인'이 만드는 시대가 곧 올 것 같다. 그러기 위해서는 이렇게 서비스 관점에서 기술을 이해하고 구성해나가는 능력이 더 필요하지 않을까. 라는 생각을 하게 해준 인사이트가 충분히 되는 책이였다. 

 

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
 

들어가며…
안녕하세요? 정리하는 개발자 워니즈입니다. 이번시간에는 쓸모 있는 AI 서비스 만들기라는 책에 대해서 서평을 해보려고합니다. 최근 ChatGPT와 관련하여 AI관련 내용이 굉장히 화두가 되고 있는데요. 필자도 이러한 AI에 대해 관심이 가기 시작했습니다. 대체 어떻게 학습을 하고 판단을 내리고 결과를 실행하는 것일지 너무 궁금해졌습니다. 이번 책을 통해서 그 내용에 대해서 간단히라도 도움을 받을 수 있을 것이라 생각하게 됐습니다. 그럼 각 장 별로 어떤 내용이 있는지 정리해보겠습니다.

1장 괴발 개발 손글씨도 읽어 내는 OCR 서비스
OCR(Optical Character Recognition) 기술은 이미지 속에 들어 있는 문자를 컴퓨터가 인식할 수 있는 디지털 문자로 변환해주는 기술입니다. 이를 통해서 다양한 종류의 문서 및 이미지에 포함된 텍스트를 디지털 데이터로 변환할 수 있는 OCR 기술을 채택하는 기업이 나날이 늘어나고 있습니다.

그러고보니 며칠전 필자가 코인 관련 월렛을 생성하면서 주민등록증을 사진으로 찍었는데 모든 글자들이 텍스트 형태로 자동 변환되는것을 경험했습니다. 이미 오래전부터 사용된 기술이긴했지만 그 이면에는 OCR이라는 AI 기술이 적용된 것이라는것을 책을 통해서 알게 됐습니다.

기본적으로 각 챕터의 구성은 기술 키워드를 알 수 있도록 설명하고 있습니다. OCR과 관련한 내용으로는 다음과 같은 개념들이 있습니다.

인코더-디코더
인코더-디코더구조는 복잡한 입력 데이터를 압축하고 재구성하는 딥러닝 모델의 일반적인 구조를 의미합니다.

토크나이저
토크나이저는 우리가 사용하는 언어를 컴퓨터가 이해하고 처리할 수 있는 형태로 바꿔주는 중요한 도구입니다.

상위 2가지 개념을 통해서 서비스를 구현하는 내용으로 이어집니다. 직접 손글씨로 작성한 내용을 OCR을 통해서 텍스트로 변환하는 어플리케이션입니다. 별도로 AI를 직접 구현하는 것이 아니라 이미 오픈소스로 알려진 라이브러리를 이용하는 부분에 대해서 소개를 하고 있습니다.

최근 AI 분야의 논문들은 모델을 구현한 코드 및 사전 학습 모델과 학습에 사용한 데이터셋까지도 함께 배포하는 경우가 많이 있다고 합니다. 책에서는 TrOCR이라는 모델에 대해서 설정하고 테스트하는 부분에 대해서 소개하고있습니다. 소스코드도 간단하게 소개를 하고 있어서 책을 읽으면서 직접 실습도 해볼수 있도록 구성한 내용이 유익했습니다.

2장 이미지 세그멘테이션 서비스
이미지 세그멘테이션(Image Segmentation) 기술은 컴퓨터가 디지털 이미지나 영상에서 데이터를 추출하고 해석할 수 있도록 하는 컴퓨터 비전 기술 중의 하나로, 이미지 내의 특정 객체를 픽셀 단위로 분리하는 기술입니다.

이미지 세크멘테이션은 객체의 정확한 형태까지 인식하는 기술로 객체 인식 기술(Object Detection)과는 다소 상이한 부분에 대해서 설명하고 있습니다. 객체 인식 기술은 해당 객체의 크기 및 위치만 인식합니다. 전쟁 영화 같은 부분에서 전투 비행기를 타고 가면서 적을 타겟팅하는것이 객체 인식 기술이 사용된것이 아닌가 생각하게 됐습니다.

이미지 세그멘테이션의 활용 사례는 의료 이미지 분석 서비스, 자율주행 서비스, 영상 분석 서비스에서 활용 되고 있습니다.

이미지 세그멘테이션 서비스와 관련한 기술에는 다음과 같은 것이 있습니다.

클래스
클래스는 분류 문제에서 대상이 될 수 있는 여러 카테고리 중 하나를 의미합니다.

세그멘테이션 마스크

이미지 세크멘테이션의 목적이 사람과 배경을 구분하는 것이라면 세그멘테이션 마스크에서 사람에 해당하면 1, 배경이면 0으로 표현할 수 있습니다.

바운딩 박스

이미지 내의 관심 객체 주위를 사각형으로 둘러싸는 것을 의미합니다.

책에서 소개하는 모델은 Segment Anything Model(SAM)이 있습니다. 메타에서 2023년 4월에 공개한 파운데이션 모델로, 이미지 세그멘테이션에 특화된 파운데이션 모델이라고 설명하고 있습니다. 사용자의 클릭을 점 좌표로 변경해서 SAM의 세그멘테이션 프롬프트로 입력하면, 사용자가 클릭한 위치의 객체를 세그멘테이션 할 수 있습니다.

예제 어플리케이션으로는 이미지를 업로드하고 마우스로 클릭하면 SAM을 통해서 이미지 점 좌표로 변경후 SAM에 의해서 특정 영역이 출력(배경이 제거되는)되는 어플리케이션입니다.

3장 자연어 처리 서비스
필자는 해당 챕터가 가장 관심이 많이 갔습니다. 최근에 챗봇을 개발하고 있는데요. 자연어 처리를 통해서 좀 더 사람과 대화하듯이 만들고 싶었습니다. 그래서 자연어 처리를 어떻게 접목 시킬지를 고민하고 있었는데 해당 챕터를 읽으면서 많은 부분 배우게 된것 같습니다.

사람이 일상적으로 사용하는 언어를 자연어(Natural language)라고 합니다. 자연어 처리 기술은 컴튜터가 이러한 자연어를 이해하고 사용할 수 있도록 도와주는 기술입니다. 보통의 활용 사례는 추로 챗봇 혹은 채팅 서비스에 많이 적용되는 것 같습니다. 감정 분석 서비스, 번역 서비스 등에서 활용 되고 있다고 설명하고 있습니다.

자연어 처리와 관련한 기술 키워드에 대해서 소개하고 있습니다.

자연어
언어 모델

단어나 문장, 문단 단위로 자연어 데이터를 입력받은 후, 다음에 올 단어나 문자열을 예측하는 모델입니다. 문장 생성, 기계 번역, 음성 인식 등 여러 응용 분야에서 사용되고 있습니다.

초거대 언어 모델

LLM은 일반적인 언어 모델보다 훨씬 큰 규모의 언어 모델입니다. 파라미터와 방대한 데이터를 학습한 모델로 일반화 성능이 뛰어납니다.

책에서 소개하는 LLM의 대표적인 모델로는 GPT를 소개하고있씁니다. GPT는 OpenAI에서 개발한 자연어 생성 모델입니다. GPT는 세가지 약자로 다음을 함축하고 있습니다.

Generative – 무언가를 생성하거나 만들어 내는 능력
Pre-Trained – 대량의 데이터셋으로 미리 학습
Transformer – 핵심 아키텍처가 트랜스포머로 구성
관련한 실습 어플리케이션은 프롬프트 창을 통해서 챗봇에 입력합니다. 질문에 해당하는 여러 기사를 정리해서 제공하고, 사용자가 선택하게 되면 스크래핑을 통해서 요약 및 번역을 제공하는 서비스 입니다. 위의 GPT 모델을 이용해서 손쉽게 구현하는 부분에 대해서 소개하고 있습니다.

4장 음성 인식 서비스
음성 인식은 우리 주변에서 너무나도 많이 사용하고 있습니다. 필자는 네비게이션에서 주로 많이 활용하는데요. 목적지를 음성으로 입력하면 텍스트로 변환후 목적지를 선택할 수 있게 제공하고 있습니다. 이렇게 음성을 인식하고 텍스트로 변환해주는 서비스에 대해서 소개를 하고 있습니다.

활용 사례는 위에 이야기한대로 우리 주변에서 많이 사용되고 있습니다. 스마트폰 가상 비서 서비스, 자동차 내비게이션 서비스, 음성 메모 서비스에 대해서 소개하고 있습니다.

음성 인식 기술에서 알아야 할 키워드는 다음과 같습니다.

자동 음성 인식
스펙트로그램

시간에 따른 소리 주파수의 변화를 2차원 이미지로 표현한 그래프입니다. 음성 인식 기술에서 스펙토그램은 음성 신호를 분석하고 처리하는데 중요한 역할을 합니다.

해당 챕터에서 예제로 만드는 어플리케이션은 유튜브 영상의 URL을 입력하면 자동으로 번역 스크립트를 작성해주고 영상을 다시 제작해주는 어플리케이션을 만드는것에 대해서 소개하고 있습니다.

모델은 위스퍼라는 것을 선정하고 있습니다. 위스퍼는 2022년 9월에 OpenAI에서 공개한 자동 음성 인식 모델입니다. 이 모델은 음성 인식 작업 및 텍스트 변환 작업을 학습하기 위해 웹에서 수집한 약 680,000시간 분량의 다국어 음성 데이터를 학습했다고 소개하고 있습니다.

5장 이미지 생성 서비스
필자는 해당 챕터에 대해서도 관심이 많은데요. 스크립트를 입력하면 지금까지 없던 새로운 이미지를 생성해주는 것이 너무나 신기했습니다. 화가라는 직업이 무색해질 정도로 정말 창의적이고 새로운 그림 혹은 이미지들을 많이 생성하는 것 같습니다.

이미지 생성 서비스, 기존 이미지 기반 새 이미지 생성 서비스, 예술 작품 생성 서비스 등 다양한 예술 분야에서 활용 되고 있습니다.

이미지 생성 서비스 관련하여 알아야할 키워드는 다음과 같습니다.

오토인코더
입력 데이터를 저차원 표현으로 인코딩한 후, 이를 다시 원래의 고차원 데이터로 복원하는 과정을 학습하는 비지도 학습 모델

잠재 공간

원본 데이터의 복잡한 특성을 보다 간결하고 관리하기 쉬운 형태로 변환한 공간을 의미

해당 챕터에서 소개하고 있는 모델에 앞서 디퓨전 개념에 대해서 설명하고 있습니다. 디퓨전은 물리학의 확산개념에서 영감을 받은 모델입니다. 이미지에 잡음(Noise)이 확산되는 것으로 소개를 하고 있습니다. 이러한 잡음의 정도를 어느정도 제거해야되는지를 예측하는것이 잡음 예측기라고 합니다. 이러한 잡음을 제거하면서 점차 선명한 특정 이미지를 생성할 수 있다고 소개하고 있습니다.

이러한 디퓨전의 개념은 초창기에 잡음을 계산하고 예측하는데 컴퓨팅 자원이 많이 소모되어 점차 발전하게 됐습니다. 그러면서 등장한것이 앞서 소개한 잠재 공간 활용 입니다. 복잡한 데이터를 간결하고 관리하기 쉬운 형태로 변환한 공간을 의미합니다. 이러한 발전을 통해서 현재는 좀더 빠르게 처리할 수 있도록 되었다고 소개하고 있습니다.

책에서 선정한 모델은 스테이블 디퓨전입니다. 이 모델은 독일 뮌헨의 루트비히 막시밀리안대학교의 콤프비스 그룹과 런웨이, 그리고 스타트업인 스태빌리티 AI라는 회사가 합작해서 마든 이미지 AI 모델입니다.

이를 통해서 이미지를 업로드하거나 텍스트로 설명을 통해서 이미지를 생성하는 간단한 어플리케이션의 실습에 대해서 소개하고 있습니다.

마치며…
기본적으로 책의 구성은 굉장히 좋았습니다. 5가지의 AI 서비서, 책 제목대로 쓸모있는 모델들에 대해서 소개를 해주었습니다. 알아야할 기술적 키워드, 모델, 실습으로 이어지는 구성을 통해서 쉽게 이해할 수 있었습니다. 더군다나 실습하는 내용들은 코드 형태로 설명을 하고 있어서 따라하면서 하나씩 익힐 수 있어 재밌기도 했습니다. 전반적으로 쉽게 읽을 수 있도록 난이도 조정이 잘되어있는것 같아서 AI에 관심있는 독자라면 누구라도 추천할만한 책인것 같습니다.

본 포스팅은 “한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

세상이 이렇게 바뀌었다.
AI 열풍이 불어온 지도 벌써 몇 해가 지난 것 같다.
Generative AI 인 Chat GPT는 내 인생을 바꿀 만큼 영향을 끼치고 있고, 익숙하게 써왔던 업무 툴들은 너도나도 AI 기능을 탑재하고 있다.

그리고 몇 개월에 걸쳐서 코드를 짰던 크롤링 코드는 이제 수 분이면 끝낼 수 있고, 누끼(배경제거)를 따기 위해 한 땀 한 땀 클릭은 이제 딸깍 한 번으로 이미지를 뽑아준다.

#️⃣ 5가지 서비스를 직접 만들어보기
손글씨 인식부터 스케치 투 이미지 서비스까지 미리 만들어진 라이브러리를 활용하여 다양한 서비스를 직접 만들어볼 수 있게 구성했다.

책의 제목에서 나오듯이 "쓸모 있는"에 굉장히 신경을 많이 쓴 모양이다. 디자이너 중에 이미지 배경 제거를 해보지 않은 사람이 없을 거고 마케터 중에서 뉴스 기사를 수집해보지 않은 사람이 없는 것처럼 흥미가 끌릴만 한 소재로 구성했다. 실제로 마지막 서비스인 '스케치 투 이미지'를 제외하곤 모두 이제까지 평범한 직장인의 야근을 유발했던 단순 반복적이면서 에너지가 많이 드는 일들이다.

덕분에 AI의 붐과 함께 가장 먼저 사람들이 많이 뛰어들었고 그만큼 급격한 발전과 커뮤니티가 형성된 분야라고 한다.

#️⃣ 기획의 관점에서 출발
사실 이런 류의 책들은 단순 코드의 나열이나 설명에 그쳐서 실제로 다른 상황에 적용하기 어려운 부분이 있다.

그러나, 이 책은 서비스 기획자의 관점에서 어떻게 유즈 케이스(Use Case)를 작성하고, 어떤 모델을 사용해야 하는 지까지 그 과정을 자세히 서술하고 있다.

코드를 작성하는 부분에서는 기능별로 구분하여 실제로 개발할 때 커밋단위처럼 기능별로 세분화하여 설명한다.

사실 무작정 따라하는 것보다는 배경과 목적을 이해하고 서비스를 기획하는 것 만큼 중요한 것은 없기 때문에 다른 책과 다른 이런 구성은 너무 만족스러웠다.

#️⃣ 코드 예제는 뿐만 아니라 기초 개념도 챙겨주는
실습을 위주로 서술된 책인 만큼 당연히 깃헙과 코드 예제를 챙겨주지만, 서비스에 대한 이해를 돕기 위해 기초 개념을 설명하기도 하고, 어려운 용어가 나올 때는 리마크를 달아놓았다.

사실 이 책은 파이썬(Python)으로 실습하는 책이고, 이 책을 볼 정도의 독자들이라면 충분히 알수 있을 만한 개념들인데도 한 번 더 친절하게 설명해준다. 다만 이 부분은 조금 아쉬웠는데 json 파일이 무엇인지, HTML 태그 같은 개념을 모르는 사람이 이 책을 볼 일이 없기 때문에 쉬운 개념의 설명보다는 좀 더 어려운 라이브러리나 함수에 대한 설명을 좀 더 덧붙였으면 어떨까하는 생각이 든다.

이와 별개로 그동안 생성형 AI를 이용만 해봤지 직접 만들 생각 같은 건 못해본 나로써는 허깅페이스(Huggingface)나 뉴스 API(News API)와 같은 서비스를 알게 되어서 다른 서비스도 빨리 만들어보고 싶다는 생각을 들게 했다.
 



<이 책의 장점>

번역서가 아니라 한국인 저자가 직접 써 번역체보다 이해하기 쉽다.

실제 예시 코드를 브라우저로 바로 접근하고 실행해 볼 수 있다.

사전 학습 모델을 탐색하는 법, 유즈케이스로 최종 앱 구체화하기 등 서비스 제작 과정을 배울 수 있다.

AI 서비스를 위한 5가지 기본 기능을 다 배울 수 있다.

 

 

 

"한빛미디어 <나는 리뷰어다>활동을 위해서 책을 제공받아 작성된 서평입니다."

ICT와 빅데이터, AI통한 기술은 과거와는 그 변화의 속도가 다른 것 같습니다. 예전에는 수년이 지나야 업데이트 된 기술이 지금은 3~6개월 사이에 새롭게 변모합니다. 그러니 본서와 같은 AI서비스를 만들기 위한 AI 프로젝트 가이드 서적도 나오는 것이겠지요 본서는 OCR(손글씨), 이미지 세그멘테이션(이미지 배경제거), 자연어처리(뉴스 챗봇), 음성인식(자막생성), 이미지생성(스케치 투)의 5가지 분야의 AI서비스를 구현할 수 있는 실질적인 방법을 다룬 서적이며 본서에 나온 사전학습모델-모델테스크-AI서비스 구현은 소재를 막론하고 자신이 원하는 아이디어를 현실로 실행시켜줄수 있는 아주 강력한 알고리즘이라고 생각합니다.그런데 세상이 아주 빨리 변화하다보니 저의 마음을 읽은 듯한 서적이 출간되었습니다. 바로 <쓸모 있는 AI 서비스>입니다.

 

이러한 알고리즘아래 본서는 5가지의 주제별로 개념이해-기술키워드-서비스기획-모델선정-실행-APP구현까지의 단계별 설정을 따라가면서 AI서비스가 이렇게 구현되는구나를 체험하게 합니다. 물론 모든 것을 떠먹여주는 서적은 아니지만 개념의 이해부터 APP구현까지의 방식을 따라하면서 용어나 소프트웨어 인프라의 행간을 따라가면서 누구나 자신이 원하는 APP을 만들 수 있다는 자신감을 부여하고, 모방의 과정을 통해 프로젝트 수행역량을 만들게 할 수 있는 것이 가장 큰 장점입니다

따라서 본서를 몇회독 하면서 서비스 구현을 따라하고 나서는 다음의 2가지로 활용할 수 있습니다. 첫째, 개인사업자나 개발자 혹은 저와 같은 구현을 희망하는 AI서비스가 있다면 아이디어와 방식을 변형하여 그대로 따라해보면 그 서비스 구현이 가능해 질 것입니다.(단, 배포와 마케팅은 그 다음의 문제일겁니다) 둘째, 만일 현업에서 활용하고 싶은데 APP개발부서가 없이 외주나 협업을 한다면, 해당 과정의 기획이나, PM으로서의 역량을 만들수 있으니 일석이조라고 자신있게 말할 수 있겠습니다.

 

‘이런게 진짜 자기계발서입니다’

 

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
 

베이스 모델 활용부터 실습까지, 초보자를 위한 친절한 안내서


AI 모델을 바닥부터 개발하거나 특화된 모델을 만들어내는 작업은 이제 일부 선도 기업이나 대규모 자본을 보유한 기업들의 영역이 되어가고 있습니다. 초창기에는 국내 IT 기업들도 자체 AI 모델을 개발하여 이를 홍보했으나, 모델의 크기가 커지고 성능이 정교해지면서 자체 모델을 개발하는 기업의 수가 점차 줄어들고 있습니다. 이는 기술이 발전함에 따라 자연스럽게 나타나는 현상입니다. 과거 데이터베이스 산업에서도 유사한 일이 발생했습니다. 초기에는 여러 중소 데이터베이스 업체들이 존재했지만, 기술이 고도화되면서 결국 소수 대기업과 매우 특화된 몇개의 제품만이 경쟁에서 살아남았습니다.
AI 산업에서도 비슷한 흐름이 이어지고 있습니다. 구글, 오픈AI, 마이크로소프트와 같은 대규모 기업들이 수백억 개의 매개변수를 가진 초거대 모델을 개발하며 AI 산업을 주도하고 있습니다. 이러한 모델들은 엄청난 데이터 셋과 컴퓨팅 자원을 필요로 하기 때문에, 왠만한 기업이 자체적으로 개발하기 어려운 상황입니다.
모든 기업이 자체 AI 모델을 개발할 필요는 없어졌습니다. 많은 중소기업들이 허깅페이스와 같은 플랫폼에서 제공하는 사전 학습된 모델을 활용하여 자신들의 특화된 애플리케이션을 개발하고 있습니다. 이를 통해 더 빠르고 저렴하게 AI 기술을 비즈니스에 통합할 수 있으며, 대기업의 초거대 모델을 활용하여 차별화된 서비스 제공이 가능해졌습니다. 이러한 변화는 AI 생태계에서 대기업과 중소기업 간의 협력을 촉진하며, AI 기술의 보편화를 가속화하고 있습니다.

결국 일반적인 IT기업의 대중적인 AI 기술 개발은 자체 모델 개발보다는 선도 기업이 공개한 베이스 모델을 활용하여 특화된 모델로 파인튜닝하는 방향으로 전환되고 있습니다. 이제는 얼마나 독창적인 아이디어로 이러한 베이스 모델 기반 AI 서비스를 개발하느냐가 중요한 경쟁 요소가 되었습니다. AI 기술은 단순히 모델의 크기와 성능뿐 아니라, 서빙과 인퍼런스를 얼마나 정확하고 빠르게 수행하며, 이를 독창적인 방식으로 적용하는가가 성공을 좌우하는 핵심 요인이 되었습니다. 이 책은 바로 이러한 변화 속에서 AI 기술의 새로운 시작점이자 출발점이 될 수 있는 내용들을 다루고 있습니다. AI 모델을 활용해 실질적인 가치를 창출하는 방법을 안내하며, 초보 개발자부터 실무자까지 실질적으로 도움이 되는 방향을 제시합니다.

현재 AI 산업은 거대 모델의 개발비용이 매우 높은 반면, 오픈소스 모델이나 API 서비스 형태로 제공되는 모델의 활용이 더욱 보편화되고 있습니다. 기업들은 이를 바탕으로 각자의 도메인에 특화된 솔루션을 개발하고 있으며, AI 서비스의 확장성과 성능을 극대화하기 위해 클라우드 기반의 AI 서빙 인프라를 활용하는 사례도 많아지고 있습니다. 또한, 모델을 파인튜닝하거나 맞춤형으로 변형하는 작업은 다양한 산업에서 맞춤형 AI 서비스 개발을 가능하게 하여, 독창적인 서비스 개발의 장을 열어가고 있습니다.
이러한 서비스를 만들기 위한 기본개념, 용어 및 서비스 개발방법에 대한 첫단추를 이 책이 담당합니다.

이 책의 가장 큰 장점은 초보자도 쉽게 이해할 수 있도록 친절한 설명과 실습 예제를 제공한다는 점입니다. 각 프로젝트는 유스 케이스 작성에서부터 시작해 모델 선정 및 테스트, 실제 애플리케이션 개발 과정까지 일관된 프로세스로 구성되어 있어, AI 서비스 개발의 기본적인 흐름을 자연스럽게 익힐 수 있습니다. 또한 사전 학습된 AI 모델을 활용하여, 모델을 직접 개발하거나 학습시키는 부담 없이 인퍼런스와 서빙의 기본에만 초점을 맞추어 빠르고 쉽게 서비스를 구축할 수 있다는 점이 매우 유용합니다. 특히 저자가 깃허브에 제공하는 실습 자료를 통해, 독자들은 직접 코드를 실행하고 서비스를 구현할 수 있습니다. 코랩을 통해 결과를 확인하거나 gradio 등의 실제 허깅페이스 등에서 활용하는 라이브러리를 사용하여 눈에 보이는 결과를 쉽게 만들어 낸다는 부분이 유용합니다.

책은 개념적 설명뿐만 아니라 실습을 강조하고 있어, 독자들이 이론을 직접 체험하며 이해할 수 있도록 구성되어 있습니다. 각 장의 서비스 구현 과정에서는 필수적인 개념과 함께 기술 키워드, 모델 선정, 서비스 기획 단계가 명확히 설명되며, 그 과정에서 독자는 AI 모델의 활용 가능성을 체감할 수 있습니다. 또한, 챕터마다 설명된 시장성 및 트렌드 분석은 AI 서비스 개발의 실용성을 고려하거나 실습을 하는 정당성을 부여하는 데 큰 도움이 됩니다. 예를 들어, OCR 서비스를 구현하는 과정에서 개발자들에게 부족할 뻡한 손글씨 인식의 시장성을 비용으로 환산해 피부로 느낄 수 있게끔 제시하고, 이를 통해 더 적극적으로 실생활에 어떻게 적용할 수 있을지 고민할 수 있는 반초를 제공합니다. 자연어 처리 챗봇 프로젝트 등도 GPT 모델을 활용해 뉴스 기사를 요약하고 번역하는 방법을 배우면서 실질적인 AI 활용사례를 훌륭하게 간접체험 할 수 있습니다.

그러나 이 책의 한계점도 존재합니다. 무엇보다도 내용의 깊이가 있지 않습니다. 말 그대로 기본 개념과 주요 용어를 소개하고 기본적인 라이브러리와 도구를 이용해 서비스를 만들기 때문에 목마른 이에게는 바닷물을 주는것과 같을 수 있습니다. 우물은 스스로 파야 하는 단점이 있습니다. 또한 서빙과 인퍼런스 설명과 실습을 위해 벤또와 같은 관련 라이브러리 소개가 없는것도 아쉽습니다. 앞서 기술한 대로 주로 이미 학습된 AI 모델을 기반으로 서비스 구현에 중점을 두고 있기 때문에, AI 모델의 직접적인 훈련 과정이나 고급 AI 모델링 기법을 다루지 않습니다. 따라서 모델 학습 및 훈련 과정을 심도 있게 배우고자 하는 독자에게도 다소 아쉬울 수 있습니다. 또한, 책의 범위는 AI 서비스 구현의 기초 단계에 집중되어 있어, 더 복잡하고 맞춤화된 AI 모델을 개발하려는 고급 개발자들에게는 다소 부족하거나 너무 쉬운 내용입니다.

그럼에도 불구하고 이 책은 AI 서비스 개발을 처음 시작하는 사람들에게 매우 유용한 자료입니다. AI 이론만을 학습하고 실습 경험이 부족한 독자들에게는 서비스 구현 과정을 체험할 수 있는 소중한 기회를 제공하며, 다양한 AI 서비스의 실전 사례를 통해 이론과 실습을 균형 있게 배울 수 있습니다. 또한 각 기술이 어떻게 실제 애플리케이션에 적용되는지에 대한 인사이트를 제공해, AI 기술의 응용 가능성을 넓힐 수 있습니다. 서빙과 인퍼런스를 준비하는 모든 전공의 학생들에게도 적극 추천합니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

현직 개발자가 알려주는 5가지 필수 AI 서비스

이미 만들어져 있는 학습모델을 활용하여 쉽게 구현할 수 있는 AI서비스 다섯가지를 소개한다. 학습모델이 이미 만들어져 있으니 로직만 구성하면 서비스가 완성되는것이다. 사용할 학습모델은 다음과 같다.
-손글씨인식, 이미지 배경제거, 뉴스기사 탐색 챗봇, 영상자막 생성, 스케치 투 이미지

​준비된 모델을 이용하여 개발될 프로젝트는 3단계로 진행된다
1.사전학습모델 탐색 및 선정하기 - 모델저장소에서 적절한 모델을 선정한다
2.모델 테스트 및 실행하기 - 선정된 모델을 테스트 해본다
3.AI 서비스 구현 및 결과 확인하기 - 준비한 유스케이스를 바탕으로 서비스에 필요한 기능을 구현해본다

목차는 앞에서 이야기한 다섯가지 모델을 사용한 AI서비스 구현을 차례대로 소개한다. 따라서 책은 다섯개의 챕터로 구성되어 있다. 각각의 챕터는, 모델을 어떻게 선정하는지 테스트는 어떻게 하는지 그리고 AI 서비스를 위한 애플리케이션 개발은 어떻게 하는지를 소제목으로 정해 프로젝트를 진행한다. 각 챕터의 순서는 비슷하게 진행된다. 처음 하나를 성공하고 나면 나머지는 익숙한 플로우대로 진행되므로 그다지 낯설지 않다.

​각 챕터는 아래와 같이 소규모 섹션으로 구성되어 있으며 다루어 지는 상세내용만 차이가 있다. 책의 구성이 심플하고 다음 장이 예상되는 내용이 기다리고 있어 차분한 마음으로 학습할 수 있다. 소규모 섹션은 아래와 같이 타이틀이 붙어 있다.
1.​모델의 개념과 사례
2.알아야하는 기술키워드
3.서비스 기획하기
4.모델 선정하기
5.모델 실행하기
6.애플리케이션 구현하기

자~ 이제 책이 설명하는 내용을 하나씩 따라가보자

괴발개발 손글씨도 읽어내는 OCR 서비스
책에서 첫 번째로 다루는 AI서비스는 "광학문자인식기술 OCR optical chracter recognition"이다. 우선, 개념설명을 하고, 이 기술이 시장성에서 어떻게 활용되는지 사례를 소개한다. 핵심 기술을 살펴보고, 서비스를 위한 애플리케이션을 구현해보는 순서로 진행된다. 애플리케이션 구현에는 시나리오를 작성한다. 조건을 정하고, 조건을 충족하는 모델을 탐색/선정하고, 테스트 후 애플리케이션에 적용한다.

책은 다음과 같은 구성을 따른다
- 개념을 살펴본다
- 사례를 소개하고 설명한다
- 기술 키워드는 무엇이 있는지 간단히 설명이 이어진다
- 서비스 기획하기를 통해 프로젝트의 방향을 살펴본다 유스케이스를 이용해 디자인해본다. 서비스에 관한 상세한 기능을 정의하고, 개발자와 디자이너간의 커뮤니케이션 방식을 배워본다
- 모델선정하기에서는 모델들의저장소인 허깅페이스를 소개한다. 여기에서 적절한 AI 모델을 어떻게 찾을 수 있는지, 어떤 어떤 동작을 하는지,어떤 인터페이스를 통해 어떻게 결과물을 얻을 수 있는지에 관해 설명이 이어진다.
- 모델실행하기에서 선정된 모델을 실습 해본다. 저자가 준비한 코드로 실습해본다.
- 애플리케이션 구현하기에서는 저자가 준비한 소스코드를 이용하여 앞에서 디자인한 기능들을 구현해본다.

 

 


1장 '괴발새발 손글씨도읽어내는 OCR서비스'을 살펴보면서 든 소감은, 인공지능 서비스를 설계하기 위해 알아야 하는 기본지식을 간단히 설명해주어 독자의 이론적 지식을 충족시켜주었으며, 기존의 구현된 사례를 들어 이해를 쉽게 돕고 있었다. 또한 저자가 미리 준비해둔 실습코드를 제공해주고 있어 그저 따라하기만 해도 하나의 서비스가 완성되는것을 체험해볼 수 있었다. 소스코드에 관한 핵심 설명이 따라오기 때문에 코드를 분석해야하는 수고도 덜어주고 있었다. 매우 어려운 분야이지만 따라서 하는 실습은 그다지 어렵지 않아서, 간단하게 하나의 서비스를 구현해볼 수 있는 기회를 가질 수 있었다. 책의 분량은 얼마 되지 않아 보이지만 생각보다 많은 내용을 다루고 있어어 보다 깊은 이해를 원한다면 책에서 소개하는 웹페이지와 관련용어, 소스코드를 다시 한번 살펴보면 될 것 같다.

추가로 이어지는 4개의 챕터 역시 비슷한 순서로 책이 구성되어 있어 익숙하게 학습을 진행할 수 있다. 2장 사진속 알맹이만 쏙쏙, 배경을 제거해주는 이미지 세그멘테이션 서비스, 3장 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스, 4장 영상 속 대화를 글로 변환해주는 음성인식 서비스, 5장 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스가 기다리고 있다. 이 모든것을 한번씩 해본다면 저자가 원하는것 처럼 실제로 작동하는 AI서비스를 구현해보며 재미와 흥미를 느끼고, 더 나아가 창의력의 자극하고 AI를 활용해 아이디어를 구현해 볼 수 있을것 같다.

 

 

GitHub을 통해 실습 자료는 Download...

 

1. 대상 독자는?

   "AI 이론을 학습한 후에 다음 단계로 무엇을 해야 할지 고민하는 분들을 위해...",  실제 AI 서비스를 어떻게 구현하고 활용할 수 있는 지를 안내하는 안내서입니다.

 

2. 구성.

한눈에 이 책의 구성과 전체 학습 내용이 정리

 

"현직 개발자가 다양한 예제로 알려 주는 쉽고 빠른 나만의 AI 서비스 개발 가이드"

 Chapter 1.  괴발개발 손글씨를 읽어 내는 'OCR 서비스'

 Chapter 2. 배경을 제거해 주는 '이미지 세그먼테이션 서비스'

 Chapter 3. 이슈를 모아서 정리해 주는 챗봇 기반 '자연어 처리 서비스'

 Chapter 4. 자동으로 자막을 생성해 주는 '음성 인식 서비스'

 Chapter 5. 간단한 스케치를 고품질 이미지로 만들어 주는 '이미지 생성 서비스'

그리고 마지막으로 가장 중요한 점은 사전 학습 모델로 빠르게 구현하는 실전 프로젝트 가이드라는 점입니다.

모든 Chapter의 서비스 구현 방법(식)은 동일한 구성으로 이루어져 있습니다.

​    첫째.  구현하려는 서비스의 개념 이해 와 키워드.

    둘째.  유스 케이스 작성. [ 유스 케이스 작성, 구체화 ]

    셋째.  모델 선정.

              모델의 특성과 모델을 선정 이유도 친절하게 설명을 해 주고 있다.

              기존의 다른 책에 비해 상당히 친절한 부분이다. 

              개인적으로 이런 부분이 너무 좋았습니다.

    넷째.  실습환경 (구글 코렙)을 통해 선정된 모델을 검증

               특히, 이 부분 선정된 모델을 검증하는 과정을 담고 있어서 

               사실 놀랐습니다. 개발자라면 느끼는 모델에 대한 유스 케이스의 검증. ^^

    다섯째. 애플리케이션 구현 - gradio(웹 기반의 GUI)로 UI 구현​​

3.  AI 서비스 결과물. 이런 서비스를 만들 수 있습니다. 


4.  결론

그동안 관심만으로 이런저런 책들을 보고 지식을 익혔지만 실제 구현은 어려웠습니다. 하지만

실제 AI 서비스의 전체 Project를 기획, 모델 선정 그리고 구현까지 해 볼 수 있다는 것이 이 책의 매력이라고 생각 듭니다.  그리고 좀 더 많은 것을 할 수 있을 것 같다는 자신감도..~~ ^^

 

“한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

 

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

 

서비스 관점에서 AI를 만드는 것은 얼마 전까지만 해도 개인에게는 진입장벽이 있는 꽤 어려운 일이었습니다.

 

그러나 Open AI, Anthropic, Google, Meta와 같은 빅테크 기업들이 힘을 모아 빠른 혁신을 이룬 덕에 몇 년 안에 약간의 개발 지식만 알아도 개인이 개발할 수 있는 시대가 왔고, 이 책은 지금과 같은 시점에 읽기에 무척 유익한 도서라고 생각합니다.

 

앞으로 AI는 더 가파르게 발전해서, 우리 삶에 침투할 것이고 이 과정에서 무수히 많은 서비스와 제품들이 탄생할 것입니다.

 

이 책을 읽는 분이 AI 서비스, 제품, 스타트업을 고민하고 있다면 빠른 프로토 타이핑 제작 과정에 포커싱을 맞춰 읽으면 도움이 될 것이라 생각합니다.


안녕하세요!

오늘은 여러분께 AI 서비스 개발에 관심 있는 분들이라면 꼭 한 번 읽어봐야 할 책, <쓸모 있는 AI 서비스 만들기>를 소개해드리려고 해요.

AI 기술이 점점 우리 일상 속으로 깊이 들어오고 있는 요즘, "어떻게 하면 나만의 AI 서비스를 만들 수 있을까?"라는 고민을 해본 적이 있으신가요?

이 책이 바로 그 해답을 제시해줄 거예요.


AI 서비스, 나도 만들 수 있을까?

처음 이 책을 접했을 때, AI 서비스 개발이라는 주제가 다소 어렵게 느껴질 수도 있다고 생각했어요. 하지만 <쓸모 있는 AI 서비스 만들기>는 그런 걱정을 완전히 덜어주는 책이에요.

이 책은 AI 서비스를 처음 접하는 사람들도 쉽게 따라 할 수 있도록 아주 친절하게 설명해줍니다. 초보자도 이해할 수 있는 쉬운 언어로, 하지만 깊이 있는 내용을 다루고 있어서 읽으면서 많은 도움이 되었어요.

실습으로 배우는 AI 서비스 개발의 A to Z

이 책의 가장 큰 장점은 바로 실습 중심의 구성이라는 점이에요. 그냥 이론만 나열하는 책과는 달리, 손글씨 인식 서비스, 이미지 세그멘테이션, 자연어 처리 기반의 챗봇, 음성 인식 서비스 등, 총 5가지 AI 서비스를 직접 구현해보는 과정이 담겨있어요.

각각의 서비스는 AI 기술을 활용해 실제로 유용하게 쓸 수 있는 기능들을 중심으로 구성되어 있어서, 단순히 기술을 배우는 것을 넘어 실질적으로 쓸모 있는 서비스를 만들어볼 수 있어요.


예를 들어, 책에서 소개하는 TrOCR 모델을 활용한 손글씨 인식 서비스는, 손글씨를 이미지에서 추출해내는 방법을 하나하나 자세히 설명해줘요.

허깅페이스에서 모델을 탐색하고, 선택한 모델을 실습 환경에서 실행하며, 최종적으로는 완전한 애플리케이션을 구현하는 과정까지 모두 안내해주니까, AI 모델이 실제로 어떻게 동작하는지, 또 어떻게 활용할 수 있는지를 명확하게 이해할 수 있었어요.


체계적인 개발 가이드와 풍부한 자료

<쓸모 있는 AI 서비스 만들기>는 AI 서비스를 구현하는 과정에서 필요한 모든 단계를 체계적으로 안내해줘요. 책에서는 각 서비스 구현을 위해 필요한 사전 학습 모델을 탐색하고 선정하는 방법부터, 실습 환경 설정, 모델 실행, 최종 애플리케이션 구현까지 세세하게 다루고 있답니다.

이 과정을 따라가다 보면 AI 서비스 개발 사이클에 대한 깊이 있는 이해가 자연스럽게 생기게 돼요.

또한, 저자가 직접 준비한 깃허브 자료를 통해 실습을 더 풍부하게 할 수 있다는 점도 큰 장점이에요. 실습을 하면서 막히는 부분이 있으면 언제든지 참고할 수 있는 자료가 있으니, 혼자서도 충분히 학습을 이어갈 수 있어요.

저자와 직접 소통할 수 있는 기회도 제공되니, 모르는 부분을 질문하며 배울 수 있는 점도 매우 유익합니다.


초보자도, 전문가도 모두에게 추천하는 책

이 책은 AI 서비스 개발을 처음 시작하는 초보자에게는 물론, 이미 AI 기술에 익숙한 개발자들에게도 유용해요.

특히 AI/머신러닝 분야로 취업을 준비하는 분들이나, AI 기술을 실무에 적용해보고 싶은 주니어 개발자들에게 큰 도움이 될 거라고 확신해요. 책을 다 읽고 나면, 여러분도 자신만의 AI 서비스를 만들어볼 수 있는 자신감을 얻게 될 거예요.


마무리하며

AI 기술은 점점 더 우리 삶의 많은 부분에 영향을 미치고 있습니다. <쓸모 있는 AI 서비스 만들기>는 이러한 변화를 주도할 수 있는 첫걸음을 내딛게 해줄 완벽한 가이드입니다.

어려워 보이는 AI 서비스 개발, 이제 이 책과 함께라면 더 이상 멀게만 느껴지지 않을 거예요. 초보자도 쉽게 따라 할 수 있는 실습과 깊이 있는 설명이 조화롭게 어우러진 이 책을 통해, 여러분도 AI 서비스 개발의 세계로 한 발짝 더 나아가 보세요!

이 책을 통해 AI 서비스 개발의 기초부터 제작/실행까지 단계별로 학습하며 실습해볼 수 있었습니다. 기획부터 완성까지 해본다는 것이 큰 경험이기 때문에 그것이 가장 좋았었습니다.

AI 서비스에 대한 이해와 실무 능력을 동시에 갖추고 싶은 독자라면, AI 그거 한번 만들어보고싶은데? 하는 분이라면 이 책은 꼭 읽어보고 한번 따라해보길 권하고 싶습니다.

이 책은 AI 서비스 구축 방법을 체계적으로 정리하여 제공합니다.

  • 각 챕터별로 상세한 AI 서비스 구축 과정을 설명합니다.
  • OCR 서비스 구축 방법이 미리보기로 제공되어 책의 내용을 사전에 파악할 수 있습니다.
  • AI를 직접 사용하지 않더라도, 구축 과정에 대한 이해는 매우 유용합니다.
  • 책에서 다루는 내용은 Computer Science와 Engineering 분야의 핵심 지식입니다.
  • 컴퓨터 관련 업무 종사자에게 필수적인 읽을거리로 강력히 추천합니다.
  • 이 책은 AI 서비스에 대한 포괄적인 이해와 실제 구현 능력을 향상시키는 데 큰 도움이 될 것입니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

이 책은 실용적인 AI 서비스 개발에 관심 있는 독자들에게 큰 도움이 될 것입니다.
모델활용을 위한 서비스 구현에 촛점이 있기에 이론적인 설명이 약간 아쉽고, Colab의 Gradio를 활용한 예시에 실제 서비스를 런칭하기에는 부족함이 있지만 직접 만들어보는 즐거움을 느끼고, 이를 통해 이론적인 부분과 부가적인 기능들을 구현해본다면,
더욱 멋진 서비스로 발전시킬 수 있는 기반을 마련할 수 있을 것입니다.

한빛미디어  서평단  <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다.

 

노코드, 로우코드 개발 도구들이 발전하면서, 인공지능 기술의 원리나 관련 코드를 구현하는 방법을 잘 몰라도 AI 서비스를 만들기가 정말 쉬워졌습니다. 게다가 사전 학습된 모델의 성능이 매우 뛰어나기 때문에, 간단한 코드를 이해하고 구현할 실력만 있다면 복잡한 작업을 거치지 않고도 나만의 AI를 뚝딱 만들수가 있게 되었죠.

 

이 책은 실용적인 관점에서, 이미 잘 만들어진 우수한 성능의 AI 모델이나 서비스를 활용하여 나만의 AI를 만드는 다양한 방법을 소개합니다. 다수의 사례를 통해 이미 잘 구축된 사전 학습 모델의 기능을 응용하는 방법을 구체적으로 설명합니다. 약간의 구현 능력이 요구되기는 하지만, 전체적으로 직접 AI 모델을 구현한다기보다는, 배포된 모델을 불러오고 모델의 작업을 지시하는 것이 주요 내용이기 때문에 초보자도 쉽게 따라오며 나만의 AI 서비스를 구현할 수 있습니다.

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공 받아 작성된 서평입니다."

비개발자도 이해하기 쉽게 기초 개념부터 자세히 설명하고, 설명된 개념들을 기반으로 유용한 어플리케이션을 만들수 있도록 도와줍니다.

https://developer-as-job.tistory.com/44

5가지 AI 서비스에 대해서 설명하고, 예제를 알려주는 책 입니다.

이 책에서 소개하고 있는 5가지 서비스는 다음과 같습니다.

  1. 손글씨 읽어 내는 OCR 서비스
  2. 사진만 뽑아내는 이미지 세그먼테이션 서비스
  3. 챗봇 기반 자연어 처리 서비스
  4. 영상 속 대화를 글로 변환해주는 음성 인식 서비스
  5. 스케치를 이미지로 만들어 주는 이미지 생성 서비스

 

특히, 흥미로웠던 서비스는 이미지 생성 서비스 입니다.

Stable Diffusion 모델을 이용해서 사진 기반으로 디즈니 스타일로 그림을 새로 그려주는 예제가 있는데, 굉장히 잘 그려줘서 놀랐습니다.

 

이 책에서 설명하고 있는 5가지 서비스 모두 굉장히 흥미로운 AI 서비스이며, 이를 잘 설명해주고 예제도 괜찮아서 AI서비스를 개발하고자 하는 분들이라면 한 번 쯤 읽어 볼 만 한 책입니다.

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다"

안녕하세요.

이번에는 " 쓸모 있는 AI 서비스 만들기 "에 대해 리뷰해보려고 합니다.

도서명 : 쓸모 있는 AI 서비스 만들기 사전 학습 모델로 빠르게 구현하는 실전 AI 프로젝트 가이드

저자: 김경환

출판사: 한빛미디어

챕터:

chapter 1 괴발개발 손글씨도 읽어 내는 OCR 서비스

chapter 2 사진 속 알맹이만 쏙쏙, 배경을 제거해 주는 이미지 세그멘테이션 서비스

chapter 3 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스

chapter 4 영상 속 대화를 글로 변환해 주는 음성 인식 서비스

chapter 5 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스

 

책 초반에는 학습 로드맵이 나옵니다.

어떤 과정을 배울 수 있는지 그리고 자신이 배우고 싶은 부분들이 있는 챕터를 알 수 있기 때문에

OCR 기술 쪽이 궁금해서 도서를 구매하신 분은 챕터 1로 이동하면 됩니다.

글로만 빼곡하게 있는 게 아니라 손그림 등 이미지가 삽입되어 있어서 이해하기 쉬웠습니다!

챕터1은 OCR에 관한 내용이라서 OCR이 무엇인지에 대해서 자세히 설명해주고 있습니다.

 

해당 과정을 밟아가기 위해서는 언어를 이해하는 것이 기초가 되는데

이 책에서는 개념이 요구되는 언어에 대해서 정의와 개념을 서술하고 있어서

이해하기 편하고 따로 정의를 찾아보지 않아서 좋았어요.

윗장에서는 유스케이스 다이어그램에 대해 정의를 알려주고 있고

예시가 좋은 비유로 설명되고 있네요!

AI라는 것을 이해하는 데 신경망과 엔트로피

손실함수 계산과 결과물 수정....같은 기본이론을 공부하는 것은 기본이겠지만

또 실제로 만들어보는 것만한게 없는 것 같습니다.

특히 이론적으로 이해가 잘 안되던 부분이 실제로 만들어보고 다시 이론을 봤을 때

오히려 이해가 깊어지는 경우가 있습니다.

저는 실무에서 딥러닝을 주로 이미지 Classification,Detection 두가지로 활용했는데요 이 것의 이론을 이해한다고 여러책을 읽고 또 많이 고민한 적이 있습니다.

그리고 실무에 적용하고 나서 이론 책을 읽었을 때 또 더 와닿는 경험이 있어

이 책을 AI에 처음 접근해보려는 분에게 추천드립니다.

특히 저 처럼 이미지에 국한된 일부 기능만을 사용해본 분에게

LLM의 언어처리,이미지 생성,음성의 자막처리 같은 재미난 분야를

(당장 실무에 쓰일 일이 없다하더라도)

아주 쉽게 접근하게 해주는 게 매력적인 책입니다.

책은 크게 5개 프로젝트로 되어 있는데요

OCR,이미지 세그멘테이션,자연어처리,음성인식,이미지생성

이 큰 다섯개 줄기입니다. 각각의 단어가 익숙치 않아도 책을 읽고나면 전부 이해가 될 것입니다. 광범휘하다는 것을 진입장벽으로 보지 마시고

전체를 더 쉽게 알 수 있는 방법으로 봐보세요

chapter 1 괴발개발 손글씨도 읽어 내는 OCR 서비스

1. 1 OCR 개념과 사례

- 개념 이해

- 활용 사례

1. 2 알아야 하는 기술 키워드

- 인코더-디코더

- 토크나이저

1. 3 서비스 기획하기

- 유스케이스 작성하기

- 애플리케이션 구성 구체화하기

1. 4 모델 선정하기

- 사전 학습 모델의 장점

- 허깅페이스에서 모델 탐색하기

- 모델 선정하기 - TrOCR

- 모델 정보 얻기

- 모델 테스트하기 - 예제 이미지

- 모델 테스트하기 - 임의의 손글씨 이미지

- 모델 사용법 확인하기

1. 5 모델 실행하기

- 실습 환경 설정하기

- TrOCR 모델 실행하기

1. 6 애플리케이션 구현하기

- 환경 설정하기

- 시나리오 최종 확인하기

- 이미지 파일 업로드 UI 구현하기

- TrOCR 추론기 클래스 구현하기

- 추론 기능 구현하기

- 캔버스 UI 구현하기

각 다섯개 프로젝트는 위의 순서에 따르는 데요

실제 실무에서 하는 것처럼 모델 선정하고 시나리오 짜고

그리고 각 순서에 대한 자세한 설명도 있어서 정말 좋습니다.

이렇게 다이어 그램으로 할일을 먼저 정하는 것

많은 엔지니어들이 귀찮거나 잘안다고 해서 패스하는 부분

일하는 순서도 배울 수 있습니다.

그리고 나머지 프로젝트도 위와 같은 순으로 짜여져 있구요

나머지는 아래와 같습니다.

 

chapter 2 사진 속 알맹이만 쏙쏙, 배경을 제거해 주는 이미지 세그멘테이션 서비스

chapter 3 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스

chapter 4 영상 속 대화를 글로 변환해 주는 음성 인식 서비스

chapter 5 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스

AI관련서적을 올해 좀 집중적으로 읽게되었는 데요

최근에 읽은 책중에 제일 마음에 드는 편

선정된 5개 프로젝트가 굉장히 유용한 과제이기 때문에

공부하는 학생은 물론 이제 실무를 시작하려는 분에게도 추천드립니다.

그리고 혹시 코딩에 대한 걱정이 있으신 분은 걱정하실 필요가 없습니다.

오히려 코딩은 간단한 편이고 라인이 많지 않습니다.

이론에 대한 이해와 블락별로 구성

사용되는 외부 리소스들에 대한 이해가 더 중요합니다.

회사에 방화벽을 넘지 못해 저는 퇴근하고 하나하나 구현해봤는데요

퇴근하고 해보기 쉽지 않은데 하나씩 하나씩 하다보면 정말 보는 시야가 넓어지고 재미납니다. 유용한 사이트 정보랑 데이터셋을 어디서 구할 수 있는지도 나와있으니 초보자라면 강력 추천하는 바입니다.

?? AI 서비스 개발?
쓸모 있는 AI 서비스 만들기
요즘 같은 AI 붐 속에서
‘나만의 AI 서비스’를 만들어보고 싶은데,
어디서부터 시작해야 할지 막막하신가요?

특히 초보 개발자라면
더더욱 그렇죠. ??

이 책 한 권이면 충분해요!
?? 이런 분들을 위해 딱 맞는 책이 나왔어요!
바로 ‘쓸모 있는 AI 서비스 만들기’라는 책인데요,

이론부터 실습까지 차근차근 안내해줘서
누구나 쉽게 따라 할 수 있답니다.

?? AI 서비스, 이렇게 시작해요!
순서 헷갈리지 말자!

AI 서비스 개발을 시작할 때
중요한 건 순서예요.

이 책은 크게 3단계로 나뉘어져 있는데,
먼저 사전 학습 모델을 찾아보고,
그 모델을 어떻게 사용하는지 익힌 다음,
마지막으로 실제 서비스 구현에 들어가요.

이렇게 단계별로 진행하니까
“아! 이렇게 하는 거구나!” 하고
자연스럽게 익힐 수 있어요. ㅋㅋㅋ

?? AI 트렌드? 여기서 다 알려줘요!
AI 서비스에 대한 트렌드와 전망
《쓸모 있는 AI 서비스 만들기》
이 책의 또 다른 매력 포인트는
AI 서비스에 대한 트렌드와 전망까지
알 수 있다는 거예요.

요즘 인기 있는 서비스나 기술이 뭔지,
어떤 서비스가 시장성이 높은지
파악하는 데 도움이 된답니다. 

예를 들어,
OCR 서비스로 손글씨를 읽어내거나
이미지 세그멘테이션으로 사진에서 배경을 제거하는 기능도 실제로 구현해볼 수 있어요.

이런 트렌드 정보까지 얻을 수 있으니,
AI에 대한 통찰력도 키울 수 있겠죠?

?? 따라 하기 쉬운 실습!
그림과 예제로 이해 쏙쏙~

초보자도 쉽게 따라 할 수 있도록
책에 다양한 그림과 예제가 포함되어 있어요.

유스케이스 다이어그램으로
서비스 기획부터 구현까지 한눈에 볼 수 있고,
깃허브 예제를 통해 실제로 코드를 실행해보면서 더 깊이 있는 학습이 가능해요.

?? 이 책이 필요한 사람은?
《쓸모 있는 AI 서비스 만들기》
이 책은 AI/머신러닝 분야 취업 준비생,
주니어 개발자, AI 서비스에 관심 있는 분이라면 누구나 읽어보면 좋아요.

특히 AI 이론은 어느 정도 배웠지만
실제 구현 경험이 부족한 분들에게는
정말 강력 추천이라는 거! ??
 

1. 간결함

군더더기 없이 필요한 말만 해서 가볍고 좋다. 이런 류의 책들 대부분 파이썬 기초부터 시작해서 여러 내용을 다룬다. 그러면 절반 정도는 필요 없는 내용이라 책을 사기가 꺼려지는 것과 대조적이다.

여기서부터는 개인적인 의견. 프로그래밍 공부는 직접 해보는 게 제일 좋은 공부법이다. 하나씩 차근차근 공부하는 것도 뭐 나쁘지는 않겠지만, 효율적인 공부법은 아니다. 특히 프로그래밍에서는. 다룰 내용이 많으면 본격적인 기술을 다루기도 전에 흥미를 잃거나 지친다. 이런 방법은 탑다운 방식이라하면, 반대는 바텀업 방식이다.

2. 실전 위주의 구성

자세하게는 몰라도 뭐라도 직접 해보면 은근히 재밌다. 하다보면 익숙해지고, 더 깊게 이해하거나 더 많은 것들을 알아보고 싶게 된다. 그렇게 자연스럽게 영역을 넗혀간다. 나는 최소한의 지식을 갖춘 후 바텀업 방식으로 진행하는 걸 선호한다. 이런 관점에서 보면 일단 직접 해보도록 권하는 흐름이 큰 매력이라고 할 수 있다.

[북리뷰-IT] 쓸모 있는 AI 서비스 만들기 (한빛미디어, 2024)

최근 생성형 AI의 급부상으로 누구나 쉽게 AI 서비스를 개발하고 싶어하지만,

실제로 어떻게 시작해야 할지 막막한 경우가 많습니다.

하지만 이번에 한빛미디어에서 출간한 "쓸모 있는 AI 서비스 만들기"를 읽고 나니,

마치 어렵게만 느껴졌던 AI 개발이라는 세계에 발을 내딛는 듯한 설렘과 함께 자신감이 생겼습니다. ^^

 

이 책은 단순히 이론만 나열하는 것이 아니라,

실제 서비스 구현 과정을 상세하게 안내하며 독자의 손을 잡고 함께 걸어가는 든든한 길잡이와 같았거든요~ ㅎ

 

 

● 쉽고 빠르게 나만의 AI 서비스를 만들 수 있어, AI 개발의 문턱을 낮춘다

이 책의 가장 큰 장점은 실용성입니다.

막연하게 AI 서비스를 만들고 싶어 하는 초보 개발자들에게 꼭 필요한 정보들을 압축적으로 담고 있습니다.

특히 각 장마다 하나의 서비스를 완성하는 방식으로 구성되어 있어,

독자들이 직접 코드를 작성하며 학습할 수 있도록 유도합니다.

또한, 다양한 사전 학습 모델을 활용하여 복잡한 알고리즘 구현 없이도 훌륭한 서비스를 만들 수 있다 것을 보여줍니다. 이는 AI 개발에 대한 진입 장벽을 낮추고, 독자들이 자신의 아이디어에 집중할 수 있도록 돕는 중요한 요소입니다.

 

위의 5개의 AI 서비스를 구현하는 과정은, 모두 같은 개발 로드맵을 따릅니다.

  1. 해당 기술 분야의 개념과 활용사례
  2. 해당 AI 서비스를 구현하기 위해, 꼭 알아야 할 기술 키워드
  3. 유스케이스 다이어그램을 통해 서비스를 기획하고, 애플리케이션 구성을 구체화하기
  4. 사전 학습 모델 선정하기
  5. 실습환경 만들고, 모델 실행하기
  6. 시나리오 최종확인 후, 애플리케이션 구현하기

 

 

● 체계적인 구성과 명확한 설명

이 책은 크게 세 가지 부분으로 구성되어 있습니다.

먼저, 각 서비스의 개념과 활용 사례를 간략하게 설명하여 독자의 이해를 돕습니다.

다음으로, 필요한 기술 키워드를 정리하여 학습 방향을 제시합니다.

마지막으로, 실제 서비스 구현 과정을 상세하게 설명하며, 코드와 함께 결과물을 보여줍니다.

특히, 유스케이스 다이어그램을 통해 서비스 기획 과정을 시각적으로 보여주는 부분은 매우 인상적이었습니다.

이를 통해 독자들은 서비스를 개발하기 전에 어떤 기능을 구현해야 하는지 명확하게 파악할 수 있습니다.

 

 

● 나에게 꼭 필요했던 책

저는 평소 디자인과 프로그래밍에 관심이 많아 이미지 생성 모델에 대한 호기심이 컸습니다. 

특히, 간단한 스케치를 정교한 이미지로 변환하는 기술은 마치 마법 같다고 생각했습니다. 

이 책을 통해 그동안 궁금했던 부분들을 해소하고, 

스케치 투 이미지 서비스 개발에 대한 이해를 깊이 할 수 있었습니다.

 

특히 5장, 이미지 생성 서비스 부분은 제게 가장 큰 매력으로 다가왔습니다. 

스테이블 디퓨전과 같은 강력한 모델을 활용하여 

단순한 스케치를 고품질 이미지로 변환하는 과정을 상세하게 설명해주고 있습니다. 

이론적인 배경뿐만 아니라, 실제 코드와 함께 결과물을 보여주어 직접 따라하며 학습할 수 있다는 점이 매우 좋았습니다.

 

단순히 이미지 생성 모델을 사용하는 방법뿐만 아니라, 

다양한 파라미터를 조절하여 원하는 이미지를 만들어내는 방법도 알려주어, 

창의적인 아이디어를 구현하는 데 큰 도움이 되었습니다.

 

이 책을 통해 스케치 투 이미지 서비스 개발에 대한 기본적인 지식을 쌓았으며, 

앞으로 더욱 심화된 학습을 통해 나만의 독창적인 이미지 생성 서비스를 만들어보고 싶네요. ^^

 

아래는 대충 스케치 해보고, Disney Pixar Cartoon Type A 모델을 적용해서 만들어본 이미지 입니다. ㅋ

 

 

● 다른 책과의 차별점

시중에는 파이썬을 이용한 AI 개발 책들이 많지만,

이 책은 실제 서비스 구현에 초점을 맞추고 있다는 점에서 차별화됩니다.

또한, 최신 트렌드를 반영하여 다양한 사전 학습 모델을 소개하고, 실습 위주의 학습을 통해 독자들의 이해를 돕습니다.

 "쓸모 있는 AI 서비스 만들기"는 AI 개발에 입문하고 싶은 모든 이들에게 강력하게 추천하는 책입니다.

이 책을 통해 여러분도 나만의 AI 서비스를 만들고, AI 개발의 즐거움을 경험해 보시기 바랍니다. ^^

 

지금 바로 이 책을 통해 AI 개발의 첫걸음을 내딛어 보세요!!

 

 

  “한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

 

#북리뷰  #책서평  #도서추천  #책리뷰  #IT서적  #프로그래밍책  #AI학습  #개발자  #쓸모있는AI서비스만들기  #AI서비스개발  #파이썬AI  #머신러닝  #딥러닝  #AI튜토리얼  #AI책추천  #AI프로젝트  #데이터과학  #인공지능

 

출처: https://nunbu.tistory.com/425 [눈부셔™의 금융과 IT:티스토리]

"쓸모 있는 AI 서비스 만들기"의 부제는 "현직 개발자가 알려 주는 5가지 필수 AI 서비스"다

 

chapter 1 괴발개발 손글씨도 읽어 내는 OCR 서비스 
chapter 2 사진 속 알맹이만 쏙쏙, 배경을 제거해 주는 이미지 세그멘테이션 서비스 
chapter 3 이슈를 모아서 정리해 주는 챗봇 기반 자연어 처리 서비스 
chapter 4 영상 속 대화를 글로 변환해 주는 음성 인식 서비스 
chapter 5 간단한 스케치를 고품질 이미지로 만들어 주는 이미지 생성 서비스 

 

 

OCR, 이미지 인식, 음성 인식...

자주 사용되지만 정확히 어떤 구조와 방식으로 프로세스가 동작하는지는 막연히 밖에 모른다.

 

이미지 세그멘테이션 부분을 살펴보자.

세그멘테이션 마스크, 바운딩 박스와 같은 기본적 키워드를 친절한 그림과 더불어 설명해 준다.

 

 

 

처음에 둘러봤을 때 책의 스타일이 지금까지 접했던 일본 서적의 스타일이 느껴져서 당연히 저자도 일본인이겠거니 했는데, 한국사람이었다니. 필수적인 개념설명 이후에 단계별 설명을 도식화해서 알기쉽게 정말 잘 설명해준다.

 

 

 

이론만 설명하는 책도 아니다. 파이썬 코딩하는 방법(뒷부분 GPT 의 경우 API사용법까지 설명이 자세히 되어있다)이 있고, 코드별로 상세한 설명을 확인할 수 있다.  그렇다면 완전한 고급자를 타겟으로 한 책은 아니라는 생각이 든다.

 

 

 

파이썬 코드와 함꼐 최종 이미지에서 원하는 이미지만 추출해서 가져오는 결과물까지 설명을 하면서 챕터가 끝난다.

 

 

 

5가지에 대해 아주 기초적이지만 필수적인 부분을 꼭 담았다. 책이 320페이지로 두껍지 않다. 

요즘엔 생성형AI가 코드도 만들어주기 때문에, 사실 이 정도의 설명과 내용만으로도 실무에 적용하는데 지장이 없긴하다.

 

실제 작업하면서 발생할 수 있는 다양한 예외케이스 등의 실무경험이 녹아져있진 않다.

머신러닝 기본기를 다진 상태에서 이미지 인식이나 음성 인식을 가볍게 접하기에 최적의 도서임은 확실하다.

 

 “한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
쓸모 있는 AI 서비스 만들기
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
쓸모 있는 AI 서비스 만들기
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
쓸모 있는 AI 서비스 만들기
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1