메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

AI 딥 다이브

오차역전파부터 확산모델까지, 미래를 만드는 73가지 기술 이야기

한빛미디어

번역서

판매중

  • 저자 : 오카노하라 다이스케
  • 번역 : 정원창
  • 출간 : 2024-07-30
  • 페이지 : 320 쪽
  • ISBN : 9791169212717
  • eISBN : 9791169218429
  • 물류코드 :11271
  • 초급 초중급 중급 중고급 고급
4.8점 (21명)
좋아요 : 22

73가지 핵심 키워드로 정리하는 AI 기술의 모든 것

 

현재의 AI 연구 성과는 오랜 기간에 걸쳐 순차적, 연속적으로 발전해 온 산물입니다. 이 책은 딥러닝의 여명기부터 최근의 생성 AI에 이르기까지 주요 AI 기술의 흐름을 73개 주제로 나눠 설명하는 종합 해설서입니다. 특히 시간의 흐름에 따른 최신 AI 기술 트렌드를 포괄적이면서도 깊이 있게 통찰할 수 있습니다.

 

시류를 크게 타지 않으면서도 핵심을 꿰뚫는 주요 개념들만 모아 정리해 자연스럽게 미래에 대한 정확한 예측으로 연결할 수 있습니다. 현재 전 세계의 AI 기술이 어떻게 발전하고 있는지, 최첨단 기업과 연구자들이 AI 기술의 신비를 어떻게 풀고 활용하려 하는지 파악할 수 있는 책입니다. 기술 트렌드를 전체적으로 훑어보기를 원하는 분야 종사자, 현업 AI/ML 개발자에게 특히 유익합니다.
 

주요 내용

  • 지능과 딥러닝: AI 작동 원리, 머신러닝과 딥러닝, 인간의 두뇌와 학습
  • 학습 기법: 학습 엔진, 정규화, 강화학습, 고속화, 저전력화, 인프라
  • 모델과 아키텍처: 생성 모델, 기억과 신경망
  • 애플리케이션: 이미지, 음성, 공간생성 및 인식, 언어, 제어, 시뮬레이션, 게임, 생명과학, 로봇

 

오카노하라 다이스케 저자

오카노하라 다이스케

도쿄대학교 정보과학기술대학원 컴퓨터과학전공 박사 과정을 2010년 수료했다. 재학 중이던 2006년 친구들과 함께 PFI(Preferred Infrastructure)를 공동 창업했으며 2014년에는 프리퍼드 네트웍스(Preferred Networks)를 창업했다. 현재 프리퍼드 네트웍스의 대표이사 CER 및 PFCC(Preferred Computational Chemistry)의 대표이사 사장으로 재직 중이다.

정원창 역자

정원창

전자공학과 전산학을 공부하고 국내외의 크고 작은 하드웨어와 소프트웨어 회사에서 경험을 쌓았다. 현재는 자연어 처리에 중점을 둔 머신러닝 엔지니어로 일하고 있다. 옮긴 책으로 『인사이드 머신러닝 인터뷰』, 『개발자의 하루를 바꾸는 코파일럿 & 챗GPT』(이상 한빛미디어) 등이 있다.

 

[1부: 지능이란 무엇인가, 딥러닝이란 무엇인가]

 

1장: 인공지능의 원리 해명
_1.1 딥러닝 모델 학습이 잘 되는 이유
_1.2 매니폴드 가설: 현실 세계 데이터의 모델링 기법
_1.3 딥러닝이 일반화되는 이유
_1.4 독립 성분 분석: 정보 얽힘 풀기
_1.5 딥러닝 이론 해석, 신경망 미해결 문제 해명을 향한 진전
_1.6 과다 파라미터 표현 신경망과 복권 가설
_1.7 인과와 상관: 미지의 분포에 대한 일반화 가능성
_1.8 대칭성이 학습에 활용되는 방식
_1.9 머신러닝의 새로운 거듭제곱 법칙: 모델이 클수록 일반화 능력과 샘플 효율 향상
_1.10 강건한 모델의 과다 파라미터 표현 필요성

 

2장: 사람의 학습
_2.1 뇌의 오차 역전파 여부
_2.2 뇌의 학습 시스템

 

[2부: 학습 기법]

 

3장: 학습 기법
_3.1 학습의 엔진: 수리 최적화 Adagrad, RMSProp, Adam
_3.2 랜덤 푸리에 피처 함수: 규모가 큰 문제에도 커널 기법 적용 가능
_3.3 정규화: 일반화 능력 얻기
_3.4 오차 역전파 기법에 의한 기댓값 최대화
_3.5 오차 역전파를 사용하지 않는 학습 기법: Feedback Alignment, Synthetic Gradient, Target Prop
_3.6 연속 학습: 과거의 학습 결과를 잊지 않고 새로운 작업 학습
_3.7 예측 학습
_3.8 진화 전략
_3.9 메타 학습: 학습 방법을 학습하는 MAML과 뉴럴 프로세스
_3.10 음함수 미분: 경삿값 계산에서 계산 그래프를 워프
_3.11 비지도 표현 학습: 다른 뷰 간 상호 정보량 최대화
_3.12 지식 증류: 거대 모델의 지식 추출
_3.13 마스크 오토인코더: 이미지 인식에서 사전 학습 혁명의 가능성

 

4장: 강화 학습
_4.1 강화 학습: 피드백으로부터 최적 행동 획득
_4.2 월드 모델: 상상 속에서의 학습 가능성
_4.3 안전이 보장되는 강화 학습: 랴푸노프 함수로 제약을 만족시키는 폴리시 도출
_4.4 미래 예측에 기반한 플래닝, 학습화 시뮬레이터와 몬테카를로 트리 탐색
_4.5 오프라인 강화 학습: 데이터 주도형 학습

 

5장: 고속화, 저전력화, 인프라
_5.1 심층 신경망 학습의 고속화 가능성
_5.2 모바일향 신경망: 추론 시 전력 효율 향상 3가지 방안
_5.3 AI 연구의 뼈아픈 교훈
_5.4 MN-3/MN-Core: 세계 최고의 저소비전력 슈퍼컴퓨터

 

[3부: 모델과 아키텍처]

 

6장: 생성 모델
_6.1 적대적 생성 신경망: 신경망을 경합시켜 생성 모델 단련
_6.2 VW: 재귀 확률적 신경망에 의한 생성과 인식 수행
_6.3 Glow: 가역적 생성 모델, GAN보다 안정적으로 학습 가능한 가능도 기반 기법
_6.4 셀프 어텐션 메커니즘: 이미지 생성, 기계 번역 등 많은 문제에서 최고 정확도 달성
_6.5 연속 다이내믹스 표현 가능 신경망
_6.6 정규화 계층: 신경망 학습의 안정화, 고속화, 일반화
_6.7 에너지 기반 모델: 노이즈 복원을 통한 생성 모델 학습
_6.8 트랜스포머: 모든 작업의 표준 네트워크 아키텍처가 될 가능성
_6.9 이산화 생성 모델
_6.10 Perceiver: 다양한 입출력에 대응 가능한 신경망

 

7장: 기억의 얼개
_7.1 Fast Weight: 어텐션으로 단기 기억 실현
_7.2 미분 가능 신경 컴퓨터: 외부 기억을 갖춘 신경망

 

[4부: 애플리케이션]

 

8장: 이미지
_8.1 이미지 인식에서 높은 성과를 올린 CNN: 분류 오류가 매년 절반 가까이 감소
_8.2 GLOM:파싱 트리에 의한 이미지 인식의 실현 가능성

 

9장: 음성
_9.1 웨이브넷: 자연스러운 음성 및 음악 생성을 위한 신경망

 

10장: 공간생성/인식
_10.1 Generative Query Network: 이미지로부터 3차원 구조를 이해하여 생성
_10.2 자기 지도 학습에 의한 깊이와 자기 이동 추정
_10.3 3차원 형상 표현 기법
_10.4 이미지로부터 3차원 장면 이해: 국소 피처량 기반 이미지 매칭
_10.5 사람이나 동물의 공간 이해 메커니즘의 AI 활용 가능성
_10.6 Rotation Averaging: 빠르고 최적인 자세 추정 실현
_10.7 DROID-SLAM: 순차적 수정으로 환경에 대응
_10.8 NDF: 적은 지도 학습 데이터로 학습 가능한 물체나 3차원 환경의 동변 표현

 

11장: 언어
_11.1 seq2seq:텍스트에서 텍스트를 생성하는 신경망
_11.2 언어의 창발: 기계 간 커뮤니케이션 가능성
_11.3 자유로운 말로 로봇에게 지시
_11.4 BERT: 언어 이해의 사전 학습

 

12장: 제어
_12.1 확률적 제어: 부정확한 제어가 돕는 학습
_12.2 온라인 학습과 최적 제어, 미지의 노이즈에도 강건한 제어 기법

 

13장: 시뮬레이션
_13.1 AI에 의한 시뮬레이션의 진화
_13.2 시뮬레이션 기반 추론: 관측으로부터 귀납적 파라미터 추정
_13.3 딥러닝을 사용하는 물리 시뮬레이션 고속화
_13.4 매틀란티스: AI를 사용한 범용 원자 레벨 시뮬레이터

 

14장: 게임
_14.1 알파고: CNN과 강화 학습을 조합한 컴퓨터 바둑
_14.2 알파고 제로: 제로 베이스에서 학습하여 인간을 초월
_14.3 알파스타: 다양성이 있는 학습 환경에서 고도의 스킬 획득

 

15장: 바이오 생명 과학
_15.1 알파폴드: 50년간의 생명 과학 그랜드 챌린지 해결

 

16장: 로봇
_16.1 전자동 정리 로봇 시스템 개발. 고정밀도 객체 인식 기반 정리
_16.2 도메인 무작위화

 

참고 문헌 
찾아보기

과거와 현재의 AI 좌표를 확인하고 미래로 향하는 길 전망하기

 

이 책은 2015년부터 일본 잡지 <닛케이 로보틱스>에 연재된 글을 모아 편집한 것으로, AI 분야의 최신 발전과 주요 연구 결과를 신속하고 깊이 있게 다룹니다. 저자는 최근 AI 기술 발전의 특징으로 속도, 무경계성, 창의성을 꼽았으며, 이러한 특징들이 책 전반에 걸쳐 잘 반영되어 있습니다.

 

내용은 1) 지능과 딥러닝의 본질, 2) 학습 기법, 3) 모델과 아키텍처, 4) 애플리케이션의 4개 부(Part)로 구성되어 있습니다. 각 부마다 상세 주제를 여러 장(chapter)에 나눠 다루는데, 딥러닝의 기본 원리부터 강화학습, 생성모델, 이미지, 음성, 언어 처리 등 다양한 응용 분야에 이르기까지 폭넓게 설명합니다.

 

AI와 딥러닝에 대한 기초적인 이해부터 최신 연구 동향까지 포괄적으로 다루는 책인 만큼, 초보자부터 전문가에 이르기까지 다양한 독자층에게 유용한 정보를 제공합니다. 특히 이론적 설명과 함께 실제 적용 사례를 풍부하게 포함하고 있어, 독자들이 AI 기술의 실질적인 활용 방법을 이해하는 데 도움을 줍니다.

 

이 책의 가치는 여러 업계 전문가들의 추천사를 통해 더 크게 드러납니다. AI 기술의 기초부터 심화 내용까지 체계적으로 다루고 있으므로, AI 시대를 준비하는 모든 이에게 필수적인 가이드가 될 것입니다. 또한, AI의 기본 개념을 이해한 독자들이 더 깊이 있는 연구를 진행하는 데 필요한 가교 역할을 할 것으로 기대됩니다.

 

추천사 중에서

“초보자가 AI 기술의 기본 개념을 습득할 수 있도록 돕는 책과 교재들은 이미 매우 많습니다. 연구자의 경우에는 특정 분야를 깊이 파고들어 연구하기 위해 책이 아닌 논문을 읽는데, 관련 논문 역시 너무나 많습니다. 하지만 이 둘 사이를 이어주는 가교 역할을 할 만한 좋은 자료는 많지 않습니다. 보통의 책과 교재는 기본 개념에만 충실한 경우가 많고, 논문들은 어디서부터 시작해야 할지 막막합니다. 이제 막 기본 개념을 이해한 분들에게는 너무나 막막한 대양과 같지요.

 

그러한 분들에게 바로 이 책을 추천합니다. AI 기본 개념들의 큰 맥락을 파악하고 싶은 분, 어떠한 주요 연구 주제들이 있는지 궁금하신 분, 각 연구 주제의 핵심을 파악하고 싶은 분에게 이 책은 좋은 길잡이 역할을 할 것입니다.”

_ 안성진, KAIST 전산학부 교수

 

“인공지능 기술은 개발 분야이든 연구 분야이든 상관없이 방대한 이론적 지식과 함께 실질적인 적용 능력을 요구합니다. 이 책은 이러한 전반적인 내용을 한 권에 모두 담아내, 독자들이 체계적이고 포괄적으로 학습할 수 있도록 구성한 만큼 매우 유용합니다.

 

인공지능을 처음 접하는 이부터 이미 아는 내용을 더욱 심화하고자 하는 전문가에 이르기까지, 이 책은 모두에게 큰 도움이 될 것입니다. 딥러닝과 인공지능의 잠재력을 이해하고 그 가능성을 실현하고자 하는 모든 분께 이 책을 적극 추천합니다. 이 책은 단순한 학습서를 넘어, 인공지능 시대를 준비하는 누구에게나 필수적인 동반자가 될 것입니다.”

_ 김태섭, 서울대학교 데이터사이언스대학원 교수

인공지능 입문자는 굳이 읽지 않아도 됩니다. 완독하고 나서 보니, 저자는 누구를 대상으로 삼아 이 책을 썼을까 궁금해졌습니다. 저자가 AI로 고심했던 흔적은 여기 저기에서 보입니다. 그 비슷한 주제로 고민을 하고 있는 사람에게는 도움이 될 내용이 꽤 있겠습니다. 굳이 저처럼 완독하지 않아도 되지 않을까 합니다. 차례를 보고 당장 흥미 있는 주제만 골라 읽은 후 책장에 꽂아두는 게 효율적이겠다 싶습니다. 막히는 게 있거나 AI 과제를 새로 시작할 때 다시 꺼내 한 번 훑어보기를 권합니다. 저자가 다룬 내용은 트랜스포머 Z쯤 되는 게 나와도 여전히 유용한 주제이기 때문입니다. 그러고 보니, 하던 것만 하느라 얘기거리가 적다 싶은 AI 업계종사자가 참고해도 쓸 만하지 않을까 합니다.

AI를 조금씩 알아가는 차에, AI 딥 다이브란 책을 볼 수 있었다.


여느 책과 다르게 논문을 바탕으로 한 심도있는 내용을 다루고 있으며 교수님들의 추천사도 들어있었다.


목차만 봐도 알찬 정보들이 들어있는 것을 확인할 수 있었다. 차근차근 의미를 찾으면서 봐야 했기에 나는 1장을 일단 읽고 리뷰를 작성하고 있다.

 

매니폴드와 가설과 관련한 내용이다. 하나의 예시로 한 이미지는 각도, 광원의 위치, 카메라의 위치에 의해 결정되며 이러한 파라미터를 매끄럽게 변화시키면 이미지도 매끄럽게 변화한다.

 

이렇게 데이터가 적은 파라미터에 의해 지배되고 그 파라미터를 변화시키면 데이터도 매끄럽게 변하는 성질을 띄는데 이것은 다른 많은 데이터에서도 볼 수 있다.

 

각 점의 주변이 n차원으로 확장된다고 볼 수 있는 공간을 매니폴드라고 한다고 한다. 국소적으로는 n차원 좌표계를 이용하여 표현할 수 있는, n차원 유클리드 공간과 위상동형으로 볼 수 있는 공간이라고 한다.

 

StyleGAN을 소개하며 이 모델은 생성 데이터를 구성 요소 별로 구분할 수 있으며 어느 요소를 변화시켜서 형태가 매끄럽게 바뀌도록 할 수 있는지 등의 분해가 가능하다고 한다.

 

이 책을 통해 이런 내용이 있다는 걸 확인했으니 차차 알아가면 될 것 같다.


독립 성분 분석(ICA)에 대한 소개와 사람의 음성 분리 사례가 소개되며 정보원이 정상인 경우와 비정상인 경우로 나누어 소개를 하고 있다.


복권 가설에 대한 내용은 큰 수의 법칙과 실제 유효한 신경망의 크기를 한정할 수 있다는 내용이었고, 대칭성이 학습에 활용되는 방식에선 각자 다른 순서로 연산한 함수의 값이 서로 같아질 수 있음을 보이며 이것이 곧 같은 이미지라도 각도를 변화시켜 입력을 받은 것을 동일하게 판단할 수 있는데 사용할 수 있음을 제안하고 있었다.


모델이 클수록 일반화 능력과 샘플 효율이 좋아진다는 것을 과거 OpenAI의 연구 사례 소개를 들었으며 강건한 모델의 과다 파라미터 표현 필요성 장에선 함수의 립시츠 성질을 이용하여 노이즈 과적합을 피하는 방법을 소개했다.

 

앞으로 남은 챕터2 사람의 학습, 3 학습 방법, 4 강화 학습 등의 장들도 유익하게 읽을 수 있을 것으로 생각됐다.

 

이 글은 한빛미디어로 부터 책을 증정받아 작성되었습니다.

"오차역전파부터 확산모델까지, 미래를 만드는 73가지 기술 이야기"

왜 저 문구를 그냥 넘겼을까. 말 그대로 '이야기'이다. 지금까지는 코드가 들어 있는 책들만, 코드가 없어도 실습 위주의 책들을 봐왔길래 코드 한 줄 없이 줄글만 있는 책을 읽는 게 쉽진 않다. ㅎㅎㅎ

이 책은 처음부터 끝까지 '이야기'다. 어딘가에 연재했던 내용들을 다듬어서 묶어놓은 것처럼 구성되어 있다. 그래도 기본 개념은 이해했고 연구를 시작해야 하는 사람들에게 가교 역할을 하는 책이라는 추천사를 보고 끝까지 읽어보기로 했다.

그런데 책을 읽으면서 '기본 개념'의 '기본'이 어느 정도인지 모르겠지만 머신러닝/딥러닝에 대해서 좀 심도있게 공부한 사람이 읽을 수 있는 책이라는 생각이 들었다. 한 가지 주제에 대해서 2~3 페이지 정도의 분량으로 설명하기 때문에 상당히 압축이 되어있다. 내용을 모르는 사람은 한 문단 한 문단 넘어갈 때마다 검색해봐야 할 내용이 많다. 다행인 것은 논문 출처를 달아 놓았다든지 하는 주석이 잘 되어 있어서 찾아보기가 그나마 수월했다. 읽다보면 반복되는 내용도 있어서 관심있는 꼭지를 골라서 읽어서 이해를 하고 다른 꼭지를 읽는 것도 방법이겠다. 뒷쪽으로 갈수록 생소한 주제들이 있어서 도움이 되었다. 여전히 ChatGPT를 비롯한 생성형 인공지능이 대세인데 거기에 대한 내용도 좀 있었으면 하는 아쉬움도 있었다.

사소한 것일 수도 있지만 나는 정규화와 규제를 구별하는데 이 책에는 규제(regularization)를 모두 정규화라고 번역을 해놓았다. normalization과 혼동할 수 있겠다. 여기에서는 정규화의 의미를 '일반화 성능을 개선하는 기법 전반'의 의미로 폭넓게 사용했다.
 

왠지 이번에는 책을 잘못 선택한 것 같다. 나와는 잘 맞지 않는다는 뜻이다.


한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

책을 처음 받고 아무페이지나 펼쳐보았을때 신뢰감이 들었다.

마치 신문이나 잡지 페이지 처럼 2단 구성으로 텍스트가 빽빽하게 작성되어

필자가 알고 있는 정보를 빠짐없이 독자에게 제공하고자 하는 것만 같았다.

고봉밥과도 같은 이런 구성의 이유를, 책의 첫부분 '지은이의 말'에서 확인할 수 있었는데,

필자가 매달 연재했던 글을 모아 편집해 만들어서 그렇다고 한다.

꾸준이 학습하고 그것을 다시 글로서 표현해 여러사람에게 전달하는 필자의 모습이 떠올라

다시 한번 믿음이 생겼다.

 

본인이 관심있는 주제에 대해서 백그라운드와 컨텍스트를 이해하는 데에는 더 없이 좋을 수 있다.

애초에 그런 목적의 책인것 같다.

하지만 그런 만큼 단점도 뚜렷하다. (책이 나쁘다는 뜻이 아니다.)

고봉밥과도 같은 내용에 디테일을 놓칠 수 있다.

더 자세한 내용들은 다시 한번 다른 자료를 찾아 보기 바란다.

상호 보완적인 측면이 강한대,

자세한 설명을 다루는 이론서들은 디테일에 매몰되 읽는 사람들이 길을 잃기에 딱 쉽다.

(어떤 task에 적용 하는데 있어)

하지만 이와 같은 가이드 성격의 책들과 함께라면 연구와 학습에 길잡이가 되어 줄 것이다.

 

번외로 나는 이런 책을 읽다가 내가 놓치고 갔거나 혹은 어렵게 이해한 내용을 한줄로

깔끔하게  설명한 구절을 읽다가 어렵게 느껴졌던 부분을 깨우친 경험이 몇번있다. 

 

73가지 핵심 키워드로 정리하는 AI 기술의 모든 것

 

AI 딥 다이브 도서는 AI 기술에 관심이 있거나 현업에서 AI를 다루는 전문가들에게 매우 유익한 지침서입니다. 이 책은 AI의 기초부터 최신 기술에 이르기까지, 복잡하고 넓은 AI 분야를 73개의 핵심 키워드로 체계적으로 정리하여 독자들에게 깊이 있는 통찰을 제공합니다.

 

특히, 이 책은 AI 기술의 발전사를 따라가며, 딥러닝의 초기 단계부터 최신의 생성 AI까지를 포괄적으로 다루고 있습니다. 이를 통해 독자들은 AI 기술이 현재에 이르기까지 어떤 경로를 거쳐 왔는지, 그리고 앞으로의 트렌드는 어떻게 발전할 것인지에 대해 명확하게 이해할 수 있습니다. 책에서 다루는 주요 개념들은 시류에 휘둘리지 않고, AI의 본질을 꿰뚫고 있어, 미래 기술의 흐름을 예측하는 데에도 중요한 역할을 합니다.

 

각 챕터별 내용은 다음과 같습니다.

 

1부: 지능이란 무엇인가, 딥러닝이란 무엇인가

1장: 인공지능의 원리 해명

이 장에서는 딥러닝 모델이 어떻게 학습하는지, 그리고 그 모델이 왜 잘 작동하는지를 설명합니다. 특히, 매니폴드 가설을 통해 현실 세계의 데이터를 모델링하는 방법을 다루며, 딥러닝이 일반화되는 이유와 신경망의 미해결 문제를 탐구합니다. 또한, 과다 파라미터 표현 신경망, 인과와 상관, 대칭성 학습, 그리고 머신러닝의 새로운 거듭제곱 법칙을 소개하며, 강건한 모델 개발에 필요한 요소들을 설명합니다.

 

2장: 사람의 학습

이 장에서는 인간 두뇌의 학습 시스템을 분석합니다. 특히, 뇌가 오차 역전파를 사용하는지와 인간의 학습 메커니즘이 AI 모델과 어떻게 비교되는지를 탐구합니다. 이는 인간 학습 원리와 AI의 학습 과정을 비교하며, AI가 인간 지능을 모방하려는 시도에 대해 심도 있는 논의를 제공합니다.

 

2부: 학습 기법

3장: 학습 기법

이 장에서는 다양한 학습 기법을 다룹니다. Adagrad, RMSProp, Adam과 같은 수리 최적화 기법부터 비지도 표현 학습, 지식 증류, 메타 학습 등 최신 기술까지 포괄적으로 설명합니다. 특히, 오차 역전파 기법뿐만 아니라 오차 역전파를 사용하지 않는 대안적인 학습 기법도 소개하며, 연속 학습, 예측 학습, 진화 전략 등 다양한 학습 접근법을 설명합니다.

 

4장: 강화 학습

강화 학습의 원리와 피드백을 통한 최적 행동의 획득 방법을 설명합니다. 월드 모델, 안전 강화 학습, 오프라인 강화 학습, 그리고 미래 예측에 기반한 플래닝 등을 다루며, 강화 학습이 어떻게 발전해 왔는지에 대해 심도 있게 논의합니다. 이 장은 강화 학습을 통해 실세계에서의 의사결정 과정을 시뮬레이션하는 방법을 배울 수 있게 해줍니다.

 

5장: 고속화, 저전력화, 인프라

이 장에서는 심층 신경망 학습의 고속화와 모바일향 신경망의 전력 효율 향상에 대해 다룹니다. 또한, AI 연구에서의 중요한 교훈과 세계 최고의 저소비전력 슈퍼컴퓨터 MN-3/MN-Core에 대해 소개하며, AI 연구 인프라의 발전 방향을 제시합니다.

 

3부: 모델과 아키텍처

6장: 생성 모델

이 장에서는 생성 모델의 다양한 접근법을 설명합니다. 적대적 생성 신경망(GAN), 트랜스포머, 에너지 기반 모델, 그리고 Glow와 같은 생성 모델의 아키텍처와 그 작동 원리를 소개하며, AI가 이미지를 생성하고 번역하는 과정에서 어떻게 높은 정확도를 달성할 수 있는지 설명합니다. 또한, 셀프 어텐션 메커니즘과 Perceiver 등의 최신 기술도 다룹니다.

 

7장: 기억의 얼개

이 장은 AI 모델이 정보를 저장하고 접근하는 방법을 설명합니다. Fast Weight, 미분 가능 신경 컴퓨터와 같은 기술을 통해 단기 기억과 외부 기억을 갖춘 신경망의 작동 원리를 분석합니다. 이는 AI가 복잡한 작업을 처리하는 데 필요한 메모리 구조를 이해하는 데 중요한 내용을 담고 있습니다.

 

4부: 애플리케이션

8장: 이미지

이미지 인식에서 Convolutional Neural Networks(CNN)의 역할과 성과를 설명하며, 파싱 트리 기반의 이미지 인식 가능성을 탐구합니다. 이 장은 AI가 이미지 데이터를 처리하고 해석하는 방법을 중점적으로 다루고 있습니다.

 

9장: 음성

이 장에서는 자연스러운 음성 생성 및 음악 생성에 사용되는 웨이브넷 기술을 소개합니다. 음성 인식과 생성에 있어 AI가 어떻게 발전해 왔는지에 대한 통찰을 제공합니다.

 

10장: 공간생성/인식

Generative Query Network를 통해 3차원 구조를 이해하고 생성하는 방법을 설명하며, 자기 지도 학습에 의한 깊이와 자기 이동 추정 기법을 다룹니다. 이 장에서는 AI가 물리적 공간을 이해하고 해석하는 방법에 대해 깊이 있게 논의합니다.

 

11장: 언어

이 장은 seq2seq 모델, BERT와 같은 언어 이해 모델을 중심으로 언어 처리 기술을 설명합니다. 기계 번역, 텍스트 생성, 그리고 로봇의 자연어 명령 처리에 관한 최신 기술들을 소개합니다.

 

12장: 제어

AI의 제어 능력을 다루는 이 장에서는 확률적 제어, 온라인 학습, 그리고 최적 제어 기법을 설명합니다. AI가 미지의 환경에서도 강건한 제어를 유지할 수 있는 방법을 탐구합니다.

 

13장: 시뮬레이션

AI가 시뮬레이션을 통해 복잡한 문제를 해결하는 방법을 설명합니다. 매틀란티스와 같은 원자 레벨 시뮬레이터를 포함하여, 시뮬레이션 기반 추론과 물리 시뮬레이션의 고속화에 대해 논의합니다.

 

14장: 게임

알파고와 알파스타와 같은 AI 기반 게임 기술을 설명합니다. 강화 학습을 통해 AI가 인간 수준의 게임 능력을 어떻게 달성했는지, 그리고 그것을 넘어서는 방법을 탐구합니다.

 

15장: 바이오 생명 과학

이 장에서는 AI가 생명 과학에서 어떻게 활용되는지를 설명합니다. 알파폴드와 같은 모델이 단백질 구조 예측 문제를 해결하며 생명 과학의 그랜드 챌린지를 극복하는 과정을 소개합니다.

 

16장: 로봇

마지막으로, 이 장에서는 AI가 로봇 공학에서 어떻게 적용되는지 설명합니다. 자동 정리 로봇 시스템과 도메인 무작위화를 통한 로봇의 학습 기법을 중심으로 AI가 로봇의 실용적 응용에서 어떻게 진보하고 있는지를 탐구합니다.


이 책은 기술적 내용이 풍부함에도 불구하고, 비전문가도 이해할 수 있도록 잘 구성되어 있어 AI 입문자부터 숙련된 개발자까지 다양한 독자층을 만족시킬 수 있습니다. 특히 AI 분야에서 현업에 종사하는 이들에게는 최신 트렌드를 체계적으로 정리한 이 책이 필독서로 다가올 것입니다.

 

이 도서는 AI 기술의 전반적인 흐름을 이해하고자 하는 모든 이들에게 매우 유용한 자료입니다. 기술의 핵심을 짚어주면서도 미래를 내다보는 통찰을 제공하는 이 책은 AI 기술의 현재와 미래를 이해하는 데 있어 탁월한 가이드가 될 것입니다.

AI 딥 다이브

 



한빛미디어 <나는 리뷰어다> 활동을 위해 책을 제공받아 작성한 서평입니다.

이 책은 AI의 각 분야를 설명하고, 지금까지의 발전 및 개발 동향을 다룬다.
주제별 관련 연구마다 출처와 논문도 밑에 주석으로 달려있어, 친절한 논문 서베이를 읽는 기분이 든다.
 

딥러닝 관련 수업을 듣거나, 처음 배우기 시작하면 전통적인 모델이나 알고리즘부터 발전 순서대로 차근차근 알아가는 경우가 많은데, 지금 여기저기 연구되고 사용되는 모델을 이해하기에 좋은 자료같다.

 

 

 

 

지금 IT 업계의 대세는 단언컨대 인공지능이다. 개발자라면, AI를 공부하는 것은 선택이 아닌 필수인 상황이다. 나 역시도 그런 흐름에 맞춰 인공지능 관련 다양한 서적을 기회 닿는 데로 보고 있다.


 

 

그런데 이번에 만난 오카노하라 다이스케의 'AI 딥 다이브'는 기존 인공지능 서적들과는 느낌이 많이 다른 책이었다. 일단 형태 면에서 일반 책과 달리 잡지에서 흔히 볼 수 있는 형태로 되어 있다. 페이지를 두 단으로 나눠 편집되어 있는 것이다. 왜 이렇게 했나 봤더니, 이 책은 저자가 '닛케이 로보틱스'에 연재했던 글을 편집해서 이 책 한 권에 옮긴 것이었다. 그래서 일부러 잡지의 편집 형태를 유지한 거 같다.


 

내용은 전체 4파트 구성에 총 73가지의 인공지능 관련 기슬을 소주제로 다루고 있다. 내용들이 연관된 주제로 분류되어 있지만, 학습을 위한 점진적인 형태보다는 잡지 기사처럼 각각 나눠진 주제로 설명하고 있다. 뭐랄까 요약된 주제 또는 논문을 보는 기분도 든다.


 


 

'AI 딥 다이브'는 320쪽의 분량의 책인데, 그 몇 배를 맞먹는 내용을 담고 있는 거 같다. 깊이 있는 내용과 함께, 현재 그 기술의 상황이나 문제점, 앞으로의 방향 같은 것을 설명하고 있다. 파트 3까지는 딥러닝의 이해, 학습 기법, 강화학습, 생성모델 같은 이론적인 것들 위주이고, 파트 4에서는 애플리케이션, 즉 이미지, 음성, 공간, 언어, 제어, 시뮬레이션, 게임, 생명과학, 로봇과 같은 응용 이야기를 하고 있다.


 


 

'AI 딥 다이브'의 앞 파트들은 그리 쉬운 내용이 아니다. 딥러닝, 머신러닝 등에 관련된 각종 알고리즘이 등장한다. 당연히 관련 수학 공식도 같이 나온다. 많이 봤던 공식들도 나오지만, 처음 접한 것들이 더 많다. 식에 대한 설명이 자세히 나온 것도 있으나, 빠르게 훑으며 개념만 설명한 경우도 많다. 쉬운 내용도 있으나, 나름 이 책, 저 책 좀 봤다 자부했는데, 중간중간 모르는 것들이 보이니 그것들이 더 크게 느껴진다. 이렇게 미흡한 부분을 확인도 하면서, 주제별로 인공지능 기술을 정리할 수 있는 장점이 있다. 그만큼 인공지능 지식 레벨 업 하는데, 도움 되는 책이다.


 


 

아울러 다양한 인공지능 기술을 접해 보는데도 최고인 책이라 느껴진다. 봐왔던 뻔한 내용이 아니다. 인공지능 알고리즘을 보다 깊게 들여다볼 수 있다. AI 기술을 어떻게 활용하는지 다양한 사례도 접할 수 있다. NNP를 활용해서 원자 레벨 시뮬레이터를 만들고, 단백질 접힘 문제 해결을 위한 알파폴드에서는 지도학습을 사용한다. 인공지능의 역사적 이슈를 부른 알파고 관련 정보도 얻을 수 있다.


 

개인적으로 인공지능과 함께 또 다른 폭발점이 로봇으로 생각하고 있었는데, 'AI 딥 다이브'를 보고 나서, 시각을 넓게 확장시킬 수 있었다. 로봇이나 자동화가 좀 더 사람들이 민감하게 반응하겠지만, AI의 활용 영역은 너무나 넓었다. 인공지능 비즈니스에서 블루오션은 널리고 널렸다. 그래서 사람들이 AI에 이렇게 열광하고 있는 것이라 생각한다.


 

이처럼 'AI 딥 다이브'를 통해 다른 책에서 느낄 수 없었던, 인공지능의 보다 깊은 곳에 빠져 볼 수 있었다. 깊이와 함께 활용 측면도 잘 다루고 있어 매우 유익한 색다른 느낌의 책이다.

이 책을 제대로 이해할 수 있다면 이 책은 당신을 AI전문가로 인도해줄 것이다.

 

  • 도서명 :  AI 딥 다이브: 오차역전파부터 확산모델까지, 미래를 만드는 73가지 기술 이야기
  • 출판사 : 한빛미디어
  • 저자 : 오카노하라 다이스케 지음 

 

 

 이 책은 그동안 가벼운 읽을거리인 일반적인 AI책과는 다르다. 

올해 들어 읽은 AI 책중에 가장 깊고 전문적인 책이었던 거 같다. 마치 ‘언제까지 AI의 역사와 딥러닝 역사, OpenAI의 샘알트만의 행보 등 가벼운 얘기만 할 것인가?’ 라는 화두를 던져준 책인거 같다.

 

사실 저자가 2개의 회사를 운영하는 CEO이라서 비지니스 관점의 깊이 있는 얘기를 하는줄 알았다. 나의 착각이었다. 저자는 CEO이면서 도쿄대 정보기술과학대학원 박사과정을 졸업한 AI전문가이다. 그래서, 그는 인공지능의 원리부터 학습기법, 강화학습, 생성모델, 이미지,음성, 공간, 언어, 시뮬레이션, 게임, 바이오, 로봇등의 AI 기법을 도출하는 과정과 입증에 대한 전방위의 모든 기술들을 수학적 방정식과 기법으로 풀어 설명해준다.

 

주요 내용은 다음과 같습니다.

  • 지능과 딥러닝: AI 작동 원리, 머신러닝과 딥러닝, 인간의 두뇌와 학습
  • 학습 기법: 학습 엔진, 정규화, 강화학습, 고속화, 저전력화, 인프라
  • 모델과 아키텍처: 생성 모델, 기억과 신경망
  • 애플리케이션: 이미지, 음성, 공간생성 및 인식, 언어, 제어, 시뮬레이션, 게임, 생명과학, 로봇

 

이 책은 딥러닝 기법에 대한 깊이 있는 개념과 설명을 해줌으로써,  AI분야의 중,고급자가 되기를 희망하는 사람들을 위한 책이다.  개인적으로는 최소한 고등학교에서 이과를 전공하거나 이공계를 졸업한 사람들에게 유리하다고 생각한다. 왜냐하면, 오차 역전파 기법, 행렬, 정규화, 확률, 가우시안 노이즈, 스코어함수, 가중치, 행렬곱, 위치인코딩, 합성곱계층, 확률분포의 곱, 교차엔트로피, 라그랑주 승수법, 확률벡터, 상향평갓값등의 개념을 설명하는데, 이를 이해하여야 제대로 된 AI 기수로가 원리를 이해할 수 있기 때문이다. 만약, 이런 내용을 이미 배웠거나 이해하고 있다면 이 책은 진정 당신이 단숨에 깊이 있는 AI를 이해하고 관련 지식을 습득한 전문가로 업그레이드 시켜줄 것이다.

 

개인적으로 흥미로운 부분은 대한민국 국민들에게 깊게 각인되어 있는 알파고 관련 게임 부분에 대한 내용이었다.  사실 우리에게는 알파고만 널리 알려져있지만, 구글딥마인드에서는 알파고를 계속 발전시켜왔다.

  • 알파고리: 이세돌과 게임했던 그 알파고
  • 알파고마스타: 중국의 커제를 3대 0으으로 이긴 버전
  • 알파고제로: 사람의 도움없이 스스로 바둑을 배운 버전
  • 알파스타: 2019년에 발표한 스타크래프트를 할 수 있는 버전으로 상위 0.2% 그랜드마스터급 버전

이 책에서는 이 중 알파고, 알파고제로, 알파스타를 신경망 강화학습을 이용해서 어떤 예측 방벙과 발전을 했는지 설명을 해준다.

이외에도 각 내용들에 대한 깊이 있는 설명과 풀이(?)는 모처럼만에 깊이 있고 통창력 있는 AI 전문서적을 보게 된 나를 즐겁게 머리아프게(?) 해주었다. 이런 전문책들이 보다 더 많은 사람들이 읽고 깊이를 쌓아가기를 바래본다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."



결론을 먼저 말하자면, 두고두고 반복해서 읽을 책입니다.

책을 열고 '잡지 같다'라는 인상이 들었습니다.

주제 하나에 대해 내용이 아주 길지도 않고, 책 자체도 저자가 기고한 글을 엮어서 만들어서 더 그런 느낌이 났던 것 같습니다.

가벼운 마음으로 읽을 수 있지만, 또 내용을 따라가다보면 얕지만은 않습니다.

문장 하나하나를 얼마나 고민해서 썼는지가 느껴집니다.

참고한 논문과 서적을 찾아가다보면 하루에 한 주제를 못 읽을 때도 많았습니다.

책을 읽으면서 저자에게 존경심이 들었는데, 옮긴이의 글에서 그 이유를 찾을 수 있었습니다.
"AI의 고전과 신고전, 이론과 실제를 넓고 깊게 정리해서 읽는 것만으로 머릿속의 엔트로피를 줄여줍니다. 정보가 흘러넘치는 시대일수록 이런 책의 가치가 빛납니다. 세상에 실력자들은 적지 않지만, 이런 글을 써주는 사람은 아주 적습니다. 이론적인 깊이가 상당한 내용임에도, 설명 하나하나가 친절하고 직관적입니다. 저자의 실력과 성품이 드러납니다."
'깊은 지식을 가지고 있으면서도 이를 친절하고 직관적으로 설명하는 사람'.

되고 싶은 나의 방향성을 더 구체적으로 정하게 해준 책인 것 같습니다.
작가의 다른 책도 꼭 읽어보아야겠다는 생각이 듭니다.

 

책은 크게 네 파트로 구성됩니다.

PART 01. 지능이란 무엇인가, 딥러닝이란 무엇인가

PART 02. 학습 기법

PART 03. 모델과 아키텍처

PART 04. 애플리케이션

각 파트에서 다루는 주제들이 상당히 흥미롭습니다.

기술적인 내용 뿐 아니라 기술철학적인 내용도 많이 담겨 있어서 생각할 거리가 많습니다.

AI시대에 AI기술을 다루는 사람이라면 이에 대한 영향력을 고려해야 한다고 생각합니다.

그래서 함께 공부해야할 분야를 철학이라고 강력하게 주장하고 있는데요.

이런 면에서 저자와 생각의 결이 맞는 것 같아서 계속 고개를 끄덕이며 읽었습니다.

 

입문용이기보다는 정말 제대로 인공지능을 이해하고 싶은 분들에게 맞을 책입니다.

겉핡기만 하거나 의문만 던지고 끝나는 책들이 많습니다만, 이 책은 더 깊은 곳으로 안내하는 역할을 충실히 해내는 것 같습니다.

주변인들에게 적극 추천하고 싶습니다.

AI 딥 다이브

AI 딥 다이브 - 오카노하라 다이스케 / 정원창 역

 

 

AI 기술 발전에는 다음과 같은 세 가지 특징이 있다고 생각합니다. 속도, 무경계 그리고 창의성입니다.

 

 

인공지능을 처음 들어본 사람이라면 내용을 이해하는데 어려움이 있을 수도 있지만, 깊게 공부하기를 원하는 사람이라면 안성맞춤인 책이다. 이 책에서는 인공지능의 원리와 딥러닝에 대한 설명, 다양한 학습기법과 생성 모델, 이미지와 음성, 3차원, 언어에서 사용하는 신경망에 대한 설명과 시뮬레이션, 게임, 생명과학, 로봇 등 다양한 연구 분야에서 AI의 사용에 대해서 크게 4가지 파트로 나누어서 설명하고 있다.

 

 책을 읽으면서 여러 편의 논문을 읽는 것 같다는 생각이 들었는데, 실제로 2015년 7월부터 닛케이 로보틱스지에 저자 오카노하라 다이스케가 매달 연재했던 글을 모아서 중요한 주제를 선정해서 작성한 글이라고 한다. 현재까지 발전해온 여러가지 분야의 인공지능에 대해서 친절한 각주와 수식 설명이 함께 정리되어 있어서, 대학원에 진학할 생각이 있는 학생들이나 직장인들에게 좋은 책이라는 생각이 들었다. 

 

인공지능 기술이 실제로 어떻게 적용되는지 다양한 활용 분야에서의 자세한 예시를 통해 설명하기 때문에, 이 책 한권으로 몇 편의 논문을 훑어 읽은 것과 같은 효과를 낼 수 있기 때문이다. 각주에 언급된 논문이나 사이트들을 참고하면서 읽으면 최근 몇년간의 발전의 흐름을 알 수 있다.

 

위에서 저자가 말한 AI 기술 발전의 세가지 특징 중에서, ‘속도’는 논문이나 코드가 순식간에 전세계로 공유되는 특징을 말하고, 처음 방법을 제안한 논문이 후속연구와 후속연구에 기반한 후속 연구와 동일한 학회의 동일한 세션에서 함께 발표될 정도로 속도감이 빠르다고 한다. 

 

두번째로, ‘무경계’는 말 그대로 경계 없이 한 분야에서 적용되는 방법이 다른 분야로 퍼져나간다는 특징을 말하는데, 딥러닝이 초기에는 음성인식 분야에서 성공했고 이를 2012년에 이미지 인식에도 적용시켰으며, 이후에 자연어 처리나 화합물등의 다른 분야에서도 도입되었다.

 

마지막으로, ‘창의성’은 AI 기술 발전에서의 영향력있는 성과가 기존 상식과는 동떨어진 곳에서 등장하는 특징을 말하는데, 뛰어난 직관과 실험을 통해 얻은 결과가 먼저 등장하면 이후에 이를 설명하는 이론이 등장한다는 것이다. 마치 수학 공식을 찾고 나서 이후에 증명으로 이론을 완성한다는 것과 비슷하다고 할 수 있다.

 

빠른 속도로 발전하는 연구의 흐름을 따라갈 수 있고, 하나의 경계에만 갇혀 생각하지 않으며, 창의적으로 새로운 발상을 할 수 있는 사람이라면 AI의 흐름에 뛰어들어도 될 것 같다. 이 때, 이 책이 안내서와 같은 역할을 해줄 수 있을 것이다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

2016년 이세돌을 꺾은 알파고를 거쳐, 2022년 등장한 ChatGPT와 MidJourney로 이어진 인공지능이라는 새로운 시대의 바람은 AI가 우리의 일상에 깊숙이 스며들게 했고, 이제는 AI를 연구하는 전문가가 아니더라도 누구나 AI에 대해 이야기하고 있다. 그만큼 많은 사람들이 AI를 배우고 싶어하고, 공부하고 싶어하지만, AI 연구는 오랜 역사를 가진 분야이기 때문에 이를 혼자서 처음부터 끝까지 되짚어 나간다는 것은 결코 쉬운 일이 아니다. 이는 AI를 처음 접하는 사람은 물론, 관련 분야에서 일하는 전문가에게도 마찬가지다.

 

그러한 점에서, 이 책은 AI를 더 깊이 이해하고 활용하고자 하는 사람들에게 추천할 만한 책이다. 인공지능 전반을 포괄적으로 다루면서도, 기존의 많은 책들과는 뭔가 다른 차별점을 가지고 있다. 단순히 기본 개념을 충실히 설명하는 것에서 그치지 않고, 그 다음 단계로 나아갈 수 있는 길을 제시하고 있다.

 

1부에서는 인공지능의 원리를 하나하나 파헤치면서도, 잘 짜인 플롯을 따라가는 듯한 느낌을 주고 있어 단순한 개념서처럼 느껴지지 않았다. 또한, 흔히 인간의 뇌와 인공지능(특히 딥러닝의 뉴런)을 비교하며 혼란을 만드는 여타 책들과는 달리, '인공지능'이라는 개념에 대한 허상을 걷어내고, 정확한 시선을 갖도록 도와주는 점이 신선하게 다가왔다.

 

2부에서는 학습 기법을 다루며, 기본적인 정규화나 역전파뿐만 아니라 메타 학습, 지식 증류와 같은 더 발전된 개념까지 충실히 다루고 있어서 만족스러웠다. 특히, 최근 관심을 가지고 공부 중인 강화학습과 경량화 개념을 별도의 챕터로 다루고 있어, 마치 저자의 목차 구성이 나의 관심사를 정확히 겨냥한 듯한 느낌을 받았다.

 

3부에서는 최근 가장 화제가 되고 있는 생성 모델을 포함해, Fast Weight나 외부 기억 신경망과 같은 최신 아키텍처도 다루고 있다. 마지막으로, 4부에서는 지금까지 다룬 내용들을 실제 응용 도메인에 어떻게 활용할 수 있는지에 대해 논하며, 생명 과학이나 로봇 연구와 같은 분야에서의 가능성을 제시하면서 책을 마무리하고 있다.

 

이 책은 기본 원리에 대한 개념서와 매일같이 쏟아져 나오는 최신 AI 논문들 사이에서 길을 잃은 사람들에게 다리를 놓아주는 최고의 가이드다. 최근에 이 정도로 흥미를 자극하는 AI 전문서적을 만난 적이 없을 정도로, 이 책은 AI에 대한 새로운 자극을 주었고, 이미 수많은 AI 개념서를 접해온 나에게도 다시금 열정을 불러일으켰다. 만약 당신이 AI를 공부하고자 하는 중급자(기본 개념은 전체적으로 숙지한 사람) 이상의 사람이거나, AI를 활용하고자 하는 엔지니어라면, 이 책을 꼭 읽어보라고 추천하고 싶다. 나 또한 두고 두고 곁에 두고 음미해볼 예정이다.

무한한 AI 지식나무들 속에서 길을 잃지 않고 숲을 볼 수 있게 도와주는 가이드.

방대한 AI 지식의 세계속의 굵직한 획을 그었던 기술들의 핵심만 모아 엮은 책이다. AI에 관심을 두고 있거나 이를 업으로 삼고 있는 이들이라면 이 책을 펴는 순간 펼쳐지는 재미덕분에 한동안 눈을 떼지 못할 것이다.

하나하나 쉽지 않은 주제인지라 그동안 경험하고 학습했던 머릿속의 AI지식들과 비교하고 리마인드해가며 읽느라 꽤 오랜 시간이 걸리는 것도 사실이지만 처음 책을 펴는 순간 3장을 다 읽을 때까지 꽤 오랜시간동안 재미있게 몰입할 수 있었다.

읽으며 가장 놀랐던 것은 이 방대한 AI의 역사 중 어떻게 이렇게 중요한 우선순위를 추려 책을 낼 수 있었을지에 대한 의문이었다. 한 주제 한 주제가 한 시대를 풍미했던 굵직한 기술들이고 학회에서 긴 시간동안 활발한 연구대상이었던 주제도 있었다.

어떻게 한 사람이 인공지능의 원리, 뇌과학, 모델, 로보틱스와 인프라에 이르기까지 전 영역을 다 알 수 있단 말인가? 한 분야에 쏟아져 나오는 논문만해도 Abstract 하나 소화하기 버거운 현실에 어떻게 이게 가능한 것인가? 절대 한 사람이 소화할 수 있는 분량이 아님에도 AI의 세분화된 각 분야의 굵직한 기술들을 소개하고 있어 놀라움을 금치 못했다.

나중에 알게 되었지만 이 책은 저자가 2015년 7월부터 논문 및 뉴스 등에서 중요하다고 생각한 주제를 선택하여 기고한 것이라 한다. 그렇기 때문인지 책의 구성 또한 잡지를 읽는 기분이다. 마치 과거 마소지를 읽는 느낌이랄까? 덕분에 무거운 주제여도 가벼운 느낌으로 읽을 수 있어 산뜻했다.

이 책을 읽다보면 AI에 대한 공포가 더욱 심해진다. 또 한편으로 이 무한한 가능성에 심장이 두근거리기도 한다. 저자가 언급한대로 AI의 속도, 무경계, 창의성이라는 주제에 더욱 깊은 생각을 하게 된다.

이 중 특히 속도는 앞에서도 언급했지만 두말할 나위없이 두려운 부분이다. 나 역시 2016년 알파고 등장 이후 AI 분야에 대한 학습을 부단히 노력해왔었다. 처음에는 오차역전파법을 배우며 수학적으로 그리 어렵지 않은 미분연쇄라는 아이디어를 놓고 한국 교육과정에 심각한 문제가 있음을 느꼈던 기억이 난다.

또 한편으로는 그 안에 미분 불가능이라는 주제에 대한 호기심을 갖기도 했으며 순간 괜찮은 아이디어가 떠올랐음에도 AI의 망망대해에서 쫓아가야 할 지식들이 부지기수인지라 고찰보다는 습득에 중점을 뒀던 기억이 난다.

그러나 내 배움의 속도는 AI세계에서 유수한 연구자들이 쏟아내는 지식을 쫒는 것도 버거울 지경이었다. 기본적인 CNN, LSTM, VAE, GAN 등의 모델에 자신이 좀 생기자 관련 분야의 논문은 일주일이라는 짧은 시간내에 파악하기도 어려울 정도로 쏟아졌다.

이내 논문의 흐름에 좀 적응할만하자 Attention, BERT 등이 등장하였고 그것들을 익히자 LLM과 생성모델들이 쏟아지기 시작했다. 어느 순간부터는 남들이 자랑하듯 내놓는 아이디어의 노예가 된 느낌이었다. 하물며 이젠 다 내려놓고 LLM을 어떻게 기똥차게 써볼까라는 생각에 집중하고 있는 지경이라니…

AI의 최전선까지는 아니라도 그래도 나름 그 바닷속에서 헤엄치고 있는 수준은 된다는 위치가 이 급류에 적응하지 못해 허우적거리고 있으니 도대체 AI에 대해 지식이 전무한 사람은 얼마나 갑갑한 생각이 들까? 아니 아예 아무것도 모르면 오히려 안심이 되려는지 오만가지 생각이 드는 요즘이다.

이 책은 이런 AI속도의 위대함에 답답함을 느끼는 내게 잠시 휴식을 준 고마운 책이다. 다소 느린감은 있지만 예전에 잠시 떠올렸던 오차역전파의 문제점인 미분불가능에 대해 다시금 생각할 여유를 줬다.

오차역전파한계

잠시 모델에서 벗어나 관련 기반 인프라의 발전에 관한 부분도 흥미롭게 둘러봤다. 올해 초 AI가 불러올 전력대란이 일으킬 다양한 문제점 그리고 사회의 변화 방향에 대해 다시금 생각할 수 있는 기회가 주어졌다.

오차역전파한계

또, 언제 실용화할만한 기술로 발전할지 늘 궁금한 주제인 양자 역학과 AI와의 만남에 대해서도 어느정도 갈증을 풀 수 있었다. 원자 수준 시뮬레이션이라니 잠시 머릿속에서 공상과학 소설을 쓰고 있노라면 다가올 미래가 어렴풋이 보이기도 한다.

양자역학

급할수록 돌아가라 했던가? 그간 꼭두각시 인형처럼 세상의 천재들이 내놓는 엄청난 기술들의 코어는 커녕 겉모습만 쫓기에도 뱁새가 황새 쫒는 격이었다. 배우는 순간에는 신박한 아이디어의 향연에 빠져 즐겁기도 했지만 어느새 방향을 잃은 느낌에 점점 들어가는 나이덕에 체력은 떨어져갔다.

이렇게 열심히 공부하는데 뭔가 중요한 것을 놓치고 있는 허탈감이 무엇인지 잠시 생각할 수 있는 기회를 줬다.

이 책 하나하나의 주제는 관련된 논문이 부지기수일 정도로 대단한 주제이다. 그렇다고 일반 AI 교양서처럼 난이도가 쉬운 책도 아니다. 논문에 핵심이 되는 굵직한 수식들도 종종 등장하고, 논문의 핵심 아이디어들이 쉴새 없이 등장한다.

AI분야에서 이름 꽤나 떨치는 분들도 결코 이 책의 모든 주제들을 쉽게 이해하진 못할 것이다. 그럼에도 이 책이 만족스러운 것은 기술적인 핵심을 빠르게 파악할 수 있도록 도와준다는 점이다. 리뷰 논문을 읽는 것 이상으로 각 분야의 획을 그은 기술들을 빠르게 섭렵할 수 있게 도와준다.

가급적 적은 분량의 수식과 핵심기술을 핵심만 빠르게 전달하는 저자 특유의 전달력이 놀랍다. 어려운 이론을 적절한 예시와 비유를 들어 쉽게 전달하는 능력은 더욱 놀랍다.

AI업계에 종사하는 이는 물론, AI세계에 관심이 생긴 입문자에게도 매우 좋은 책이라 생각한다.

AI라는 거대한 숲에서 길을 잃어 가까운 데 머물고 있는 해결책을 놓치고 있진 않은지? 혹은 AI의 속도에 짓눌려 스스로 가야할 방향을 잃고 있진 않은지? 본인이 몸담은 AI 특정 카테고리에 묶여있어 유관 카테고리의 변화에 두려움을 느끼진 않는지? 이런 질문에 해당하는 독자라면 이 책이 많은 해결책을 제시할거라 생각한다.


 

딥러닝은 현대 인공지능 기술의 핵심으로, 그 본질은 단순하면서도 복잡한 양면성을 지닌 학문 분야입니다. 표면적으로 볼 때, 딥러닝 모델은 선형사상 함수와 비선형 활성 함수들을 계층적으로 쌓은 복합함수로 이해할 수 있습니다. 그 학습 과정도 미분 가능한 함수를 미분하는 것에 불과하며, 심지어 이 미분 작업조차 자동 미분 프로그램의 도움을 받아 수행됩니다. 이러한 기본적인 원리 때문에 열정적인 초보자라면 한 달 정도의 시간으로도 딥러닝의 기초를 파악할 수 있습니다.

 

그러나 딥러닝의 세계는 겉보기와 달리 그 깊이를 가늠하기 어려울 정도로 방대합니다. 일반화, 최적화 기법, 생성 모델, 메타 학습, 강화학습, 효율화 등 각 세부 주제마다 매년 수천 편의 논문이 발표되고 있습니다. 이러한 특성으로 인해 기본 개념을 습득하는 단계와 전문 연구자 수준으로 올라가는 단계 사이의 간극이 상당히 큰 분야라고 할 수 있습니다. 이는 딥러닝이 가진 독특한 매력이자 도전 과제이기도 합니다.

 

이러한 맥락에서, 이 책은 딥러닝과 AI 기술의 광범위한 스펙트럼을 포괄하는 종합 해설서로서 큰 가치를 지닙니다. 딥러닝의 여명기부터 최근 화제가 되고 있는 생성 AI에 이르기까지, 주요 AI 기술의 흐름을 73개의 주제로 나누어 상세히 설명하고 있습니다. 이론적 깊이가 상당한 내용임에도 불구하고, 각각의 설명이 친절하고 직관적으로 이루어져 있어 독자의 이해를 돕습니다.

 

책의 구성을 살펴보면, 크게 네 가지 영역으로 나누어져 있습니다.

  • 지능과 딥러닝 : AI 작동 원리, 머신러닝과 딥러닝, 인간의 두뇌와 학습
  • 학습 기법 : 학습 엔진, 정규화, 강화학습, 고속화, 저전력화, 인프라
  • 모델과 아키텍처 : 생성 모델, 기억과 신경망
  • 애플리케이션 : 이미지, 음성, 공간생성 및 인식, 언어, 제어, 시뮬레이션, 게임, 생명과학, 로봇

 

특히 이 책의 강점은 시간의 흐름에 따른 최신 AI 기술 트렌드를 포괄적이면서도 깊이 있게 통찰할 수 있다는 점입니다. 이는 AI 분야에 종사하는 전문가들이나 현업 AI 개발자들에게 특히 유익할 것입니다. 급변하는 AI 기술 동향을 한눈에 파악하고, 각 기술의 발전 과정과 미래 방향성을 이해하는 데 큰 도움이 될 것입니다.

 

일반적으로 AI 관련 서적들은 기본 개념에만 충실하거나, 반대로 전문적인 논문 수준의 내용으로 구성되어 있어 중간 단계의 학습자들이 접근하기 어려운 경우가 많습니다. 이 책은 그 간극을 효과적으로 메워주는 역할을 합니다. 따라서 AI의 기본 개념들의 큰 맥락을 파악하고 싶은 분, 각 연구 주제의 핵심을 이해하고 싶은 분, 그리고 AI 기술의 전반적인 흐름을 파악하고자 하는 분들에게 이 책은 훌륭한 길잡이가 될 것입니다.

 

    "한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

한빛미디어 <나는 리뷰어다>
활동을 위해서 책을 제공받아
작성된 서평입니다.


 


이 책은 심화기본서라고 보는게 좋을 것 같다.

실제로 인공지능을 입문한지 얼마되지 않았고, 이 책을 본다면 분명히 어렵게 받아들여질 것으로 생각이 된다.

다양한 논문들의 내용도 차용해서 다루고 있고, 수많은 수식들이 "이래도 인공지능할꺼야?"하며 말을 걸어올 것이다.

 

하지만 어느정도 경험이나 경력을 갖고 있는 사람이 느슨해진 현실에서 한번 분위기를 환기시키는데는 좋을 것 같은 느낌이다.

현재 이직할 곳을 정해두고, 이전회사는 퇴사해서 쉬고 있는 아주 좋은 타이밍에 자신을 돌아 보며 계속 공부할 구실을 만들어주는 아주 좋은 책이었다.

 

개발자는 죽을때까지 공부하는거다.

특히 인공지능업계에 발을 들인 이상, 자기개발을 멈춘 순간 도태된다.

 

다시 한 번 느끼고... 새로 이직도 하는 상황에서 정신차리고 로드맵을 그려봐야겠다.

 

책도 책이지만 많은 것을 느끼게 되는 이번 리뷰였다.

https://blog.naver.com/ab415/223560236421

 


 

이 리뷰는 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.
서평을 작성하기 위해 책을 끝까지 정독하고, 제 주관적인 의견을 담아 작성하였습니다.




### 들어가기

몇년 전 부터 AI 기술이 우리 생활속에 점점 들어오기 시작하더니, 이제는 없어서는 안될 존재가 되어버렸다. ChatGPT가 없으면 업무가 힘들어지는 시대가 되어가고 있다. 우스갯소리의 주제가 되었던 Siri와 같은 음성인식앱들은 이제 실시간으로 통역을 해주는 시대까지 들어섰다. 기업들은 이제 시대에 뒤쳐진다는 느낌을 주지 않기 위해서라도 AI 기술을 열심히 도입하고 있다. 이전엔 어플리케이션 개발만 할 줄 알면 됐던 개발자들도 AI 툴 하나는 다룰 줄 알아야 하는 시대가 오고 있다. AI 기술의 보편화가 이미 일어나고 있다는 것이다. 이를 위해서라도 이제는 개발자들도 AI 기술을 알아야 한다. 그런 의미에서 이 책은 의미가 있다.

### 이 책의 구성

이 책은 작가가 AI 기술에 대해 2015년부터 잡지사에 기고한 글을 모은것이다. 그러다 보니 논리적인 서사의 구조는 아니지만, 큰 카테고리 별로 기술을 모아두고, 설명을 잘 해둔것 같다. 일종의 옴니버스식 구조라고나 할까. AI 기술에 대한 기초부터 설명해주진 않지만, 넓은 시각에서 AI 기술에 대한 키워드나 개념을 파악하기에 좋다. AI 기술에 대한 ‘지대넓얕’ 책 이라고 비유하면 좋겠다.


### 이 책을 읽으면 좋을 사람

이 책은 어렵다. 명확한 개념 설명을 위해 수식과 수학을 많이 나열한다. 그래서 기초 지식이 없다면 읽기엔 어려울 것이다. 그리 친절하게 작성된 책은 아니다. 이 점을 염두에 두고 책을 고르면 도움이 될것이다.

- AI 수업을 들은 학부생
AI 수업을 들었으나, 이론적인 내용만 학습한 상태의 학부생이 내용을 정리하는 차원에서 읽으면 좋을것 같다. 
- AI로 기술스택을 확장하고 싶은 개발자
AI에 대해서 기초는 알고 있으나, AI에 관련된 기술이 어떤것이 있는지는 잘 모르는 개발자가 학습하면 좋을것 같다.
특히 여러가지 키워드를 익히기 좋아서,  필요한 경우 해당 키워드를 깊게 공부하면 될것 같다.
- 이미 AI 기술에 익숙해진 AI 엔지니어
본인이 알고 있는 AI 기술에 대한 개념들을 점검하기 좋은것 같다.


### 나가며

사실 이 책을 소화하기엔 버거운 수준이었다. 특히나 수식을 이해할 수 있는 레벨이 아직은 아니다 보니 설명만 가볍에 읽고, 이러한 개념이 있구나 하는 수준으로만 넘어간 상태다. 하지만 대략 AI 기술이 어떤것이 있고, 이런 기술을 읽고 이해하려면 어떠한 공부가 필요한지는 대략적으로 감을 잡을 수 있었던 시간이었다. 좀 더 수학과 기초 AI 개념에 대해 학습하고 다시 도전해봐야겠다. 특히 키워드 위주로 어떤것이 있고, 어떤 개념인지는 학습 할 수 있어서 좋았던것 같다. 적어도 긱 뉴스에서 이 책에 나온 단어들을 만난다면, 그렇게 낯설게 느껴지진 않을것 같다

인공지능, 머신러닝, 딥러닝, 강화학습, LLM, GPT...

우리나라 국민에게 인공지능은 알파고가 이세돌과 바둑 대전을 할 때, 크게 체감을 하고 그 이후에는 OpenAI 社의 ChatGPT 등장으로 본격적으로 대중화되었습니다. 

또한 공공기관에서 모든 정보화 사업, 혹은 시스템에 "AI"를 적용하는 것은 거의 필수처럼 되었습니다. 

 

AI는 모델의 발달과 각종 트렌드를 거치며 점점 고도화되어 가고 있습니다. 인공지능이 인간의 지능을 초월하는 "강"인공지능의 특이점은 2045년에 오는걸까요. 이 시점이 되면 인간과 AI의 공존은 어떤 전환점을 맞이하게 될까요.

 

AI의 시대에 살고 있는 우리는 인공지능을 보다 더 잘 이해하고, 잘 개발하고, 잘 써야할 의무와 책임이 있습니다. 저 역시 AI를 잘 알고 싶어서 AI에 대한 책들을 관심있게 보는 편입니다. 

 

그중에서 최근에 접한 "AI 딥다이브"는 책 제목처럼 AI를 겉핡기로만 쉽게 다루는 여타의 책들과는 달리 AI의 여러 화두에 좀더 깊이 있는 고찰을 할 수 있도록 배경지식과 여러 연구들을 내용으로 풀어내어 전문적인 지식을 얻을 수 있는 책이었습니다.

 

이 책의 저자인 "오카노하라 다이스케" 씨가 논문, 뉴스 등을 읽으면서 2015년 7월부터 일본 「닛케이 로보틱스」 지에 매달 연재했던 글을 모아서 편집한 책이어서 그런지 더욱 깊이가 있게 주제들이 다뤄진 것 같습니다.

 

Part 1은 지능과 딥러닝이 무엇인지에 대해 다뤘습니다. 인공지능의 원리와 사람(뇌) 학습시스템을 다루며 인간의 사고를 모방한 인공지능에 대한 이해를 할 수 있도록 구성되어 있습니다. 

Part 2는 여러 학습기법들과 강화학습, 심층 신경망 학습의 고속화, 저전력화, 인프라 관련된 이슈를, Part 3에서는 생성모델과 어텐션 기법, Part 4에서는 이미지/음성, 공간 생성과 인식, 언어, 제어, 시뮬레이션, 게임, 생명과학, 로봇 등의 응용에 대해서 논문을 찾아보지 않으면 따라가기 어려운 최신 기술과 원리에 대해서 소개하고 있습니다.

 

무엇보다 이 책에서 좋았던 점은 AI 의 다양한 모델들의 원리를 논문처럼 수식과 함께 설명하여 마치 현 시점에서의 AI Review 논문을 보는 듯한 느낌이 들었고, 각 주제에 대하여 통찰력 있는 분석을 통하여 장점과 한계, 발전방향을 소개함으로써 AI 분야의 동향을 이해하고자 하는 사람들과, 특히 AI 분야에 대한 연구주제를 고민하는 대학원생에게 정말 필요한 책이라는 생각이 들었습니다. 

 

몇 백개의 논문을 찾아서 공부해야 익힐 수 있는 개념들을 한 책에 모아서 엮어준 점도 좋았습니다. 다만 주제별 분량이 3~4 페이지 정도 분량이기 때문에 책을 읽다가 관심이 가는 분야에 대해서는 웹서핑, 관련 논문 추가 검색 등을 통해서 더 공부해보는 것도 추천드리고 싶습니다.

 

  "한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

개인적으로 'AI를 잘 아는가?' 라는 질문에 나는 아직 '아니오' 라고 대답을 하고 있다.

 

전문적으로 AI 엔지니어로 개발을 하고 있지 않기 때문이다. 해당 도서도 내가 아직 읽기엔 어려울 수 있겠다 싶은 제목이었다. 하지만, 전체적인 흐름은 안다고 생각해서 한번 책을 펴보았지만, 역시나..어려운 부분이 많은 책이었다.

 

우선, 목차 부터 확인해보자.

 

[1부: 지능이란 무엇인가, 딥러닝이란 무엇인가]

1장: 인공지능의 원리 해명
2장: 사람의 학습

[2부: 학습 기법]

3장: 학습 기법
_3.1 학습의 엔진: 수리 최적화 Adagrad, RMSProp, Adam
_3.2 랜덤 푸리에 피처 함수: 규모가 큰 문제에도 커널 기법 적용 가능
_3.3 정규화: 일반화 능력 얻기
_3.4 오차 역전파 기법에 의한 기댓값 최대화
_3.5 오차 역전파를 사용하지 않는 학습 기법: Feedback Alignment, Synthetic Gradient, Target Prop
_3.6 연속 학습: 과거의 학습 결과를 잊지 않고 새로운 작업 학습
_3.7 예측 학습
_3.8 진화 전략
_3.9 메타 학습: 학습 방법을 학습하는 MAML과 뉴럴 프로세스
_3.10 음함수 미분: 경삿값 계산에서 계산 그래프를 워프
_3.11 비지도 표현 학습: 다른 뷰 간 상호 정보량 최대화
_3.12 지식 증류: 거대 모델의 지식 추출
_3.13 마스크 오토인코더: 이미지 인식에서 사전 학습 혁명의 가능성

4장: 강화 학습
5장: 고속화, 저전력화, 인프라

 

[3부: 모델과 아키텍처]

6장: 생성 모델
7장: 기억의 얼개


[4부: 애플리케이션]

8장: 이미지
9장: 음성
10장: 공간생성/인식
11장: 언어
12장: 제어
13장: 시뮬레이션
14장: 게임
15장: 바이오 생명 과학
16장: 로봇

 

목차는 위와 같고 3장은 세부 목차를 남겨두었다. 이유는 목차만 보아도 일반인이 읽기엔 난이도가 있는 목차이기 때문이다.

 

그래도 1장에 인공지능 원리와 해명 부분에서는 재미있는 이야기들이 나와서 흥미를 이끌어 주었다. 바로 인공지능 학습에서 블랙박스 영역이라고 말하는 설명하기 어려운 부분에 대해서 해당 저자는 설명이 가능한 현재 수준에 대해서 언급해주었다.

 

그리고 비정형 데이터 중 내가 제일 많이 본 데이터는 바로 텍스트 데이터이다.

 

하여, 목차 중 '언어' 부분을 중점적으로 보았고, 보고 나니 타 목차들이 어떤 컨셉으로 풀어낸 것인지 명확하게 이해할 수 있었다.

 

우선 해당 도서에서 언어부분의 시작은 seq2seq 부터 설명을 시작한다.

 

가장 기초인 word2vec이나 TF-IDF 로 시작하지 않는 것을 보면 기초부터 말해주는 책이라고 보기 어려운 부분이 있었다.

 

과거 NLP 모델들과 seq2seq에 관련되어 정리를 해주고 해당 모델은 어떤 메커니즘으로 학습하고 추론하는지 간단하게 말해주는 부분이었다.

 

그 이후는 Bert가 나오고 그 다음은 자연어를 배운 사람은 알겠지만 그 유명한 트랜스포머 모델에 대한 이야기가 나온다.

 

당연한 수순이긴 하지만 처음 보는 사람에게는 어려운 부분이 있었을 것이다. Bert 모델이 처음 1회 학습할 때 비용이 얼마나 들었는지, 그리고 파라미터는 얼마나 되었는지 등 현재는 어떤 모델이 더 성능이 좋은지에 대해 나와있다.

 

이렇듯 해당 도서는 전체적인 AI의 동향과 추가적으로 해당 영역에서 가장 중요한 모델이나 알고리즘에 대해 설명해주는 도서라고 보면 될 것 같다.

AI 기술에 대해 키워드 위주로 꼼꼼하게 설명하고 있는 책입니다.

73개의 주제로 나눠 설명하고 있는 만큼 AI 트렌드, 기술에 관심 있는 분들에게 추천드립니다.

특히 Part 04에서는 현재 AI 기술이 어느 분야에서, 어떤 기술을 어떻게 사용하는지 나와있어 동향을 파악하기도 좋습니다.

딥러닝, 머신러닝 기술을 알고 있고 관심이 많은 분들께 추천드리는 책입니다.

 

"한빛미디어 서평단 < 나는리뷰어다 > 활동을 위해서 책을 제공 받아 작성된 서평입니다."

 

 

제목이 AI 딥 다이브라서 AI 이론에 대해서 아주 자세히 설명하는 책인 줄 알았는데,

기술에 대해서 설명은 하지만 인공지능을 잘 모르는 일반인이 읽어도 어느 정도 이해할 수 있을 정도로 쉽게 쓰여진 책입니다.

저자의 말에 의하면 이 책에 있는 내용은 일본 닛케이 로보틱스라는 잡지에 기고했던 글과 논문을 모아 출판한 것이라고 합니다. 신문이나 잡지는 중고등학교 이상의 교육을 받은 사람이면 누구나 읽고 이해할 수 있는 수준으로 글이 작성됩니다. 그래서 그런지 내용이 그리 어렵지 않으면서도 심도있는 내용을 놓치지 않고 있는 아주 좋은 글들이 모여 있습니다.

책의 내용은 16개 파트에 74개의 주제로 나누어져 있으며 1개의 주제의 분량은 2-3페이지정도로 짧은 시간을 들여 가볍게 읽을 수 있는 수준입니다. 그래서 작정하고 공부를 해야겠다 라는 마음이 아니라 잠깐의 시간을 내서 틈틈이 읽기 좋습니다.

이 책의 가장 큰 장점은 번역의 매끄러움과 꼼꼼한 역자 주석입니다. 번역자의 주석이 각 글에 잘 정리되어 있고 인공지능을 잘 모르는 사람이 읽어도 이해할 수 있도록 하기 위해 많은 노력을 기울인 정성을 볼 수 있습니다. 그 덕에 상당히 깊이 있는 내용을 다루는 글도 막힘없이 술술 읽히는 책입니다.

이 책은 인공지능과 관련해서 기초부터 최신정보 그리고 향후 주목할 만한 기술까지 모두 다루고 있습니다. 그럼에도 장황하지 않고 간결하며 이해하기 쉬운 책입니다.

AI 기술은 발전이 너무 빨라서 따라가기 어려운데 이 책을 통해서 최근 AI 기술의 동향을 빠르게 파악할 수 있었습니다.

인공지능 기술에 관심 있는 현업자나 학생, 그리고 인공지능에 대해서 알고 싶은 일반인 모두에게 추천합니다.

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

책의 제목은 굉장히 매력적이다. '오차역전파부터 확산모델까지'라는 문구는 AI 연구의 넓은 범위를 함축적으로 보여주며, '73가지 기술 이야기'라는 부분에서는 다양한 주제를 담고 있는 걸 암시한다. 저자가 2015년부터 일본 잡지 〈닛케이 로보틱스〉에 연재된 글들을 모아 편집한 것으로, AI 분야의 최신 발전과 주요 연구 결과를 신속하고 깊이 있게 다루고 있다. 저자는 AI 기술 발전의 중요한 특징으로 속도, 무경계성, 그리고 창의성을 강조하는데, 이러한 특징들이 책의 전반에 걸쳐 잘 반영되어 있다

책은 크게 네 개의 부(Part)로 구성되어 있으며, 각 부는 지능과 딥러닝의 본질, 학습 기법, 모델과 아키텍처, 애플리케이션을 다룬다. 이론적 설명과 함께 실제 적용 사례를 풍부하게 포함하고 있어, 독자들이 딥러닝의 기본 원리부터 강화학습, 생성모델, 이미지, 음성, 언어 처리 등 딥러닝의 기초부터 최신 연구 동향까지 다양한 분야의 응용을 폭넓게 다룬다.

 

책의 각 장은 각각의 주제를 짧고 간결하게 다루고 있으며, 각 주제에 대한 심도 있는 이해를 돕기 위해 논문 출처와 주석이 잘 정리되어 있다. 다만, 주제별 내용이 2~3페이지로 압축 정리되어 있어 머신러닝 및 딥러닝에 대한 사전 지식이 없는 독자들에게는 다소 어려울 수 있으리라 생각된다.

AI분야로 딥다이브 하기 위해서는 다양한 영역에서 기본 지식을 탄탄히 다져놓는 것이 중요한 것임을 새삼 느끼면서 읽었다.

 

책은 한번에 처음부터 끝까지 읽어 나가기 보다는 필요한 주제나 관심 분야가 생길 때 참조해서 보면 도움이 많이 될것 같은 구성이다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

가끔 우리는 우리가 뭘 모르는지를 모를 때가 있다. 뭘 모르는지 알면 검색이라도 해보고 ChatGPT에게 물어라도 볼 텐데 뭘 모르는지 모르니 찾아보지 못하는 그런 답답함을 다들 경험해 봤을 거라고 생각한다. 그렇게 열심히 기억을 헤집으면서 적절한 조합으로 검색을 했을 때 내가 원하던 그 개념을 뜻하는 단어, 키워드를 발견하면 그 뒤에는 일사천리다.

 

이 책은 특정 시기나 기술에 국한되지 않는 대부분이 AI 관련 키워드를 정리했다. IT 분야에서도 AI는 매일매일이 급변하고 있다. 이 모델보다 성능이 좋은 저 모델보다 가벼운 그 모델과 같은 식으로 말이다. 그렇기 때문에 전체적인 개념을 아우르는 핵심 키워드를 모은 자료는 굉장히 소중한데 이 책이 그 역할을 하고 있다.

 

기본적으로 비슷한 주제를 모아 하나의 단원으로 만들었지만 관심 있는, 궁금한 부분만 골라서 읽어도 충분하다. 단 아예 배경지식이 없는 사람이 읽기는 조금 어렵다. 기본적으로 AI 기술이 수학과 여러 가지 이론 바탕으로 이뤄진 만큼 책에선 수학식을 많이 사용하고 있다. 장황하게 설명하는 대신 간략하게 수식으로 설명하는 것이 이를 읽을 수 있는 사람과 그렇지 않은 사람에게 와닿는 느낌이 많이 다를 것이다.

 

AI 필드에 경험이 있는 분들에게 이 책은 놓쳤던 최신 트렌드를 단숨에 따라잡고 다음 연구 주제를 고를 수 있게 도와주는 좋은 교보재가 될 것이다.

 

 

한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
AI 딥 다이브
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
AI 딥 다이브
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
AI 딥 다이브
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1