실전 아파치 카프카

innur***l2021-04-19

한빛미디어의 “실전 아파치 카프카”를 리뷰합니다.

작년에 빅데이터 IoT 시스템 구축 프로젝트에 참여하면서, 그동안 하둡과 카프카, 스파크에 대해서는 가벼운 지식만이 있었을 뿐이었고, 당시 클라이언트 업무를 하고 있어서 프로젝트를 참여한 김에 학습을 하고 세미나를 진행한 적이 있었습니다. 대학원 전공도 웹서버 클러스터링이어서 어떤 분야보다 관심이 많이 가지게 되었습니다. 이번에 “실전 아파치 카프카” 리뷰를 하게 되어 도서를 리뷰함과 동시에 다시 한번 학습 내용을 정리할 수 있는 좋은 기회가 되었습니다.

결론적으로 말씀 드리면 하고자 “실전 아파치 카프카”는 굉장히 만족스러운 도서 내용을 가지고있습니다. 쿠버네티스나 도커, 하둡과 같은 주제를 다루는 도서들은 많은데, 아쉬웠던 부분은 인프라 측면 위주로 다루는 경우가 많았습니다. “실전 아파치 카프카”는 Kafka 자체 뿐만 아니라 Kafka와 연동되는 시스템 만드는 것을 실습하고 Kafka를 실제 외부 시스템들과 연동하여 구축하는 것에 도서 후반기에 많은 비중으로 다루고 있습니다. 가령 카프카를 주제로 한다면 Producer와 Consumer 뿐만 아니라 connector와 stream에 대해서도 다뤄야 하기에 카프카 기본 컴포넌트들에 대해서 얼마나 충실하게 다루고 있는지 살펴봐야 하고, 실제 IoT나 빅데이터 시스템에 응용할 있는지를 살펴봐야 하는데, 본 도서는 카프카 자체에 대한 내용의 충실성 뿐만 아니라 5장부터 “Part 2 실전 아파치 카프가”라는 주제를 가지고 11장까지 카프라를 이용한 인프라 구성과 응용을 상세히 다루고 있어서 높은 점수를 주고 싶습니다.

Kafka publish-subscribe

카프카를 다루는 도서나 블로그에서 도입으로 나오는 내용이 탄생 배경으로 LinkedIn 개발자에 의해서 개발되었고 LinkedIn 로그 처리와 웹사이트 활동 추적을 목적으로 적용되어 사용되었다는 내용입니다. 분산 메시징 시스템으로써 2011년에 오픈소스로 공개되었고, 대용량의 메시지 처리에서도, 특히 실시간 로그 처리에 특화된 아키텍처 설계를 기반으로 합니다.

근래의 사물인터넷 시스템이나 빅데이터 시스템과 같이 메시지의 높은 동시성으로 인해 대량의 데이터를 높은 처리량과 실시간으로 처리하기 위해 만들어졌기 때문에 기존 RabbitMQ나 ActiveMQ와 같은 메시징 시스템들보다 우수하다고 합니다.

그리고 실제로 많은 대용량 메세지를 다루고 있는 시스템에서 카프카를 많이 사용하는 것으로 알려져 있습니다. 이러한 이유로로 채용 시장에서도 하둡이나 카프카, 스파크와 같이 대용량 메세지 처리 시스템에 대한 유경험자에 대한 구애가 많은 것으로 보입니다.

Kafka는 발행-구독(publish-subscribe) 모델을 기반입니다. RabbitMQ와 같은 기존 MQTT Broker에서의 Pub(발행인)과 Sub(구독자) 간의 메세징 중계 모델과유사하고 따라서 MQTT Broker의 producer, consumer, broker와 같은 구성입니다. 다만 10장에서 언급되는 내용으로 IoT 사물인터넷의 경우 MQTT 메세징을 많이 사용하는데, MQTT 브로커가 kafka에서는 존재하지 않기 때문에 IoT 시스템을 구성한다면 MQTT 브로커와 연동해야 겠지요.

KafkaProducer

카프카의 브로커는 토픽(topic)으로 메시지를 관리합니다. 프로듀서(Publisher)는 브로커에 메세지를 보낼 뿐, 누가 그 메시지를 이용하는지 신경 쓰지 않습니다. 퍼블리셔가 보낸 메시지는 브로커 내 토픽(Topic)으로 메세지를 생성하여 등록합니다.

브로커가 전달받은 메시지를 토픽(topic)으로 분류하여 쌓아 으면, 해당 토픽을 구독하는 컨슈머(consumer)가 메시지를 가져가서 처리하게 됩니다.

KafkaConsumer컨슈머(Subscriber)는 여러 개 존재하는 토픽(Topic) 중 하나를 선택하여 메시지를 받습니다. 카프카 컨슈머 어플리케이션 개발을 4.5장에서 직접 구현해봅니다. 1초마다 받은 메시지를 콘솔에서 표시하는 어플리케이션 예제입니다.

Kafka 응용

Part 2 실전 아파치 카프카에서는 실제 응용에 대해서 내용을 다룹니다. 5장 카프카 사례에서 IoT 시스템과 로그 시스템을 예로 들어 카프카를 적용하여 응용한 것을 설명하고 있습니다.

이는 뒤에 7장과 9장, 10장에서 빅데이터 시스템과 IoT 시스템에 대해서 더욱 자세히 다루고 있습니다. IoT 시스템과 같은 경우는 기존 MQTT 기반의 브로커들과의 연동도, 왜 연동이 필요한지, 어떻게 연동할 수 있는지 내용을 서술하고 있습니다.

스파크 연동에 대해서는, 실제로 빅데이터 시스템을 구축한다면 하둡과 스파크와 연동해서 구성될 가능성이 큽니다. 9장에서는 스파크의 structured streaming에 의한 스트림 처리라는 주제로 스파크와 연동하는 것을 다룹니다. 스파크의 데이터 처리 모델과 RDD, DataFrame과 Dataset에 대해서 1장을 아낌없이 설명하고 있습니다.

독서를 마치고 나서

베타리더의 글 중에서 저자의 포스가 느껴진다는 소감을을 보았는데, 저 역시 그러한 느낌을 강하게 받았습니다. 어떤 프레임워크나 라이브러리든 API 문서가 제일 좋은 가이드 문서인데, 보통 API 문서는 딱딱함의 결정체이고 내용에 대한 이해가 결코 쉽진 않기 때문에 도서 구매를 통해서 좀더 쉽게 이해하기 위해서 가이드를 받는다고 생각합니다. 카프카의 경우 브로커 역할을 하기 때문에 카프카 자체만을 포커스해서 서술했다면 부실한 도서라는 오명을 받을 수 있습니다. 허나 IoT나 파일, RDBMS와 스파크까지 여러가지 상황을 고려해서 응용하는 것에 많은 지면 내용을 할애했다는 것에 매우 만족스러운 도서이고, 다시 한번 저자들의 내공을 알 수 있는 도서 였습니다.

현재의 대규모 사이트에는 카프카 적용이 기본이 되는 것으로 보입니다. IoT 뿐만 아니라 빅데이터 시스템, connected-car 등 대량의 데이터를 실시간으로 처리해야 하고, 다른 에코 시스템과 원활히 통합할 수 있어야 하는 요건에 부합되어 앞으로도 카프카의 적용과 활용, 확장은 기대할만 합니다. 저자들의 내공이 대단하다는 느낌을 앞서 말씀 드렸는데, 그들의 풍부한 경험과 지식을, 도서의 API 활용과 응용에 많은 지면을 할애줘서 감사하다는 인사를 건네고 싶고, 이런 좋은 도서가 폭넓게 읽혀져서 플랫폼 구축과 활용에 초석이 되는 도서가 되기를 바라겠습니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

shsh0***l2021-04-19

카프카의 뿌리부터 차근차근 실무까지 알아갈 수 있는 책

gangs***l2021-04-19

카프카의 기술적인 부분 뿐만 아니라 사용 사례와 그것을 직접 구현해보는 내용까지 담겨있다.

gand***l2021-04-18

실무에서 KAFKA를 사용해야 할 경우 유용한 책!

young***l2021-04-18

[실전 아파치 카프카] 도서 리뷰

실전 아파치 카프카 :: 카프카 입문서 책, 배경부터 적용까지

soccer3***l2021-04-11

궁금했던 카프카

jrcfore***l2020-03-28

실전 아프카 전체를 손쉽게 음미할 수 있는 책

【아파치 카프카 그 시작을 알리는 책】

요즘은 바야흐로 빅데이터 시대라고 해도 과언이 아니다. 아니, 정확히는 몇년 전부터 이미 우리는 광활한 빅데이터라는 세상 속에서 살아가고 있다. 이런 시대에 예나 지금이나 가장 중요한게 있었으니 바로 이런 광활한 데이터를 체계적으로 관리하는 방법일 것이다. 여기에 더불어 IT 시대에는 이런 광활한 데이터를 이용한 서비스의안정적인 서비스를 체계적으로 관리하고 보장할 수 있는 기술은 과히 필수라 해도 과언이 아닐 것이다. 그래서오늘 블로거가 리뷰하게 될 도서는 이러한 시대의 흐름과 정서를 반영한 훌륭한 기술인 '아파치 카프카'와 관련된 도서를 리뷰하고자 한다. (참으로 오랜만에 리뷰를 하는것이여서 상당히 긴장된다.)

【어떤 독자를 위한 책인가】

'실전 아파치 카프카'는 분산 메시지 방식 + 체계적인 빅 데이터를 관리하기에 훌륭한 기술이다. 더욱이 자바 기반의 다양한 예제가 오픈 소스로 이미 공개되어있고 국내에도 다양한 커뮤니티가 이미 구성되어있다. 그렇기에 안정적인 메시징 큐잉 방식과 더불어 스케일 아웃이 가능한 기술을 필요로하는 서비스를 개발하려는 사람들에게는과히 필수 기술이라 할 수 있다. 더욱이 이번에 출간된 '실전아파치 카프카'는 아파치 카프카의 기원부터 시작하여 사용사례, 그리고실제적인 서비스 아키텍처 설계와 구현론, 그외 부가적인 기능들 추가를 통해 아파치 카프카를 모르는 사람도위 도서를 충분히 학습함으로써 모든 서비스에 응용할 수 있는 카프카의 전신이 되는 기초 지식을 잘 제공하고 있다.

【책의 구성】 '실전 아파치 카프카'책의 구성은 어떠한가.

이 책은 솔직히 카프카만을 위한 책이 아니다. 블로거가 느끼기에는 이 책은 메시징 큐잉 분산 처리 시스템을 사용하려는 모든 사람이 읽어보면 좋은 그런 내용들로가득 차있다. (물론 주제는 카프카에 관한 내용이 중심이지만 블로거의 시각으로 봤을 때, 이 내용들은 모든 분산 처리 시스템에 근간이 되는 설명들로 이루어져있다.) 아~ 서두가 길었으니 책의 구성 설명으로 돌아가도록 하겠다. '실전 아파치카프카'는 카프카란 무엇인지에서 시작하여 탄생 배경, 이를이용한 서비스, 개발 환경 구축, 카프카에서 다루는 스르림처리부터 데이터 허브 설계, 구축에 이르기까지 거의 카프카의 시작과 끝 그 모든 것을 다루고 있다는책이라고 봐도 과언이 아니다. 더욱이 위 서는 자바로 수록된 다양한 예제와 실습 자료들을 제공하고 있기때문에 어느정도 자바 언어에 대한 특징을 잘 이해하고 있고 스프링과 같은 프레임워크를 사용해본 경험이 조금이라도 있다면 쉽게 책을 따라갈 수 있는구성으로 이루어져있다. 특히 마지막 11장에서 다루는 '카프카 능숙하게 사용하기' 는 카프카를 사용할 때 알아야할 내용들을잘 정리해두어 학습한 후 알차게 마무리지었다는 강한 여운을 남겼다. 특히 책 중간 중간 볼드체로 키워드등을 강조함으로써 카프카 관련 기술에서 사용하는 (혹은 카프카에서만 사용하는) 용어들을 잘 정리하였고 책 마지막에도 언제든 쉽게 참고할 수 있게 인덱스를 정리해둔 점 역시 독자가 책을 통해충분히 많은 지식을 얻어 갈 수 있길 바라는 저자의 많은 배려를 느낄 수 있는 그런 책이였다.

【실전 아파치 카프카를 읽으며…….】

솔직히 분산 큐잉 메시지 시스템이라고 하면 많은 사람들이 데이터나 저장할때쓰이는 플렛폼이구나 라고 생각하기 쉬운것 같다. 블로거가 멘토링 하는 대다수의 멘티들 역시 그렇게 생각하는친구들이 적지 않았으니 말이다. 하지만 스케일이 커지고 중앙 집권적인 서비스를 구현해야할 때, 카프카만큼 진가를 발휘하는 기술을 아직까지 본 블로거는 본적이 없는듯 싶다.그만큼 카프카를 잘 알아두면 매력적인 개발자인 동시에 훌륭한 대규모 서비스를 지탱할 수 있는 기술일 가졌음을 입증하는 것이라 생각된다. 더욱이 카프카는 오픈 소스 프로젝트이기에 카프카와 관련된 시스템을 서비스에 맞게 튜닝하는 것 역시 가능하며 (물론 능력만 된다면 카프카 프로젝트에 참여할 수 있는 기회도 있다.!) 이를튜닝한 프로젝트를 다양한 곳에 기부하는 것 역시 가능하다. 그렇기에 카프카를 모르는 개발자들도 꼭 이책이 아니더라도 카프카를 알아 가길 희망해본다.

kim1023***l2020-03-27

실전 아파치 카프카 - 애플리케이션 개발부터 파이프라인, 사물인터넷 데이터 허브 구축까지

bae***l2020-03-27

실전 아파치 카프카

메세지 브로커, 분산 메세징 시스템에 최근 많은 관심을 가지고 있어 RabbitMQ, Celery, 그리고 이번 서적의 주제인 Aapache Kafka에 대해서 사용해보고 있다.
아래에서 소개할 서적을 받기 전까진 구글링하며 Quickstart를 보고 익히고, 도큐먼트와 여러 기술 블로그를 참고하곤 했다.

이번 3월에는 실전 아파치 카프카 서적을 통해 공부하게 되었다
이 책은 한빛미디어 리뷰어 활동으로 제공받아 읽을 수 있었다.
틈틈히 읽으며 따라해보고 있는데 리뷰도 써야하니 잠시 책의 중간지점에 멈춰 리뷰를 쓰게 되었다

나에게 있어서 이 책의 장점은 크게 3가지로 볼 수 있다.

카프카를 써야하는 이유를 설명한다
카프카 탄생 전에는 무엇을 사용했는지 열거하고 그 도구들과 차이점을 꼼꼼히 비교한다.
책에 있는 코드를 따라 치는 전개

구글링에 의존해서 카프카를 익힐때에는 왜 이것을 사용해야 하는지, 다른 메세징 시스템이 있음에도 링크드인이 개발한 이유를 잘 모른 채로 그저 카프카가 재밌어보이고 신기해서 공부한 경향이 있었다.

그러나 이 책을 통해 카프카의 뿌리부터 배울 수 있게 되었다.

1장에서는 카프카의 사용방법이 아닌, 탄생 배경, 다른 메시징시스템과의 특징을 통해 어떠할 때 카프카를 써야하는지 알려준다.
2장에선 송수신, 파티셔닝, 레플리카 등의 카프카 기초지식에 대해 설명한다.

이후, 카프카 패키지를 설치하고 실행, 동작확인, 종료에 대한 내용을 다루며 카프카의 Java API를 이용한 어플리케이션 개발을 진행한다.

이외에도 Kafka Connect와 Kafka Streams, Apache Spark에 대해서 다루게 된다.

지금까지 국내 카프카 서적을 추천받을때에는
카프카, 데이터 플랫폼의 최강자, 오라일리의 카프카 핵심 가이드 를 받곤 했다.

(한글로 된 책이 별로 없어 카프카 국내 서적의 추천 목록이자 전체 목록이라고도 할 수 있겠다)

나와 같이 아파치 카프카, 분산 메세징 시스템에 관심이 있어 책을 알아보고 있다면
강력하게 실전 아파치 카프카를 추천해주고 싶다.

다른 서적과 비슷하게 가격대 있는 서적이지만 배움에 있어 충실한 값어치를 하는 것 같다.

kangba***l2020-03-27

[도서리뷰] 한빛미디어 '실전 아파치 카프카'

데이터 엔지니어 채용공고를 보다보면 Elasticsearch, Hadoop과 더불어 많이 보이는 것이 Kafka 입니다. 이러한 서비스를 통해 데이터 파이프라인을 설계, 구축, 운영해본 경험이 있는지에 대해 물어보는 경우가 많습니다.

한빛미디어에서 나온 ‘실전 아파치 카프카’를 통해 카프카에 대해 알아보고 실제로 카프카를 설치, 구축하고 애플리케이션을 만들어보면서 카프카 경험을 쌓을 수 있습니다.

책은 크게 파트1 도입 아파치 카프카와 파트2 실전 아파치 카프카로 나누어져 있습니다.

파트1에서는 카프카의 탄생배경에 대한 이야기를 알 수 있고, 카프카를 이용하는 데 알아야 할 기본 용어에 대해서도 잘 설명해주고 있습니다. 카프카에서 제공하는 자바 API를 통해 카프카와 메시지를 송수신하는 애플리케이션을 만들어볼 수도 있습니다.

카프카 구축이나 애플리케이션 개발 환경 구축에 대해서도 친절히 방법을 소개해주고 있기 때문에 어렵지 않게 따라 할 수 있습니다.

파트2에서는 좀더 실질적인 카프카의 적용 사례들을 알아보게 됩니다. 카프카를 통해 어떤 활동들을 할 수 있고, 그것에서 해결해야 할 과제에 대해 생각해 볼 수 있는 챕터들이 기술되어 있습니다. 우리가 잘 알고 있는 우버의 사례도 나와있으며 ChatWork과 Yelp의 사례에 대해서도 이야기 하고 있습니다. 후반부로 갈 수록 카프카 실습들이 많이 나와 이론에만 그치지 않고 몸으로 습득할 수 있어 좋았습니다.

마지막에는 카프카를 더 능숙하게 사용하기 위한 몇 가지 주제들을 더 소개해 줍니다. 카프카를 더욱 전문적으로 사용하고 싶은 독자들에게 유용합니다.

책을 읽고나니 서럽장에 보관중이던 라즈베리파이를 꺼내 사물인터넷 데이터허브 구축에 써보면 좋겠다 생각했습니다.

seungd***l2020-03-27

카프카를 활용한 개발의 시작을 알려주는 책

blusk***l2020-03-26

기본부터 고급까지 배울수 있는 책

올해 다시 시작된 한빛 미디어의 "나는 리뷰어다" 에서 처음 받은 책은 바로 카프카 관련 책이다.

한번쯤 어떻게 사용하는 것인지 공부 해봐야지 라고만 생각을 하고 있었는데 이렇게 책을 읽어볼 기회가 생겼다.

메세지 큐를 사용하는 어플리케이션을 만들기 위해서 잠깐 찾아서 써본 이후로 한번도 손대지 않았는데 그게 벌써 2년이나 지났다. ^^;

지금 이 글을 쓰는 시점에서 이 책을 다 읽어보지는 못했다. (실습을 해봐야 하기에...)

카프카의 배경부터 시작부터 설치까지 과정이 워밍업이라고 한다면 그 이후부터는 실제 사례들 중심으로 구성 방법에 대해서 설명을 해주고 있다.

특히 카프카가 어떤 기능이 있고 어떤 용도로 쓰일수 있는지에 대해서 링크드인 사례를 보여준 부분은 재미있었다.

그리고 이 책의 장점이라고 할수 있는 부분은 바로 다음과 같은 내용들이다.

왼쪽 사진은 실제 카프카로 구현하는 방법에 대해서 설명을 해주고 있는 부분이다. 어떻게 구현 될수 있고 구현을 하기 위해서는 어떤 점을 생각해야 하는지 알려준다. 그리고 후반부에는 소스레벨, 실제 실행 로그들도 보여준다.

오른쪽 사진을 보면 네모 박스에 "스트림 처리란?" 이라고 써있고 해당 주제에 대한 설명을 해주고 있다. 이 부분은 책 중간중간에 계속 나온다. 카프카를 사용하기 위해서 필요한 기본 지식이면서 꼭 카프카를 쓰지 않더라도 알아야할 지식들이다. 이런 내용들이 내게는 꼭 필요했고 책을 이해하는데 많은 도움이 되었다.

책을 다 읽으려면 좀더 시간이 걸릴것 같긴 하지만 잘 배워서 직접 활용해 보면 좋을 것 같다는 생각을 많이 했다.

leeseok8***l2020-03-25

훌륭한 카프카 입문서

이 책의 리뷰는 한빛미디어 ‘나는 리뷰어다’로 부터 책을 지원받아 작성된 글입니다.

kafka_practice-01

한번쯤 카프카를 공부해보고 싶었는데 마침 리뷰할 수 있는 책 중에 실전 아파치 카프카 가 있어서 지원해서 읽어보게 되었다.

작성자의 경우 예전에 하이퍼레져 Fabric 의 구성요소 중 하나가 Kafka 로 되어 있어서 그 때 잠깐 Kafka 를 건드려 본 것 빼놓고는 정말 초보적인 지식밖에 없었다. 그렇기 때문에 이 리뷰글은 입문자 관점에서 적었다고 생각하면 좋을 것 같다.

일단 이 책에서 가장 마음에 들었던 부분은 아래 사진에도 나와 있듯이 실습을 함에 있어서 기본적은 모든 환경설정을 알려준다는 것이다. 일반적으로 개발 환경 실습을 할때는 “자바8 버전을 설치하세요”, “메이븐 최신을 설치하세요”, 등에 대해서 이야기하는데, 이 책에서는 하나하나 자세히 알려주기 때문에 실습을 함에 있어서 딱히 막힘없이 진행하 수 있었던 것 같다.

특히 카프카를 설치하 때 일단 실습을 쉽게 하기 위해서 confluent 플랫폼을 선택한 점도 눈에 띄는 것 같다. 물론, 뭔가를 개발함에 있어서 설치가 가장 어려운 부분에 속하지만, 작성자의 관점에서는 일단 카프카 자체가 어떻게 돌아가는지 궁금하기 때문에 환경 구성에 대해서는 자세히 설명하면서도 쉽게 설치해서 실습할 수 있도록 유도한 부분에 대해서는 긍정적으로 생각한다.

또한 카프카의 주요 사용 방법에 대해서 설명하고 이를 하나씩 실습을 통해서 설명해 주는 것도 좋았다. 그렇게 실습하면서 카프카를 언제 사용해야 하는지, 왜 카프카를 사용해야 하는지 조금은 납득할 수 있었던 것 같다.

다만 입문자가 아닌 사람의 관점에서는 너무 쉬운 기초적인 부분만 알려주는 것 아닌가? 하는 생각이 들 것 같다. 또한 이 책 자체가 입문 하는 사람의 위주로 쓰여서 그런지, 카프카 뿐 아니라 spark, MQTT 프로토콜 등의 기초적인 부분들을 알려준다. 어떻게 생각하면 이런 부분은 조금 카프카 자체를 알고 싶어 하는 사람 에게는 쓸데 없는 설명이 아니었을까 하는 생각도 들었다.

이러한 부분을 생각해 봤을 때 총 평은 예제와 함께 실습하는 것을 좋아하는 사람을 위한 카프카 입문서 이라고 평하고 싶다.

kafka_practice-02

책의 1장은 모든 다른 여타 책과 동일하게 카프카의 역사, 카프카가 쓰이는 이유 및 유스케이이스에 대해서 설명해준다. 그 후에 카프카의 구성에 대해서 이야기 해주고, 곧바로 기본적인 카프카 설치하고 간단히 producer, consumer 를 만들어서 실습해본다.

그 후 2장에서는 1장에서 설명한 유스케이스들에 대해서 실습하는 시간을 가지게 된다. “데이터 허브로 사용하는 방법”, “스트리밍 처리하는 방법(로그 처리)”, “사물인터넷 처리하기” 의 크게 세가지로 구분해서 알려준다.

그 후 마지막장에서는 카프카를 운영할 때 주의할 점에 대해서 몇 가지 설명해주고 있으며, 부록에서는 앞에서 이야기하지 못한 몇가지 심화 개념에 대해서 설명해준다.

실습은 아래 사진과 같이 먼저 유스케이스에 대해서 설명한 후 이를 위한 환경 구축, 그 후에 카프카를 연결해서 개발해 나가는 식으로 진행이 된다. 총 실습과정은 대략 4~5 가지의 경우를 예시로 들고 있다.

kafka_practice-03

작성자의 경우 사실, 현재 카프카를 쓰는 것은 오버엔지니어링이라고 생각해서 따로 공부한 적이 없었다. 하지만 진짜로 그럴까 하는 궁금증이 있었는데 이 책을 읽으면서 더 명확해진 것 같다. (실제로 오버엔지니어링임이 틀림없다.)

카프카를 사용하기 위해선느 일단 브로커가 5대 이상 필요하다는 것 자체가 트래픽이 없는 회사(현재 작성자는 창업 시작단계)에서는 돈만 많이 들고, 개발자 자체도 몇명 없는데 카프카까지 관리하려면 정말 힘들 것이다.

하지만 이런 판단을 하기 위해서는 어느 정도는 공부를 해보고 리서치를 해 본 후에 결정해야 한다고 생각한다. 그런 관점에서 보았을 때, 이 책을 한번 실습해보고 읽어보는 것이 카프카를 쓸지 안 쓸지 결정할 때 도움이 될 것으로 보인다.

또한 개인적으로는 책이 쉽게 쓰여 있어 입문자 입장에서는 재밌게 실습해볼 수 있었던 것 같다. (물론 어느정도의 리눅스 지식은 있어야 한다.) 다시 한번 카프카에 입문하고 싶다면 이 책을 정말 추천하고 싶다.

binsoop***l2020-03-23

물 흐르듯이 카프카를 이해하도록 돕는 책

> 진행에 앞서

책을 리뷰할 기회가 오랫만에 주어졌다. 여러 책을 고르던 중 전혀 모르는 분야를 보고 싶다는 생각이 들었고, 그 책의 이름이 APACHE KAFKA라는 것이었다. 카프카가 뭐지? 어디에서 들어본듯 싶기도 했고, 아닌듯 싶기도 했고, 분명한건 지금은 그게 무엇인지 모른다는 것. 그래서 새로운 분야를 접하고 싶다는 생각에 시작하게 되었다. 그리고 뒤에서 언급하겠지만, 어느정도는 이 책을 읽기 시작했을 때의 목적을 달성했다고 보는 것이 맞는 듯 하다.

> 책에 대한 간단한 정보

이 책은 '실전 아파치 카프카: 애플리케이션 개발부터 파이프라인, 사물인터넷 데이터 허브 구축까지'를 타이틀로 한 책이다. 이 책의 저자는 많은 일본 사람들이라는 것이 인상적이었다. 많은 책들이 영어로 된 원서를 기반으로 번역하는 것과는 다르게, 이 책은 당연하게도 일어를 번역한 책이었던 것이다. 일본에서 이 제품을 특히 더 관심 가지고 활용하는 것 같다는 생각을 가지고 접하게 되었다.

> 첫 느낌 및 목차

주요 목차로는

아파치 카프카에 대한 개요, 기초 및 설치, 자바API를 이용해서 애플리케이션을 만들어보기, 사례, 각 사례별로 처리 방법에 대해서 이야기 하였다.

카프카 라는 제품에 대해 무지한 사람이 보는데 문제가 없도록 하였으며, 제대로 개념 잡히지 않은 사람이라 해도, 쉽게 이해할 수 있도록 구성해 놓은 목차이다.

그리고 이 제품 자체의 활용을 실제로 필요로 할 때 다양한 케이스에 맞추어 진행이 가능하도록 좋은 레퍼런스를 생성해 놓았다. 중간 이후부터는 나중에 필요한 부분만 발췌해서 보도록 된 느낌이다.

> 인상깊은 부분들

1. 카프카의 태생부터 시작한 필요성 언급

링크드인으로부터 시작하여, 기존 시스템에서 부족한 부분을 어떻게 충족시켰는지 각 필요 요소를 조목조목 나열하였다. 사실 메세지 브로커 시스템일뿐인데 무슨 차이일까 궁금했던 나에게 이러한 비교는 매우 효과적이었다.

향후 카프카에 대한 기대감이 커졌다는 것만 봐도 알 수 있다.

2. 비교가 필요한 부분에 적절한 도표 삽입

필요한 부분들에는 각종 도표들로 이해를 도왔다.

특히 카프카의 특징에 대한 사례 대응에 대해서도 이것이 어떠한 필요에 대해 잘 도움이 될 것인지, 도입을 고민하는 사람에게는 큰 도움이 될 것 같다. 그리고 개요 설명 끝자락에도 구조도를 통해 한눈에 파악이 될 수 있도록 돕고 있다.

3. 따라하기에 전혀 문제가 없는 실습 요소

실습 요소는 OS 설치부터 시작하여, 실제 간단한 자바 프로그램 작성을 통하여 눈으로 카프카의 Produce, Consume을 보여준다.

이것이 잘 될 것인지에 대해 직접 VMWare Workstation Player를 설치하여, CentOS를 설치하고 진행하였다. 이 책의 내용과 조금 다른 것은 8.1로 진행하였는데, 별 무리없이 진행할 수 있었다.(중간에 막힌곳이 있기는 하나.. 잘 못 해석한 부분이 문제였다. 결국은 해결!)

소스 작성시에는 Linux에도 잘 동작하는 Visual Studio Code로!

Broker를 localhost에 하나 띄우고, Producer와 Consumer를 각각 동작시켜서 값을 전달하고 받아들이는 과정

나름 성공적으로 되니 재미가 있었다.

4. 적용 가능한 사례 및 실제 활용 요소 나열

적용 사례에 대한 부분은 실습 이후 바로 나오는데, 이 흐름이 매우 매끄러웠다. 책의 전체적인 구성에 신경을 쓴 느낌이 많이 들었다. 하나의 시스템을 학습하는 데 있어서, 이것이 무엇인지, 왜 필요한지, 실제로 눈으로 보여주어야 하는 부분과 그래서 앞으로 도입할 수 있는 부분은 이렇게 있다는 구체적 사례와, 그 방법에 대해서 구체적인 설명까지 언급한 것은 매우 자연스러웠다.

영화로 보자면 잘 짜여진 설득력 있는 영화 같았다.

> 괜찮은 부분

- 설득력 있는 전개

- 초보자가 보기에 어렵지 않은 구성

- 실행이 잘 되는 실습

- 추후 언제든 발췌하여 활용 가능한 레퍼런스식 챕터 도입

- 번역본인지 몰랐을 정도로 매끄러운 번역

> 아쉬운 부분

- 실습이 조금 더 구체적이었다면.(서버이름 설정, pom.xml파일 내부 설정시 유의점 등)

- 필요한 주변 지식에 대한 용어를 모아서 정리해 주었다면.

> 개인적인 평점

- 가격: 8 / 10