메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법

리얼타임 eBook

번역서

판매중

  • 저자 : 존 러셀
  • 번역 : 양원국
  • 출간 : 2015-04-21
  • 페이지 : 141 쪽
  • ISBN : 9788968487262
  • 초급 초중급 중급 중고급 고급
0점 (0명)
좋아요 : 33

빅데이터를 여는 열쇠, SQL온하둡(SQL-on-Hadoop)의 선두주자, 임팔라!


아파치 하둡 에코시스템은 데이터에 중점을 두고 있어 SQL 경험이 있는 데이터베이스 개발자에 안성맞춤이다. 하둡 애플리케이션 개발 작업의 많은 부분이 데이터 파일을 복사하고 변환하고 재조직화하여 분석하는 프로그램을 작성하는 일로 이루어져 있다. 이러한 일들을 대규모 병렬 방식의 네트워크 장비로 묶인 클러스터에서 신뢰성 있게 수행하려면 엄청난 노력이 필요하다.
임팔라는 이러한 활동을 쉽고 빠르게 해주기 때문에 분산 컴퓨팅에 관한 전문적인 지식이나 새로운 API를 배울 필요도 없다. 심지어 수행하려는 작업이 단일 SQL 문장으로 표현할 수 있을 정도라면 프로그램을 작성할 필요조차 없다.


이 책은 데이터베이스 경험은 있지만 아파치 하둡 소프트웨어 스택 경험은 없는 사람을 대상으로 임팔라 아키텍처와 사용법 측면에서 사례를 알려준다. SQL 예제는 이해를 돕는 단순한 예제를 시작으로 고성능과 확장성을 보여주는 모범사례를 다루는 예제로 확장해 나간다.


이 책의 대상독자

이 책은 데이터베이스, 데이터 웨어하우스, 빅데이터에 관한 지식이 있는 독자를 대상으로 한다. 따라서 CREATE TABLE, SELECT, INSERT 같은 구문과 주요 절에 관한 설명이 따로 필요 없을 정도로 독자는 SQL에 충분히 경험이 있다고 가정한다. 또한, 리눅스 경험이 있으면 더욱 좋다. 아파치 하둡 소프트웨어 스택 경험이 있으면 유용하나 필수는 아니다.

존 러셀 저자

존 러셀

존 러셀은 소프트웨어 개발자이면서 테크니컬 라이터로, 현재 클라우데라 임팔라 프로젝트의 문서화를 이끌고 있다. 산업을 선도하는 팀의 구성원으로 데이터베이스와 SQL 분야를 경험했다. DB2의 초기 정보센터(Information Center)를 설계하고 제작했다. 오라클 데이터베이스에서 애플리케이션 개발 관련 주제를 문서화하고 프로젝트 타히티(Project Tahiti) 문서 검색 엔진을 설계하고 코딩했으며, MySQL에선 InnoDB 스토리지 엔진을 문서화했다. 캐나다의 뉴펀들랜드(Newfoundland) 출생으로 현재는 미국의 캘리포니아 주 버클리(Berkeley)에 산다.

양원국 역자

양원국

티맥스소프트에서 APM 솔루션을 개발했고, 그 후 빅데이터 전문회사 KT NexR에 재직하면서 빅데이터 처리에 오픈 소스 기술을 적용하고 운용하는 일을 했다. 현재는 프리랜서로 일하고 있다.
역서로는 『하이브 완벽 가이드』(한빛미디어, 2013, 공역), 『아파치 Kafka 따라잡기』(에이콘 출판사, 2014), 『Hadoop과 Solr를 이용한 기업용 검색 시스템 구축』(에이콘 출판사, 2014)이 있다.

 

1  왜 임팔라인가 
  1.1 빅데이터 에코시스템에서 임팔라의 지위
  1.2 빅데이터 워크플로우 유연성
  1.3 고성능 분석
  1.4 탐색적 비즈니스 인텔리전스


2  임팔라 준비와 구동
  2.1 설치
  2.2 임팔라 접속
  2.3 첫 임팔라 질의


3  데이터베이스 개발자를 위한 임팔라
  3.1 SQL 언어
  3.2 빅데이터 고려사항
  3.3 임팔라가 데이터 웨어하우스와 유사한가
  3.4 물리적이고 논리적인 데이터 레이아웃
  3.5 분산 질의
  3.6 정규화와 비정규화 데이터
  3.7 파일 포맷
  3.8 집계


4  임팔라 개발 기본 작업
  4.1 임팔라 테이블에 데이터 입력하기
  4.2 코드를 임팔라 SQL로 포팅하기
  4.3 JDBC 또는 ODBC 애플리케이션에서 임팔라 사용하기
  4.4 스크립트 언어로 임팔라 사용하기
  4.5 임팔라 성능 최적화
  4.6 사용자 정의 함수
  4.7 관리자와 협업


5  튜토리얼과 깊이 파고들기
  5.1 튜토리얼: 유닉스 데이터 파일을 임팔라 테이블로
  5.2 튜토리얼: 테이블 없는 질의
  5.3 튜토리얼: 수십억 로우로의 여행
  5.4 깊이 파고들기: 통계의 역할과 조인
  5.5 안티 패턴: 수백만의 작은 조각
  5.6 튜토리얼: 4차원을 넘어
  5.7 튜토리얼: 자술과 침묵 impala-shell 출력
  5.8 튜토리얼: 스키마가 진화할 때
  5.9 튜토리얼: 추상화 단계

  • 첫번째 리뷰어가 되어주세요.
  • 결제하기
    • 문화비 소득공제 가능
    • 배송료 : 0원배송료란?

    배송료 안내

    • 20,000원 이상 구매시 도서 배송 무료
    • 브론즈, 실버, 골드회원 무료배송
    닫기

    리얼타임 eBook 안내

    PDF 형식으로 제공되며, 다운로드한 eBook은 PDF 포맷을 지원하는 디바이스 또는 프로그램에서 제한없이 열람할 수 있습니다. 또한 eBook 내의 텍스트 검색 및 인쇄도 가능합니다.

    리뷰쓰기

    닫기
    * 상품명 :
    처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법
    * 제목 :
    * 별점평가
    * 내용 :

    * 리뷰 작성시 유의사항

    글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

    1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
    2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

    오탈자 등록

    닫기
    * 도서명 :
    처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법
    * 구분 :
    * 상품 버전
    종이책 PDF ePub
    * 페이지 :
    * 위치정보 :
    * 내용 :

    도서 인증

    닫기
    도서명*
    처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법
    구입처*
    구입일*
    부가기호*
    부가기호 안내

    * 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

    * 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

    * 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

    닫기

    해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
    장바구니로 이동하시겠습니까?

    자료실

    최근 본 상품1