>
>
>
>
러닝 스파크 : 아파치 스파크를 이용한 데이터 분석 및 머신러닝 알고리즘
제이펍의 클라우드1 ㅣ 데니 리, 박종영 ㅣ 제이펍 ㅣ Learning Spark
  • 정가
30,000원
  • 판매가
27,000원 (10% ↓, 3,000원 ↓)
  • 발행일
2022년 06월 24일
  • 페이지수/크기/무게
404page/188*246*24/864g
  • ISBN
9791191600889/1191600882
  • 배송비
무료배송
  • 배송예정일
08/12(금) 배송완료예정
  • 현 보유재고
100 권 이상
  • 주문수량
  • 바로구매 북카트담기
  • 제휴몰 주문 시 고객보상, 일부 이벤트 참여 및 증정품 증정, 하루/당일 배송에서 제외되므로 참고 바랍니다.
  • 시리즈 도서
제이펍의 클라우드(총14건)
러닝 스파크 : 아파치 스파크를 이용한 데이터 분석 및 머신러닝 알고리즘     27,000원 (10%↓)
AWS로 시작하는 인프라 구축의 정석 : 견고한 엔터프라이즈 프로덕션 환경을 만들고 지키는 법     25,200원 (10%↓)
테라폼 설치에서 운영까지(Terraform Up&Running) : 국내 최초 테라폼 입문서! | 테라폼 0.11x 대응     20,700원 (10%↓)
몽고디비 인 액션 : 빅데이터 시대 최고의 NoSQL 데이터베이스     29,700원 (10%↓)
빠른 서버리스 앱 개발을 위한 AWS Lambda 인 액션     25,200원 (10%↓)
  • 상세정보
  • 스파크 창시자 '마테이 자하리아'가 추천하는 스파크 입문서의 결정판! 《러닝 스파크: 번개같이 빠른 데이터 분석》의 제2판이 출간되었습니다. 데이터가 점점 더 커지고 점점 더 빨리 생성되며 다양한 형식으로 제공되면서, 분석이나 머신러닝을 위한 대규모 처리 또한 요구되고 있습니다. 이러한 대규모 워크로드를 효율적으로 처리할 수 있는 대안이 바로 아파치 스파크입니다. 스파크 3.x를 포함하여 업데이트된 이 개정판은 데이터 엔지니어와 데이터 과학자에게 스파크의 구조와 통합이 중요한 이유를 보여줍니다. 간단한 것에서부터 복잡한 것까지 데이터 분석을 수행하고, 머신러닝 알고리즘의 사용 방법을 체계적으로 설명합니다. 단계별 연습, 코드 예제와 노트북 등을 통해 다음을 수행할 수 있습니다. ■ 파이썬, SQL, 스칼라, 자바를 이용한 고차원 정형 API 학습 ■ 스파크 작업과 SQL 엔진의 이해 ■ 스파크 설정 및 스파크 UI를 사용하여 스파크 작업을 검사, 튜닝, 디버깅 ■ JSON, 파퀘이, CSV, 에이브로, ORC, 하이브, S3, 카프카와 같은 데이터 소스에 연결 ■ 정형 스트리밍을 사용하여 배치 및 스트리밍 데이터에 대한 분석 수행 ■ 오픈소스 델타 레이크 및 스파크로 안정적인 데이터 파이프라인 구축 ■ MLlib을 사용하여 머신러닝 파이프라인을 개발하고 MLflow를 사용하여 모델 재생산 및 배포
  • 옮긴이 머리말 x 베타리더 후기 xii 추천사 xiv 시작하며 xv 표지에 대하여 xxi CHAPTER 1 아파치 스파크 소개: 통합 분석 엔진 1 스파크의 시작 1 아파치 스파크란 무엇인가? 4 통합된 분석 7 개발자의 경험 15 CHAPTER 2 아파치 스파크 다운로드 및 시작 19 1단계: 아파치 스파크 다운로드 19 2단계: 스칼라 혹은 파이스파크 셸 사용 22 로컬 머신 사용하기 24 3단계: 스파크 애플리케이션 개념의 이해 26 트랜스포메이션, 액션, 지연 평가 29 스파크 UI 31 첫 번째 단독 애플리케이션 34 요약 42 CHAPTER 3 아파치 스파크의 정형화 API 43 스파크: RDD의 아래에는 무엇이 있는가 44 스파크의 구조 확립 45 데이터 프레임 API 48 데이터세트 API 71 데이터 프레임 vs 데이터세트 77 스파크 SQL과 하부의 엔진 79 요약 85 CHAPTER 4 스파크 SQL과 데이터 프레임: 내장 데이터 소스 소개 86 스파크 애플리케이션에서 스파크 SQL 사용하기 87 SQL 테이블과 뷰 93 데이터 프레임 및 SQL 테이블을 위한 데이터 소스 98 요약 119 CHAPTER 5 스파크 SQL과 데이터 프레임: 외부 데이터 소스와 소통하기 120 스파크 SQL과 아파치 하이브 120 스파크 SQL 셸, 비라인 및 태블로로 ...
  • 2013년까지 스파크는 널리 쓰이면서 원 저작자들과 연구원(마테이 자하리아, 알리 고시, 레이놀드 신, 패트릭 웬델, 아이온 스토이카, 앤디 콘빈스키)들은 스파크 프로젝트를 아파치 소프트웨어 재단(ASF)에 이관하고, 데이터브릭스(Databricks)라는 회사를 만들었다. 데이터브릭스와 오픈소스 커뮤니티의 개발자들은 2014년 5월 ASF의 주도 아래 아파치 스파크 1.010을 릴리스하였다. 이 첫 메이저 릴리스는 데이터브릭스 및 100여 개의 상용 업체로부터 앞으로 이어질 빈번한 릴리스와 주목할 만한 기능을 이끌어낼 변화의 계기가 되었다. _4쪽 여러분은 하나의 스파크 애플리케이션을 작성함으로써 모든 것이 실행 가능해지며 전혀 다른 작업을 위해 별도의 엔진을 돌릴 필요도, 별도의 API를 배울 필요도 없게 된다. 스파크를 쓴다면 자신의 워크로드를 처리하기 위한 하나의 통합된 처리 엔진을 갖게 되는 것이다. _5쪽 개발자가 겪는 모든 기쁨 중 가장 매력적인 것 중의 하나는 생산성을 늘려 주고, 사용하기 쉽거나 이해하기 쉬운, 잘 구성된 API 집합이다. 아파치 스파크의 원칙 중 하나는 데이터의 규모에 상관없이 스칼라, 자바, 파이썬, SQL, R 등 여러 언어에 걸쳐 사용하기 쉬운 API를 개발자에게 어필하는 것이다. _15쪽 이 책의 저자 중에는 M&M을 사용하여 쿠키를 굽는 것을 좋아하는 데이터 과학자가 있으며, 그녀는 머신러닝과 데이터 과학 과정을 수강하는 미국의 여러 주(state) 출신 학생들에게 상으로 이 쿠키들을 자주 주곤 한다. 하지만 그녀는 데이터 중심주의자이기 때문에 서로 다른 주에 사는 학생들에게 적절한 비율로 M&M의 색깔이 주어지는지 확인해 보고 싶어 한다. 10만 개 이상의 데이터를 갖고 있는 파일을 읽어 들여서(각 라인은 주, M&M 색깔, 개수를 갖고 있다) 색깔과 주별로 집계하는 스파크 프로그램을 작성해보자. 이 집계된 결과는 각 주별로 학생들이 어떤 색깔의 M&M을 좋아하는지 알려줄 것이다. 완전한 파이썬 프로그램은 예제 2-1에 있다. _35쪽 데이터 캐싱과 영속화(persistence)의 차이는 무엇일까? 스파크에서는 두 단어가 서로 동의어라고 볼 수 있다. cache()와 persist()의 두 가지 API 호출이 이 기능들을 제공한다. 후자는 데이터가 저장되는 위치와 방식에 대해 좀 더 세밀한 설정 - 메모리인지 디스크인지, 직렬화를 하는지 안 하는지 - 을 제공할 수 있다. _191쪽
  • 데니 리 [저]
  • 데이터브릭스의 선임 개발자 애드버킷이며, 0.6 버전부터 아파치 스파크 관련 일을 해왔다.
  • 박종영 [저]
  • 한국 오라클, 세븐 네트웍스 코리아를 비롯한 여러 회사에서 DBMS 엔진 및 푸시 메시징 엔진 등을 개발했다. 그루터를 거쳐 지금은 쿠팡에서 빅데이터 관련 개발 업무를 하고 있으며, 시애틀에 거주 중이다. 옮긴 책으로는 《도커: 설치부터 운영까지》, 《러닝 스파크》, 《하이 퍼포먼스 스파크》(이상 제이펍)가 있다.
  • 전체 0개의 구매후기가 있습니다.

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환 및 반품이 가능한 경우
상품을 공급 받은 날로부터 7일이내 가능
공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월 이내,
   혹은 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일 이내
상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능
교환 및 반품이 불가능한 경우
구매확정 이후(오픈마켓상품에 한함)
고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우
   (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우
포장 개봉되어 상품 가치가 훼손된 경우
다배송지의 경우 반품 환불
다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.
중고상품의 교환
중고상품은 제한된 재고 내에서 판매가 이루어지므로, 교환은 불가능합니다.
오픈마켓 상품의 환불
오픈마켓상품에 대한 책임은 원칙적으로 업체에게 있으므로, 교환/반품 접수시 반드시 판매자와 협의 후 반품 접수를 하셔야하며,
   반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가능할 수 있으니 유의하시기 바랍니다.
배송예정일 안내
인터파크 도서는 모든 상품에 대해 배송완료예정일을 웹사이트에 표시하고 있습니다.
<인터파크 직배송 상품>
상품은 월~토요일 오전 10시 이전 주문분에 대하여 당일 출고/당일 배송완료를 보장하는 상품입니다.
상품은 서울지역/평일 주문분은 당일 출고/익일 배송완료를 보장하며,
서울외지역/평일 주문분의 경우는 오후 6시까지 주문분에 대하여 익일 배송완료를 보장하는 상품입니다.
(단, 월요일은 12시까지 주문에 한함)
상품은, 입고예정일(제품출시일)+택배사배송일(1일)에 배송완료를 보장합니다.
~ 상품은 유통특성상 인터파크에서 재고를 보유하지 않은 상품으로
주문일+기준출고일+택배사배송일(1일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※기준출고일:인터파크가 상품을 수급하여 물류창고에서 포장/출고하기까지 소요되는 시간
<업체 직접배송/오픈마켓 상품>
~ 상품은 업체가 주문을 확인하고, 출고하기까지 걸리는 시간입니다.
주문일+기준출고일+택배사배송일(2일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※5일이내 출고가 시작되지 않을시, 오픈마켓 상품은 자동으로 주문이 취소되며, 고객님께 품절보상금을 지급해 드립니다.
배송비 안내
도서(중고도서 포함)만 구매하시면 : 배송비 2,000원 (1만원이상 구매 시 무료배송)
음반/DVD만 구매하시면 : 배송비 1,500원 (2만원이상 구매 시 무료배송)
잡지/만화/기프트만 구매하시면 : 배송비 2,000원 (2만원이상 구매 시 무료배송)
도서와 음반/DVD를 함께 구매하시면 : 배송비 1,500원 1만원이상 구매 시 무료배송)
도서와 잡지/만화/기프트/중고직배송상품을 함께 구매하시면 : 2,000원 (1만원이상 구매 시 무료배송)
업체직접배송상품을 구매시 : 업체별로 상이한 배송비 적용

   * 세트상품의 경우 부분취소 시 추가 배송비가 부과될 수 있습니다.
   * 북카트에서 배송비없애기 버튼을 클릭하셔서, 동일업체상품을 조금 더 구매하시면, 배송비를 절약하실 수 있습니다.
해외배송 안내
인터파크도서에서는 국내에서 주문하시거나 해외에서 주문하여 해외로 배송을 원하실 경우 DHL과 특약으로 책정된 요금표에
   의해 개인이 이용하는 경우보다 배송요금을 크게 낮추며 DHL(www.dhl.co.kr)로 해외배송 서비스를 제공합니다.
해외배송은 도서/CD/DVD 상품에 한해 서비스하고 있으며, 다른 상품을 북카트에 함께 담으실 경우 해외배송이 불가합니다.
해외주문배송 서비스는 인터파크 도서 회원 가입을 하셔야만 신청 가능합니다.
알아두세요!!!
도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
오픈마켓업체의 배송지연시 주문이 자동으로 취소될 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 기준으로 배송됩니다.
유통의 특성상 출고기간은 예정보다 앞당겨지거나 늦춰질 수 있습니다.
택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다.
  • 0개
  • 0개