>
>
>
>
R 시뮬레이션 : 빅데이터와 샘플 데이터를 연결하다
마티아스 템플, 김재민 ㅣ 에이콘출판 ㅣ Simulation for Data Science with R
  • 정가
35,000원
  • 판매가
31,500원 (10% ↓, 3,500원 ↓)
  • 발행일
2019년 09월 30일
  • 페이지수/크기/무게
492page/189*236*29/925g
  • ISBN
9791161753362/1161753362
  • 배송비
무료배송
  • 배송예정일
05/27(금) 배송완료예정
  • 현 보유재고
100 권 이상
  • 주문수량
  • 바로구매 북카트담기
  • 제휴몰 주문 시 고객보상, 일부 이벤트 참여 및 증정품 증정, 하루/당일 배송에서 제외되므로 참고 바랍니다.
  • 상세정보
  • 석사 또는 박사 과정에서 공부한 경험이 있다면 대게 샘플 데이터를 이용해서 모집단을 추정하고 예측하는 전통적 연구 방법에 익숙할 것이다. 샘플 데이터로 분석한다는 것은 많은 가정이 요구되는 작업이기도 하며 샘플 데이터의 질에 따라 예측 결과가 달라지기도 하지만, 시간과 돈이라는 현실적인 한계 앞에서 계속해서 데이터만 모을 수도 없는 노릇이다. 전통적 샘플링-추론 방식에 익숙한 분들에게 시뮬레이션이라는 용어는 어쩌면 항공기 모의실험실이나 기상관측 연구소에서나 사용되는 것으로 자신과는 동떨어진 작업이라고 생각할 수도 있다. 하지만 학위과정에서 해결해야 하는 연구과제, 시장분석이나 정치환경과 같은 사회조사, 그리고 샘플이 부족한 연구 환경에서 시뮬레이션 기법은 훌륭한 해결책이 될 수 있다. 이 책은 수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.
  • ★ 이 책에서 다루는 내용 ★ ■ 데이터에서 통찰력을 이끌어 내기 위한 데이터 시뮬레이션과 리샘플링 ■ 고성능 컴퓨팅과 고도의 데이터 처리 방법 등 R의 고급 기능 ■ 분포, 데이터, 집단 시뮬레이션에 사용하는 난수 시뮬레이션 ■ 에이전트 기반 마이크로시뮬레이션과 모델 및 디자인 기반 시뮬레이션을 기준으로 현실과 가까운 데이터 시뮬레이션 ■ 과학적이며 현실적인 문제를 해결할 수 있도록 R을 사용한 통계 솔루션 ■ boot, simPop, VIM, data.table, dplyr, cvTools, deSolve 등 다양한 R 패키지 이해 ■ R만을 사용한 난수 생성 방법 및 시뮬레이션 예제와 실행 방법 ★ 이 책의 대상 독자 ★ 전산 방법론과 R에 익숙한 사용자를 위한 책이다. 컴퓨터 기반 몬테카를로 방법과 통계 시뮬레이션 도구로 R의 고급 기능을 배워보고 싶다면 이 책은 여러분의 것이다. ★ 이 책의 구성 ★ 1장 ‘서론’에서는 데이터 과학과 통계 분야에서 사용되는 시뮬레이션 실험의 일반적인 목적인 “시뮬레이션은 왜 필요하며, 어디에 적용되는가?”라는 질문에 답을 하고, 빅데이터를 다루는 특별한 케이스를 논의한다. 2장 ‘R과 고성능 컴퓨팅’에서는 R을 이용해 할 수 있는 고급 컴퓨팅, 데이터 전처리, 시각화 작업을 종합적으로 다룬다. 3장 ‘연필 기반 이론과 데이터 기반 전산 솔루션의 불일치’에서는 결정론적 환경에서 발생할 수 있는 수치 정확성, 반올림, 수렴과 관련된 이슈를 다룬다. 4장 ‘난수 시뮬레이션’에서는 균등 난수 시뮬레이션과 여러 종류의 분산으로 전환하기 위한 변형 방법으로 시작해 다양한 종류의 마르코프 체인 몬테카를로 난수 생성 방법을 논의한다. 5장 ‘최적화 문제를 위한 몬테카를로 기법’에서는 결정론적 최적화 방법과 확률론적 최적화 방법을 소개한다. 6장 ‘시뮬레이션으로 보는 확률 이론’에서는 통계학에서 필요한 기본 이론에 집중한다. 예로는 대수의 법칙 그리고 중심극한정리가 시뮬레이션을 통해 소개된다. 7장 ‘리샘플링 방법’에서는 부트스트랩, 잭나이프, 교차 타당성 검증을 종합적으로 설명한다. 8장 ‘리샘플링 방법과 몬테카를로 테스트의 적용’에서는 회귀 분석, 대체(imputation), 시계열 분석 등 다양한 분야에서 사용할 수 있는 적용 방법을 제시한다. 추가로, 몬테카를로 테스트와 함께 순열 테스트 및 부트스트랩 같은 변형된 형태를 소개한다. 9장 ‘EM 알고리즘’에서는 반복을 통해 최적값을 얻는 기대 극대화법을 소개한다. 누락값을 묶고 대체하는 애플리케이션을 제시한다. 10장 ‘복합 데이터로 하는 시뮬레이션’에서는 일반적으로 방법 간 비교를 위해 사용되고 에이전트 기반 마이크로시뮬레이션의 투입 데이터로 활용될 인구 데이터와 합성 데이터를 시뮬레이션하는 방법을 소개한다. 11장 ‘시스템 다이내믹스와 에이전트 기반 모델’에서는 에이전트 기반 마이크로시뮬레이션 모델을 논의하고 복잡한 변화 시스템을 공부하기 위해 시스템 다이내믹스에서 사용되는 기본 모델을 제시한다.
  • 1장. 서론 __시뮬레이션이란 무엇이며, 어디에 적용되는가? __왜 시뮬레이션을 사용하는가? __시뮬레이션과 빅데이터 __올바른 시뮬레이션 방법 선택하기 __요약 __참고문헌 2장. R과 고성능 컴퓨팅 __R 통계 환경 ____R 기초 ____R에 대한 아주 기본적인 내용들 ____설치 및 업데이트 ____help ____R 작업공간 및 작업 디렉토리 ____데이터 유형 ____누락값 __일반 함수, 메소드, 클래스 __R에서의 데이터 전처리 ____apply와 기본 R의 친구들 ____패키지 dplyr로 하는 기본 데이터 전처리 ____패키지 data.table을 이용한 데이터 전처리 __고성능 컴퓨팅 ____코딩에서 계산 속도가 느린 함수를 찾기 위한 분석법 ____병렬 컴퓨팅 ____C++ 인터페이스 __정보 시각화 ____R의 그래픽 시스템 ____graphics 패키지 ____ggplot2 패키지 __참고문헌 3장. 연필 기반 이론과 데이터 기반 전산 솔루션의 불일치 __기계 수 반올림 문제 ____예제: 수를 64비트 형식으로 나타내기 ____결정론적 케이스에서 수렴 ____예제: 수렴 __문제의 상태 __요약 __참고문헌 4장. 난수 시뮬레이션 __진성난수 __의사난수 시뮬레이션 ____합동 생성...
  • ★ 옮긴이의 말 ★ 이 책을 번역하면서 머릿속에서 뚜렷해지는 생각이 있었다. ‘고정된 것은 변하는 것보다 항상 좋은 것 같아. 세상이 변하지만 않는다면 말이지.’ 경영 전략을 연구하는 나에게 의사결정자의 제한적 이성(bounded rationality)은 항상 흥미로운 주제다. 사람들이 모든 요인을 고려해서 미래 지향적으로 최적의 의사결정을 하기보다는 과거의 경험, 노하우, 그리고 현장에서 얻은 지식(idiosyncratic knowledge) 등 과거 지향적으로 의사결정을 하기 때문에 예상하지 못했던 나쁜 결과가 종종 발생한다. 과거의 성공 공식을 의사결정에 계속해서 적용하는 것을 결정론적 접근법이라고 하면, 현실에서 벌어지고 있는 사건을 토대로 미래를 예측해서 확률적으로 따져서 결정하는 방식을 확률론적 접근법이라 할 수 있다. 큰 변화가 없는 영역에서 살아가고 있다면 동네에서 가장 경험치가 높은 최고령의 어른께서 정답을 결정해주실지도 모르겠다. 불행히도 대부분의 우리는 어제의 성공이 또 다른 성공을 보장하지 않는 변화 속에 살고 있고, 불확실 속에서 성공 확률이 높은 쪽으로 결정을 해야 한다. 이 책은 확률론적 접근법이 필요한 대부분의 사람들에게 불필요한 가정을 내려놓고 현실에서 온 데이터로 결정 모델을 만드는 ‘시뮬레이션’을 소개한다. 시뮬레이션은 사건 사고에 관심이 있는 분들이라면 들어봤을 단어이고, 데이터를 거침없이 돌려서 기존의 지식으로는 생각하지 못했던 새로운 결과를 찾아내는 마법 정도의 개념으로 이해하고 있을 것이다. 내 경우는 박사 과정에서 연역적 방식으로 연구를 수행하는 방법을 배우다 보니, 데이터를 돌려서 아이디어를 얻고 주장을 하는 귀납적 방식은 많이 어색하다. 데이터라는 ‘현실 관찰’이 주도해서 지식을 일반화하기에는 ‘관찰한 양이 충분해서 예외는 없는가’라는 질문에 답할 자신이 없기 때문이다. 반면에 이론이 주도하면서 데이터의 역할은 ‘가설 검증’ 정도로 전환되고 확률 이론에 따라 가설이 참일 확률적 가능성에 초점을 두는 연역적 방식에 편안함을 느낀다. 그래서 귀납적 방식이라고 생각했던 시뮬레이션은 어색한 영역이었다. 그러면 시뮬레이션은 귀납적 분석 도구인가? 결론부터 말하자면 시뮬레이션은 사용 목적에 따라 두 가지 패러다임에 모두 적용될 수 있다. 학계는 연역적 방식이 정상적인 지식 형성 과정이지만, 시장을 전략적으로 접근해야 하는 산업계는 다른 이야기다. 남들과 다르게 해서 살아남아야 하는 회사 입장에서 데이터는 경쟁자들이 보지 못하는 새로운 변화와 패턴을 찾아낼 수 있도록 하는 거의 유일한 도구다. 거대한 데이터를 모으고, 저장하고, 분석하는 기술이 발전하면서 얻게 된 도구의 예측 정확성 덕분에 ‘예외’가 발생시킬 수 있는 리스크 수준을 감당해낼 수 있는 환경이 됐다. 이 책은 학계 및 산업계와 같이 의사 결정 패러다임이 다른 환경에서도 ‘시뮬레이션’은 훌륭한 영감과 아이디어를 줄 수 있음을 분석 플랫폼 R로 직접 구현하면서 보여준다. 이 책은 총 11개 장으로 구성돼 있다. 각 장이 별도의 이야기인 것 같지만, 절묘하게 연결되어 있는 것이 매력이다. 1장 ‘서론’은 시뮬레이션은 무엇인가에 대한 답을 빅데이터와 연계해서 설명한다. 2장 ‘R과 고성능 컴퓨팅’은 시뮬레이션을 R에서 구현하기 위해 필요한 전처리 방법과 시각화 처리 방법을 소개한다. 3장 ‘연필 기반 이론과 데이터 기반 전산 솔루션의 불일치’에서는 이론값과 데이터 분석값이 차이 나는 원인을 살펴보고 결정론적 수렴과 확률론적 수렴의 차이를 이해해본다. 4장 ‘난수 시뮬레이션’은 목적에 맞는 다양한 ...
  • 마티아스 템플 [저]
  • 김재민 [저]
  • 전체 0개의 구매후기가 있습니다.

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환 및 반품이 가능한 경우
상품을 공급 받은 날로부터 7일이내 가능
공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월 이내,
   혹은 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일 이내
상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능
교환 및 반품이 불가능한 경우
구매확정 이후(오픈마켓상품에 한함)
고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우
   (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우
포장 개봉되어 상품 가치가 훼손된 경우
다배송지의 경우 반품 환불
다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.
중고상품의 교환
중고상품은 제한된 재고 내에서 판매가 이루어지므로, 교환은 불가능합니다.
오픈마켓 상품의 환불
오픈마켓상품에 대한 책임은 원칙적으로 업체에게 있으므로, 교환/반품 접수시 반드시 판매자와 협의 후 반품 접수를 하셔야하며,
   반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가능할 수 있으니 유의하시기 바랍니다.
배송예정일 안내
인터파크 도서는 모든 상품에 대해 배송완료예정일을 웹사이트에 표시하고 있습니다.
<인터파크 직배송 상품>
상품은 월~토요일 오전 10시 이전 주문분에 대하여 당일 출고/당일 배송완료를 보장하는 상품입니다.
상품은 서울지역/평일 주문분은 당일 출고/익일 배송완료를 보장하며,
서울외지역/평일 주문분의 경우는 오후 6시까지 주문분에 대하여 익일 배송완료를 보장하는 상품입니다.
(단, 월요일은 12시까지 주문에 한함)
상품은, 입고예정일(제품출시일)+택배사배송일(1일)에 배송완료를 보장합니다.
~ 상품은 유통특성상 인터파크에서 재고를 보유하지 않은 상품으로
주문일+기준출고일+택배사배송일(1일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※기준출고일:인터파크가 상품을 수급하여 물류창고에서 포장/출고하기까지 소요되는 시간
<업체 직접배송/오픈마켓 상품>
~ 상품은 업체가 주문을 확인하고, 출고하기까지 걸리는 시간입니다.
주문일+기준출고일+택배사배송일(2일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※5일이내 출고가 시작되지 않을시, 오픈마켓 상품은 자동으로 주문이 취소되며, 고객님께 품절보상금을 지급해 드립니다.
배송비 안내
도서(중고도서 포함)만 구매하시면 : 배송비 2,000원 (1만원이상 구매 시 무료배송)
음반/DVD만 구매하시면 : 배송비 1,500원 (2만원이상 구매 시 무료배송)
잡지/만화/기프트만 구매하시면 : 배송비 2,000원 (2만원이상 구매 시 무료배송)
도서와 음반/DVD를 함께 구매하시면 : 배송비 1,500원 1만원이상 구매 시 무료배송)
도서와 잡지/만화/기프트/중고직배송상품을 함께 구매하시면 : 2,000원 (1만원이상 구매 시 무료배송)
업체직접배송상품을 구매시 : 업체별로 상이한 배송비 적용

   * 세트상품의 경우 부분취소 시 추가 배송비가 부과될 수 있습니다.
   * 북카트에서 배송비없애기 버튼을 클릭하셔서, 동일업체상품을 조금 더 구매하시면, 배송비를 절약하실 수 있습니다.
해외배송 안내
인터파크도서에서는 국내에서 주문하시거나 해외에서 주문하여 해외로 배송을 원하실 경우 DHL과 특약으로 책정된 요금표에
   의해 개인이 이용하는 경우보다 배송요금을 크게 낮추며 DHL(www.dhl.co.kr)로 해외배송 서비스를 제공합니다.
해외배송은 도서/CD/DVD 상품에 한해 서비스하고 있으며, 다른 상품을 북카트에 함께 담으실 경우 해외배송이 불가합니다.
해외주문배송 서비스는 인터파크 도서 회원 가입을 하셔야만 신청 가능합니다.
알아두세요!!!
도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
오픈마켓업체의 배송지연시 주문이 자동으로 취소될 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 기준으로 배송됩니다.
유통의 특성상 출고기간은 예정보다 앞당겨지거나 늦춰질 수 있습니다.
택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다.
  • 0개
  • 0개