>
>
>
>
베이지안으로 접근하는 자연어 처리 : 베이지안 통계 개념과 추론 기법, 모델링을 이용한 활용 분석까지
샤이 코헨, 이재원 ㅣ 에이콘출판 ㅣ Bayesian Analysis in Natural Language Processing
  • 정가
36,000원
  • 판매가
32,400원 (10% ↓, 3,600원 ↓)
  • 발행일
2021년 09월 30일
  • 페이지수/크기/무게
388page/188*236*27/901g
  • ISBN
9791161755540/1161755543
  • 배송비
무료배송
  • 배송예정일
07/29(월) 배송완료예정
  • 현 보유재고
100 권 이상
  • 주문수량
  • 바로구매 북카트담기
  • 제휴몰 주문 시 고객보상, 일부 이벤트 참여 및 증정품 증정, 하루/당일 배송에서 제외되므로 참고 바랍니다.
  • 상세정보
  • 1980년대 중반, 언어를 분석하기 위해 말뭉치와 데이터 기반 기술을 많이 사용하면서 자연어 처리는 중대한 변화를 겪었다. 그 이후 자연어 처리에서 통계 기법을 사용하는 방법은 많은 발전이 있었다. 자연어 처리에 대한 베이지안 접근 방식은 1990년대 후반에서 2000년대 초반에 본격적으로 발전하기 시작했다. 빈도주의적 접근 방식의 단점을 개선하고 특히 통계적 학습이 제대로 수행되지 않는 비지도학습 환경에서 많은 부분을 보완했다. 이 책에서는 자연어 처리의 베이지안 학습에 관련된 연구를 할 때 이를 이해하는 데 필요한 방법과 알고리즘을 다룬다. 이러한 알고리즘은 대부분 머신러닝과 통계에서 차용되고 부분적으로 자연어 처리 방법을 참고한다. 마코프 체인, 몬테카를로 샘플링 및 변분 추론, 베이지안 추정, 비모수 모델링과 같은 추론 기법을 다룬다. 또한 사전분포, 켤레 및 생성 모델링과 같은 기본적인 베이지안 통계 개념도 함께 다룬다. 마지막으로 문법 모델링, 신경망 및 표현학습과 같은 자연어 처리의 기본 모델링 기술과 베이지안을 활용한 분석도 다룬다.
  • ★ 이 책의 구성 ★ 1장은 베이즈 자연어 처리와 관련된 확률과 통계에 대한 내용을 다룬다. 랜덤변수, 랜덤변수 간의 독립성, 조건부 독립성 랜덤변수 기댓값 등과 같은 기본적 개념을 다룬다. 또한 베이즈 통계학과 빈도주의 통계학이 어떻게 다른지 간략하게 설명한다. 컴퓨터 과학이나 통계학의 기본적인 지식이 있다면 1장을 건너뛰고 봐도 좋다. 2장에서는 2가지 예시(잠재 디리클레 할당 모델과 베이즈 텍스트 회귀 분석)를 활용해 자연어 처리에서 베이즈 분석을 소개하고, 이 책의 주제에 대한 높은 수준의 개요를 설명한다. 3장은 베이즈 통계 모델링에서 중요한 구성 요소인 사전분포를 다룬다. 특히 디리클레분포, 사전분포에 대한 정보가 없는 경우, 정규분포 등과 같이 베이즈 자연어 처리에 자주 사용되는 사전분포에 대한 내용을 논한다. 4장은 사후분포 요약을 통해 빈도주의적 통계와 베이즈 통계를 종합하는 아이디어에 대해 다룬다. 또한 베이즈에 관한 개념을 유지한 상태로, 일련의 매개변수에 대한 점 추정치를 계산하는 접근법을 상세하게 설명한다. 5장은 베이즈 통계학의 주요 추론법 중 하나인 마르코프 체인 몬테 카를로(Markov Chain Monte Carolo)를 설명한다. 깁스 샘플링과 메트로폴리스-헤이스팅스 샘플링(Metropolis-Hastings sampling)과 같은 베이즈 자연어 처리에서 흔하게 다루는 샘플링 알고리즘(sampling algorithm)을 자세하게 알려준다. 6장에서는 베이즈 자연어 처리에서 또 다른 중요한 추론법으로 여겨지는 변분추론을 다룬다. 평균-장 변분추론과 변분 기댓값 최대화 알고리즘을 설명한다. 7장은 베이즈 자연어 처리에서 가장 중요한 모델링 기법인 비모수적 모델링에 대해 설명한다. 또한 디리클레 프로세스(Dirichlet Process)와 피트만-요 프로세스(Pitman-Yor process)와 같은 비모수 모델을 살펴본다. 8장에서는 확률론적 문맥 자유 문법과 동시성 문법과 같은 자연어 처리 기본 언어 모델을 다고, 이러한 언어 모델을 어댑터 문법, 계층적 디리클레 프로세스, PCFG(Probabilistic Context-Free Grammars) 등과 연관지어 베이즈 내용을 바탕으로 설명한다. 또한 책의 뒷부분에는 이 책을 읽기 위해 필요한 배경 정보를 제공하는 두 개의 부록이 포함돼 있다. 5개 이상의 문제가 각 장마다 포함돼 있어 수업 교재로 활용할 수도 있다. 특히 자연어 처리에서 베이즈 분석에 대한 강의를 할 수 있을 것이다. 예를 들어 베이즈 자연어 처리에 대한 강의를 4번 정도 한다면, 3장부터 7장을 각각 하나의 강의로 엮을 수 있다. 또한 8장의 어댑터 문법 또는 베이즈 PCFG 등과 같은 개별 주제들은 각 강의마다 예시로 제공할 수 있다. ★ 옮긴이의 말 ★ 인공지능 기술이 발전하면서 비약적인 성장을 이루고 있는 자연어 처리 분야에 관련된 책이다. 자연어 처리에 대한 일반적인 내용을 이해하고 있다면 베이지안을 활용한 접근을 통해 자연어 처리를 새로운 시각에서 바라볼 수 있을 것이다. 통계 개념이 많이 등장하고 다소 어렵게 느껴질 수는 있으나, 통계적인 추정에 근거한 자연어 처리는 어떤 모습이고 어떻게 연구되고 있는지 접할 수 있다. 주제와 내용은 어려울 수 있지만 저자가 최대한 쉽게 설명하려고 했으며, 나 또한 저자의 의도에 따라 이해하기 쉽게 번역하려고 노력했다.
  • 1장. 머리말 1.1 확률 측정: 확률측도, 확률함수 1.2 무작위 변수 1.2.1 연속과 이산 확률 변수 1.2.2 다중랜덤변수의 결합확률분포 1.3 조건부분포 1.3.1 베이즈 정리 1.3.2 독립 그리고 조건부 독립 랜덤변수 1.3.3 교환 가능한 랜덤변수 1.4 랜덤변수 기댓값 1.5 모델 1.5.1 모수 대 비모수 모델 1.5.2 모델로부터 추론 1.5.3 생성 모델 1.5.4 모델의 독립 가정 1.5.5 방향성 그래프 모델 1.6 시나리오 데이터로부터 학습 1.7 베이즈와 빈도주의 철학 1.8 요약 1.9 연습 문제 2장. 개요 2.1 개요: 베이지안 통계학과 NLP의 접점 2.2 첫 번째 연습 문제: 잠재 디리클레 할당 모델 2.2.1 디리클레분포 2.2.2 추론 2.2.3 요약 정리 2.3 두 번째 연습 문제: 베이지안 텍스트 회귀 2.4 결론과 요약 2.5 연습 문제 3장. 사전확률분포 3.1 켤레사전분포 3.1.1 켤레사전확률과 정규화 상수 3.1.2 잠재변수모델의 켤레사전확률 활용 3.1.3 켤레사전확률분포의 혼합 3.1.4 재정규화된 켤레분포 3.1.5 논의: 결합되거나 결합되지 않는다? 3.1.6 요약 3.2 다항분포와 카테고리분포에 대한 사전확률 3.2.1 디리클레분포 리뷰 3.2.2 로지스틱정규분포 3.2.3 논의 3.2.4 요...
  • 샤이 코헨 [저]
  • Shay Cohen 에든버러대학교 정보학과, 언어, 인지 및 계산 연구소의 강사다. 2011년 카네기멜론대학교에서 언어 기술 전공으로 박사학위를 받았으며 석사 및 학사학위는 텔아비브대학교에서 각각 컴퓨터 과학 및 수학 전공으로 학위를 받았다. 2011년에서 2013년 사이에 Computing Innovation Fellowship을 받으며 컬럼비아대학교에서 박사후 과정을 연수했으며 2013년에서 2018년 사이에 에든버러대학교에서 Chancellor’s Fellowship을 받았다. 연구 관심사는 자연어 처리와 머신러닝이며 구문 및 구문 분석과 같은 구조적 예측 문제에 중점을 둔다.
  • 이재원 [저]
  • 미국에서 컴퓨터공학과 통계를 전공했으며, 금융권에서 머신러닝을 활용한 데이터 분석을 연구한 후, IT 회사에서 자연어 처리 모델 연구를 했다. 특히 자연어 처리 모델을 활용해 챗봇을 연구 개발했다. 이후 산업공학과 박사과정에 재학 중이며, 현재 세컨핸드 패션 플랫폼을 만드는 스타트업에서 CTO로 재직하고 있다.
  • 전체 0개의 구매후기가 있습니다.

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환 및 반품이 가능한 경우
상품을 공급 받은 날로부터 7일이내 가능
공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월 이내,
   혹은 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일 이내
상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능
교환 및 반품이 불가능한 경우
구매확정 이후(오픈마켓상품에 한함)
고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우
   (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우
포장 개봉되어 상품 가치가 훼손된 경우
다배송지의 경우 반품 환불
다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.
중고상품의 교환
중고상품은 제한된 재고 내에서 판매가 이루어지므로, 교환은 불가능합니다.
오픈마켓 상품의 환불
오픈마켓상품에 대한 책임은 원칙적으로 업체에게 있으므로, 교환/반품 접수시 반드시 판매자와 협의 후 반품 접수를 하셔야하며,
   반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가능할 수 있으니 유의하시기 바랍니다.
배송예정일 안내
인터파크 도서는 모든 상품에 대해 배송완료예정일을 웹사이트에 표시하고 있습니다.
<인터파크 직배송 상품>
상품은 월~토요일 오전 10시 이전 주문분에 대하여 당일 출고/당일 배송완료를 보장하는 상품입니다.
상품은 서울지역/평일 주문분은 당일 출고/익일 배송완료를 보장하며,
서울외지역/평일 주문분의 경우는 오후 6시까지 주문분에 대하여 익일 배송완료를 보장하는 상품입니다.
(단, 월요일은 12시까지 주문에 한함)
상품은, 입고예정일(제품출시일)+택배사배송일(1일)에 배송완료를 보장합니다.
~ 상품은 유통특성상 인터파크에서 재고를 보유하지 않은 상품으로
주문일+기준출고일+택배사배송일(1일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※기준출고일:인터파크가 상품을 수급하여 물류창고에서 포장/출고하기까지 소요되는 시간
<업체 직접배송/오픈마켓 상품>
~ 상품은 업체가 주문을 확인하고, 출고하기까지 걸리는 시간입니다.
주문일+기준출고일+택배사배송일(2일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※5일이내 출고가 시작되지 않을시, 오픈마켓 상품은 자동으로 주문이 취소되며, 고객님께 품절보상금을 지급해 드립니다.
배송비 안내
도서(중고도서 포함)만 구매하시면 : 배송비 2,000원 (1만원이상 구매 시 무료배송)
음반/DVD만 구매하시면 : 배송비 1,500원 (2만원이상 구매 시 무료배송)
잡지/만화/기프트만 구매하시면 : 배송비 2,000원 (2만원이상 구매 시 무료배송)
도서와 음반/DVD를 함께 구매하시면 : 배송비 1,500원 1만원이상 구매 시 무료배송)
도서와 잡지/만화/기프트/중고직배송상품을 함께 구매하시면 : 2,000원 (1만원이상 구매 시 무료배송)
업체직접배송상품을 구매시 : 업체별로 상이한 배송비 적용

   * 세트상품의 경우 부분취소 시 추가 배송비가 부과될 수 있습니다.
   * 북카트에서 배송비없애기 버튼을 클릭하셔서, 동일업체상품을 조금 더 구매하시면, 배송비를 절약하실 수 있습니다.
해외배송 안내
인터파크도서에서는 국내에서 주문하시거나 해외에서 주문하여 해외로 배송을 원하실 경우 DHL과 특약으로 책정된 요금표에
   의해 개인이 이용하는 경우보다 배송요금을 크게 낮추며 DHL(www.dhl.co.kr)로 해외배송 서비스를 제공합니다.
해외배송은 도서/CD/DVD 상품에 한해 서비스하고 있으며, 다른 상품을 북카트에 함께 담으실 경우 해외배송이 불가합니다.
해외주문배송 서비스는 인터파크 도서 회원 가입을 하셔야만 신청 가능합니다.
알아두세요!!!
도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
오픈마켓업체의 배송지연시 주문이 자동으로 취소될 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 기준으로 배송됩니다.
유통의 특성상 출고기간은 예정보다 앞당겨지거나 늦춰질 수 있습니다.
택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다.
  • 0개
  • 0개