>
>
>
>
자연어 텍스트 처리를 통한 검색 시스템 구축 : 아파치 솔라, 루씬, OpenNLP 등 오픈소스 활용
데이터 과학 시리즈(에이콘)1 ㅣ 그랜트 잉거솔(Grant Ingersoll), 임혜연 ㅣ 에이콘출판 ㅣ Taming Text: How to Find, Organize, and Manipulate It
  • 정가
40,000원
  • 판매가
36,000원 (10% ↓, 4,000원 ↓)
  • 발행일
2015년 01월 02일
  • 페이지수/크기/무게
456page/188*235*27/1071g
  • ISBN
9788960776500/8960776505
  • 배송비
무료배송
  • 배송예정일
08/16(화) 배송완료예정
  • 현 보유재고
100 권 이상
  • 주문수량
  • 바로구매 북카트담기
  • 제휴몰 주문 시 고객보상, 일부 이벤트 참여 및 증정품 증정, 하루/당일 배송에서 제외되므로 참고 바랍니다.
  • 시리즈 도서
데이터 과학 시리즈(에이콘)(총79건)
컴퓨터 비전을 위한 다중 시점 기하학 2/e : 카메라를 위한 수학     58,500원 (10%↓)
컴퓨터 비전 5/e : 원리, 알고리듬, 응용     76,500원 (10%↓)
고객 리텐션의 전략 : 데이터를 통해 고객 이탈을 막아라     36,000원 (10%↓)
데이터의 미학 : 빅데이터 기술에서 데이터 과학자까지 데이터에 관한 모든 것     31,500원 (10%↓)
The R Book(한국어판) : R로 배우는 데이터 분석 기술     49,500원 (10%↓)
  • 상세정보
  • 현대 웹 서비스에서 검색은 빼놓을 수 없는 기능이다. 사용자는 검색에 익숙하고, 검색 결과의 앞부분에서 곧바로 자신이 원하는 링크를 찾길 바란다. 사용자의 기준을 만족시키기는 어렵지만, 다행히 잘 만들어진 오픈 소스가 이미 존재한다. 이 책은 검색과 자연어 처리에 대한 기초적인 지식을 소개하고, 아파치 솔라, OpenNLP 등의 오픈 소스를 이용해서 실제로 기능을 사용하는 법을 알려준다. 이 책은 검색이나 자연어 처리를 서비스의 기능으로 제공해야 하는 개발자에게 좋은 길잡이가 되어줄 것이다. 한국어판에서는 솔라 7.5버전에서 달라진 점과 머하웃을 대체해서 사용할 수 있는 방법을 안내한다.
  • ★ 이 책에서 다루는 내용 ★ 삶에는 정보가 너무나 많고, 우리는 거기에 압도당해 있다. 다행히도 영리한 개발자에게 많이 필요한 구명줄을 던져줄 수 있는 구조화되지 않은 텍스트를 관리하기 위한 실용적인 도구와 기법들이 있다. 이 책에서 그 도구와 방법들을 찾아볼 수 있다. 이 책은 실제 애플리케이션에서 텍스트를 다루는 방법에 대한 실용적인 예제 중심의 안내서다. 전문(full-text) 검색, 고유명사 인식, 클러스터링, 태그 부착, 정보 추출, 요약 같은 유용한 기법을 소개한다. 독자는 실제 사용 사례의 기반 지식을 체계적으로 받아들이면서 다양한 사례를 탐구할 수 있다. ■ 텍스트 길들이기 기법 ■ 솔라나 머하웃 등의 라이브러리 ■ 텍스트 처리 애플리케이션을 구축하는 방법 이 책은 특수 용어를 피하고, 주제를 분명하고 간결하게 보여줘서 통계나 자연 언어 처리에 대한 배경 지식 없이도 이해할 수 있다. 예제는 자바로 돼 있지만, 개념은 어떤 언어에도 적용할 수 있다. ★ 이 책에 쏟아진 찬사 ★ “굉장히 복잡한 프로세스의 수수께끼 같은 면을 끄집어 냈다! - 리즈 리디(Liz Liddy) / 시라큐즈 대학 정보학부 학과장 “텍스트 분석과 처리를 있는 그대로 보여준다. 분명하고, 실용적이며, 오픈소스를 사용해서 말이다!” - 데이비드 바이스(David Weiss) / 캐럿 서치(Carrot Search) s.c. “텍스트 문서에 갇혀 있는 정보를 어떻게 드러내고 활용하는지를 잘 보여준다.” - 릭 바그너(Rick Wagner) / 레드 햇(Red Hat) “텍스트 개념을 예제와 함께 익힘으로써, 텍스트 검색을 좀더 손쉬워진다.” - 더그 워렌(Doug Warren) / 자바 웹 서비스(Java Web Services) “텍스트 처리 도구와 기법에 대한 훌륭한 가이드” - 줄리앙 니오슈(Julien Nioche) / 디지털페블(DigitalPebble, Ltd.) ★ 추천의 글 ★ 고품질 텍스트 처리 능력에 대한 요구가 기하급수적으로 증가하는 이 시기에 어떤 식으로든 텍스트 정보에 의존하지 않는 분야나 산업을 생각하기는 어렵다. 급성장하는 웹 기반 경제는 극적으로 신속히 의존 정도를 늘렸다. 동시에 재능 있는 기술 전문가의 수요도 빠른 속도로 증가하고 있다. 이런 환경에 나온 훌륭하고 아주 실용적인 이 책은 실질적이고 현실적이며, 테스트된 지침과 설명을 제공해 준다. 몇 년간 나와 함께 일한 적이 있는 탁월하고 대단히 경험 많은 소프트웨어 엔지니어인 그랜트 잉거솔(Grant Ingersoll), 드류 패리스(Drew Farris)와 자연언어 처리 분야의 존경받는 기여자인 톰 모튼(Tom Morton)은 이 책에서 고도로 선별된 텍스트 처리자, 즉 자연언어 처리NLP 엔지니어 집단에 합류하는 데 관심이 있는 다른 기술 분야의 사람들을 안내하기 위한 현실적 과정을 제공한다. 내가 ‘세상을 위한, 세상 속에서의 학습’이라고 생각하는 것과 같은 방식으로 그랜트, 드류, 톰은 사실 아주 복잡한 프로세스에서 불가사의를 제거했다. 그들은 기존 도구, 구현된 예제, 잘 테스트된 코드에 집중해서 한 학기의 NLP 학습 과정을 수료하지 않고서도 이 책만으로도 가능하게 만들었다. 소프트웨어 엔지니어로서 독자가 예제와 코드 베이스, 여기서 참조한 오픈소스 도구를 자신의 것으로 익힐 수 있는 기초가 있다면, 예상한 것보다 더 빨리 진짜 전문가가 되고 실세계의 기회를 잡을 준비를 할 수 있을 것이다. - 리즈 리디(Liz Liddy) / 시라큐즈 대학 정보학부 학과장 ★ 이 책의 대상 독자 ★ 이 책이 당신을 위한 것일까? 어쩌면 그럴지도 모른다. 대상 독자는 검색, 자연언어 처리, 기계학습 배경 지식이 (거의) 없는 소프트웨어 현업...
  • 1장. 텍스트 길들이기 시작 1.1 텍스트 길들이기가 중요한 이유 1.2 미리보기: 사실 기반 질의응답 시스템 1.2.1 안녕하세요, 프랑켄슈타인 박사님 1.3 텍스트를 이해하기는 어렵다 1.4 길들여진 텍스트 1.5 텍스트와 지능적인 앱: 검색과 그 너머 1.5.1 검색과 일치 1.5.2 정보 추출 1.5.3 정보 그룹화 1.5.4 지능적인 애플리케이션 1.6 정리 1.7 참고 자료 2장. 텍스트 길들이기 기초 2.1 언어의 기초 2.1.1 단어와 그 범주 2.1.2 구와 절 2.1.3 형태론 2.2 텍스트 프로세싱을 위한 일반적인 도구 2.2.1 문자열 조작 도구 2.2.2 토큰과 토큰 분리 2.2.3 품사 배정 2.2.4 어간 추출 2.2.5 문장 탐지 2.2.6 구문 분석과 문법 2.7.7 시퀀스 모델링 2.3 일반 파일 형식에서 콘텐츠의 전처리와 추출 2.3.1 전처리의 중요성 2.3.2 아파치 티카를 사용한 콘텐츠 추출 2.4 정리 2.5 참고 자료 3장. 검색 3.1 검색과 패싯 사례: 아마존 3.2 검색 개념 개론 3.2.1 콘텐츠로 색인 만들기 3.2.2 사용자 입력 3.2.3 벡터 공간 모델로 문서 순위화 3.2.4 결과 표시 3.3 아파치 솔라 검색 서버 소개 3.3.1 ...
  • 그랜트 잉거솔(Grant Ingersoll) [저]
  • 검색과 자연언어 처리 도구를 개발하는 루시드 이미지네이션Lucid Imagination의 창업자다. 루시드 이미지네이션을 창업하기 전에는 시라큐즈 대학의 자연언어 처리 센터의 시니어 소프트웨어 엔지니어였다. 자연언어 처리 센터와 그 이전에는 MNIS-텍스트와이즈(TextWise)에서 정보 검색, 질의응답, 클러스터링, 요약, 카테고리 분류를 수반하는 다수의 텍스트 처리 애플리케이션을 개발했다. 아파치 루씬(Lucene) 자바 프로젝트의 커미터이면서 강연자이자 트레이너이고, 아파치 머하웃(Mahout) 기계학습 프로젝트의 공동 창립자다. 시라큐즈 대학에서 컴퓨터과학 석사학위를 받았으며, 암허스트 칼리지에서 수학과 컴퓨터과학 학사학위를 받았다.
  • 임혜연 [저]
  • 다양한 경험을 추구하며 사는 개발자다. 프로그래밍 언어와 사람이 쓰는 언어 모두에 관심이 있다. 검색엔진, 모바일 메신저 앱, 회원 서비스, 지역 검색, 운영 도구, 사용자 참여 콘텐츠 서비스를 개발하고 있다. 사람이 데이터를 만들고 데이터가 흐르면서 다양한 일이 생기는 것에 재미를 느낀다.
    옮긴 책으로는 『데이터 접근 패턴 Data Access Patterns』(2013, 에이콘), 『자연어 텍스트 처리를 통한 검색 시스템 구축』(2014, 에이콘), 『파이썬 성능 높이기 2/e』(2018, 에이콘)이 있다.
  • 전체 0개의 구매후기가 있습니다.

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환 및 반품이 가능한 경우
상품을 공급 받은 날로부터 7일이내 가능
공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월 이내,
   혹은 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일 이내
상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능
교환 및 반품이 불가능한 경우
구매확정 이후(오픈마켓상품에 한함)
고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우
   (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우
포장 개봉되어 상품 가치가 훼손된 경우
다배송지의 경우 반품 환불
다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.
중고상품의 교환
중고상품은 제한된 재고 내에서 판매가 이루어지므로, 교환은 불가능합니다.
오픈마켓 상품의 환불
오픈마켓상품에 대한 책임은 원칙적으로 업체에게 있으므로, 교환/반품 접수시 반드시 판매자와 협의 후 반품 접수를 하셔야하며,
   반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가능할 수 있으니 유의하시기 바랍니다.
배송예정일 안내
인터파크 도서는 모든 상품에 대해 배송완료예정일을 웹사이트에 표시하고 있습니다.
<인터파크 직배송 상품>
상품은 월~토요일 오전 10시 이전 주문분에 대하여 당일 출고/당일 배송완료를 보장하는 상품입니다.
상품은 서울지역/평일 주문분은 당일 출고/익일 배송완료를 보장하며,
서울외지역/평일 주문분의 경우는 오후 6시까지 주문분에 대하여 익일 배송완료를 보장하는 상품입니다.
(단, 월요일은 12시까지 주문에 한함)
상품은, 입고예정일(제품출시일)+택배사배송일(1일)에 배송완료를 보장합니다.
~ 상품은 유통특성상 인터파크에서 재고를 보유하지 않은 상품으로
주문일+기준출고일+택배사배송일(1일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※기준출고일:인터파크가 상품을 수급하여 물류창고에서 포장/출고하기까지 소요되는 시간
<업체 직접배송/오픈마켓 상품>
~ 상품은 업체가 주문을 확인하고, 출고하기까지 걸리는 시간입니다.
주문일+기준출고일+택배사배송일(2일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※5일이내 출고가 시작되지 않을시, 오픈마켓 상품은 자동으로 주문이 취소되며, 고객님께 품절보상금을 지급해 드립니다.
배송비 안내
도서(중고도서 포함)만 구매하시면 : 배송비 2,000원 (1만원이상 구매 시 무료배송)
음반/DVD만 구매하시면 : 배송비 1,500원 (2만원이상 구매 시 무료배송)
잡지/만화/기프트만 구매하시면 : 배송비 2,000원 (2만원이상 구매 시 무료배송)
도서와 음반/DVD를 함께 구매하시면 : 배송비 1,500원 1만원이상 구매 시 무료배송)
도서와 잡지/만화/기프트/중고직배송상품을 함께 구매하시면 : 2,000원 (1만원이상 구매 시 무료배송)
업체직접배송상품을 구매시 : 업체별로 상이한 배송비 적용

   * 세트상품의 경우 부분취소 시 추가 배송비가 부과될 수 있습니다.
   * 북카트에서 배송비없애기 버튼을 클릭하셔서, 동일업체상품을 조금 더 구매하시면, 배송비를 절약하실 수 있습니다.
해외배송 안내
인터파크도서에서는 국내에서 주문하시거나 해외에서 주문하여 해외로 배송을 원하실 경우 DHL과 특약으로 책정된 요금표에
   의해 개인이 이용하는 경우보다 배송요금을 크게 낮추며 DHL(www.dhl.co.kr)로 해외배송 서비스를 제공합니다.
해외배송은 도서/CD/DVD 상품에 한해 서비스하고 있으며, 다른 상품을 북카트에 함께 담으실 경우 해외배송이 불가합니다.
해외주문배송 서비스는 인터파크 도서 회원 가입을 하셔야만 신청 가능합니다.
알아두세요!!!
도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
오픈마켓업체의 배송지연시 주문이 자동으로 취소될 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 기준으로 배송됩니다.
유통의 특성상 출고기간은 예정보다 앞당겨지거나 늦춰질 수 있습니다.
택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다.
  • 0개
  • 0개