>
>
>
모두의 한국어 텍스트 분석 with 파이썬 
모두의 시리즈1 ㅣ 길벗
  • 정가
27,000원
  • 판매가
24,300원 (10% ↓, 2,700원 ↓)
  • 발행일
2023년 05월 29일
  • 페이지수/크기
316page/183*235*0
  • ISBN
9791140704521/1140704524
  • 배송비
무료배송
  • 배송예정일
10/05(목) 배송완료예정
  • 현 보유재고
100 권 이상
  • 주문수량
  • 바로구매 북카트담기
  • 제휴몰 주문 시 고객보상, 일부 이벤트 참여 및 증정품 증정, 하루/당일 배송에서 제외되므로 참고 바랍니다.
  • 시리즈 도서
모두의 시리즈(총26건)
모두의 한국어 텍스트 분석 with 파이썬     24,300원 (10%↓)
모두의 스크래치 게임제작 : 누구나 쉽게 배우는 게임 프로그래밍 기초     19,800원 (10%↓)
모두의 아두이노 환경 센서 : 내 몸을 살리는 아두이노, 환경 오염 측정 센서 18가지!     19,800원 (10%↓)
모두의 데이터 과학 with 파이썬 : 수집 정리 탐구 예측 가치로 배우는 기초 데이터 과학     19,800원 (10%↓)
모두의 자바 : 하루 30분, 쉽게 배우는 자바 프로그래밍     18,000원 (10%↓)
  • 상세정보
  • 먼 미래의 거대 모델도 작은 모델에서 시작! 지금 당장 내 손으로 직접 작고 간단한 모델을 구현해보자! 정말 쉽게 누구나 따라 해볼 수 있는 실전형 프로젝트 4가지 수록! 컴퓨터는 한국어를 어떻게 이해할 수 있을까? 컴퓨터로 한국어 텍스트를 다루는 데는 무엇이 필요할까? 맨땅에서 텍스트 분석을 시작하려 할 때 또는 텍스트 분석과 자연어 처리 분야의 기본기를 탄탄히 다지며 재정비하고 싶을 때 반드시 알아야 하는 내용만 담았다. 우선 본격적인 프로젝트를 시작하기 전에 텍스트 분석에 필요한 파이썬 기초 개념과 필수 파이썬 라이브러리의 기본 사용법을 살펴보면서, 텍스트 데이터 전처리 기능과 방법을 익힌다. 다음으로 텍스트 분석의 기본 개념이자 텍스트를 수치 형태의 데이터로 변환하는 벡터화 방법인 단어 가방 모형과 TF-IDF를 배운다. 이어서 네 가지 다른 한국어 데이터를 가지고 실제 프로젝트를 진행해본다. 프로젝트는 데이터 다운로드부터 전처리, 시각화까지 전 과정을 다루며, 실습은 지금 당장 어디서라도 쉽게 진행할 수 있게 코랩으로 준비했다.
  • 누구나 쉽게 다양한 한국어 텍스트 데이터를 분석할 수 있다! 준비: 코랩 환경과 파이썬 기초 이 책의 예제와 프로젝트는 코랩에서 설치 없이, 클릭만으로 바로 실행할 수 있다. 본격적인 프로젝트를 시작하기 전에 텍스트 분석에 필요한 파이썬 기초 개념과 필수 파이썬 라이브러리인 판다스, 넘파이, 사이킷런의 기본 사용법을 살펴보면서, 텍스트 데이터 전처리 기능과 방법을 익힌다. 개념: 텍스트 분석 방법의 기본 개념 컴퓨터가 한국어를 어떻게 이해하는지, 텍스트 데이터를 어떻게 분석하는지 텍스트 분석 방법의 기본 개념을 이해한다. 그리고 머신러닝/딥러닝 라이브러리를 사용하기 위해 텍스트를 수치 형태의 데이터로 변환하는, 벡터화 방법으로 단어 가방 모형과 TF-IDF를 배운다. 프로젝트: 네 가지 실제 프로젝트 분석 네 가지 다른 한국어 데이터를 가지고 실제 프로젝트를 진행해본다. (1) 연합뉴스 타이틀 주제 분류 (2) 국민청원 텍스트 분석 (3) 120다산콜재단 데이터 토픽 모델링과 유사도 분석 (4) 인프런의 이벤트 댓글 텍스트 군집 분석 [추천평] 처음 운전을 배울 때, 자동차에 대한 모든 것을 알 필요도 없고 그렇게 가르쳐 주지도 않습니다. 자동차를 운전할 수 있는 기본 요령만 알고 시작합니다. 운전에 재미를 붙이고 익숙해지고 난 뒤에 하나씩 자동차에 대해서 알아가면 됩니다. 자연어 처리도 이와 비슷합니다. 책의 내용을 차분히 따라 하다 보면, 어느새 작은 규모의 프로젝트를 손수 구성해 볼 수 있을 것입니다. 송상헌_고려대학교 언어학과 이 책은 이론 설명에서 멈추지 않고, 데이터 획득, 코드 실습 방법을 알려 주면서 일반인도 쉽게 보고 만지면서 이해할 수 있게 해 줍니다. 첫 장을 들추고 마지막 장을 덮기까지 책을 손에서 놓기가 어려운 짜임새, 읽기 쉬운 문장들이 저자의 지식을 독자에게 쉽게 전달하기 위해 정성을 많이 들였다는 것을 알 수 있었습니다. 전창욱_LG AI Research 이 책은 기본을 이해하고, 실제 사용 방법을 익힐 수 있는 매우 좋은 책이다. 초보자부터 전문가까지 모두에게 유용한 자료가 되기를 기대한다. 고병일_카카오엔터프라이즈 자연어 처리 개발자 자연어 처리 분야에서 오랫동안 교육과 연구에 전념해 온 두 분이 함께 내신 책인 만큼 사례 위주로 접근해 나의 연구에 적용해 볼 것을 권합니다. 텍스트 분석은 해당 분야를 전공한 개발자나 연구자뿐만 아니라 다른 백그라운드를 지닌 개발자, 사업을 기획/운영하는 사람, 도메인 전문가 들이 21세기에 꼭 배워야 할 기술 중 하나라고 생각합니다. 이상열_데이터 분석가, 엔픽셀 데이터사이언스 셀장 자연어 처리 전성 시대에 텍스트 분석에 대한 다양한 예제와 자세한 설명이 담긴 책이 나와서 너무 즐겁게 읽었습니다. 실습에 필요한 내용도 꼼꼼하게 잘 들어 있고, 코드에 대한 설명도 이해하기 쉽게 되어 있어서 텍스트 분석에 입문하는 분도, 경험이 있으신 분도 많은 도움을 받을 것입니다. 이진원_뉴블라 CTO, AI 반도체 개발 및 AI 알고리즘 연구 초심자가 따라갈 수 있을 정도의 친절함과 필요한 내용만 담은 간결함, 두 마리 토끼를 동시에 잡은 책입니다. 김태권_만화가 초심자가 이해하기 쉽게 설명한 내용들, 실행하며 따라 하기 좋은 예제 코드들이 가니시(garnish)처럼 매력을 더해 줍니다. 특히 후반부의 매력적인 프로젝트들은 자연어 처리로 무엇을 할 수 있는지 궁금한 분들이 이 책을 펼치게 만들어 줄 것입니다. 김현_자연어 처리 연구자 한글 텍스트 분석을 시작할 때 모두가 참고하던 명강의가 드디어 책으로 탄생했다는 기쁜 소식을 듣고 한걸...
  • 1장 코랩 시작하기 LESSON OT 들어가며 LESSON 01 코랩 실행하기 ____1 주석 ____2 단축키 LESSON 02 코랩에서 실습 코드 열기 ____1 코랩 테마 2장 파이썬에서 문자열 다루기 LESSON OT 들어가며 LESSON 01 문자열 실습 전에 LESSON 02 문자열 실습 ____1 문자열 표현 ____2 오류 처리 ____3 표현 방법 + 오류 처리 LESSON O3 문자열을 다루는 여러 방법 ____1 변수 ____2 인덱싱 ____3 슬라이싱 ____4 문자열의 길이, 단어 수 ____5 문자열 함수 ____6 반복 ____7 함수 ____8 문자열 내장 메서드 목록 3장 라이브러리 다루기 LESSON OT 들어가며 LESSON 01 판다스 ____1 데이터 프레임과 시리즈 이해하기 ____2 str 접근자로 문자열 다루기 LESSON 02 넘파이 ____1 넘파이 배열 이해하기 ____2 맷플롯립으로 넘파이 배열 시각화하기 4장 단어 가방 모형과 TF-IDF LESSON OT 들어가며 LESSON 01 단어 가방 모형 ____1 단어 가방 모형을 만드는 방법 ____2 단어 가방 모형 만들기 ____3 n-gram: 앞뒤 단어 묶어서 사용 ____4 min_df와 max_df: 빈도수 설정 ____5 max_features: 학습 단어 개수 제한 ____6 stop_words: 불용어 제거 ____7 analyzer: 문자...
  • [지은이 서문] “사소한 텍스트 처리 방법을 배워 언제 거대 모델을 만들 수 있을까?” 초거대 모델의 엄청난 성능을 볼 때면 비교적 적은 데이터와 간단한 작업으로 무엇을 할 수 있을지 고민이 된다. 하지만 초거대 모델도 작은 시도에서 시작됐을 것이다. 최근 모델은 코드 한두 줄의 API만 있다면 이미지나 텍스트를 생성해 내거나 질문을 하면 마치 사람처럼 답변을 준다. 하지만 텍스트로 직접 작고 간단한 모델이라도 구현하려면 어디에서부터 시작해야 할지 난감하다. 텍스트 분석을 하며 다양한 도메인의 다양한 전공자들을 만나면서 어떻게 쉽게 기술과 내용을 전달할 수 있을지 고민했던 과정이 모여서 이 책이 되었다. 하루가 다르게 새로운 연구가 쏟아져 나오는 시기에 텍스트 분석의 기본을 익혀 보는 데 좋은 시작점이 되었으면 하는 바람이다. - 지은이 박조은 서문 중에서 “한국어 텍스트 분석 책이 없으면 영어 텍스트 분석하는 방법이랑 똑같이 하면서 글자만 한글로 바꾸면 되는 거 아닌가?” 하지만 처음 시작하는 사람은 한글이 깨져 보이면 ‘UTF-8 인코딩’이란 단어를 검색해야 하는 것을 모른다. 또한, 어떤 데이터로 시작해야 할지도 막막하고, 책이나 강의에서는 잘 돌아가는 코드가 내가 하면 에러가 나는 이유를 매번 누군가에게 물어보기도 어렵다. 누구나 그렇다. 아는 사람이 보면 아주 낮은 턱이라도 모르는 사람은 넘기가 어렵다. 이 책은 한국어로 된 다양한 텍스트를 다루면서, 데이터를 바꾸면서 달라지는 부분을 익히고, 같은 부분은 반복하면서 자연스럽게 넘파이, 판다스, 사이킷런을 익힐 수 있도록 고심해서 구성했다. 그런데도 3장에서 4장으로 넘어갈 때 난이도가 점프한다는 느낌을 받을 것이다. 하지만 6장을 넘어서면 드디어 2년 차 직장인처럼 “아! 비슷비슷하구나!” 하고 느낄 수 있기를 소망한다. 버전이 안 맞아서 안 되는 부분은 스스로 수정한 후 깃허브에 올려 보면 공부하는 데 도움이 많이 될 것이다. 잘 안 되어도 포기하지 말고 문의를 남겨 해결한 뒤 계속 공부하기를 바란다. 창의적인 부분에도 도전하면서 수동적 독자가 아닌 적극적 동반자로 함께하기를 바란다. 그 후에는 텍스트 분석의 방법이 딥러닝의 블랙박스를 밝히는 데도 도움이 될 것이다. - 지은이 송영숙 서문 중에서
  • 전체 0개의 구매후기가 있습니다.

인터파크도서는 고객님의 단순 변심에 의한 교환과 반품에 드는 비용은 고객님이 지불케 됩니다.
단, 상품이나 서비스 자체의 하자로 인한 교환 및 반품은 무료로 반품 됩니다.
교환 및 반품이 가능한 경우
상품을 공급 받은 날로부터 7일이내 가능
공급받으신 상품의 내용이 표시, 광고 내용과 다르거나 다르게 이행된 경우에는 공급받은 날로부터 3개월 이내,
   혹은 그사실을 알게 된 날 또는 알 수 있었던 날로부터 30일 이내
상품에 아무런 하자가 없는 경우 소비자의 고객변심에 의한 교환은 상품의 포장상태 등이 전혀 손상되지 않은 경우에 한하여 가능
교환 및 반품이 불가능한 경우
구매확정 이후(오픈마켓상품에 한함)
고객님의 책임 있는 사유로 상품 등이 멸실 또는 훼손된 경우
   (단, 상품의 내용을 확인하기 위하여 포장 등을 훼손한 경우는 제외)
시간이 지남에 따라 재판매가 곤란할 정도로 물품의 가치가 떨어진 경우
포장 개봉되어 상품 가치가 훼손된 경우
다배송지의 경우 반품 환불
다배송지의 경우 다른 지역의 반품을 동시에 진행할 수 없습니다.
1개 지역의 반품이 완료된 후 다른 지역 반품을 진행할 수 있으므로, 이점 양해해 주시기 바랍니다.
중고상품의 교환
중고상품은 제한된 재고 내에서 판매가 이루어지므로, 교환은 불가능합니다.
오픈마켓 상품의 환불
오픈마켓상품에 대한 책임은 원칙적으로 업체에게 있으므로, 교환/반품 접수시 반드시 판매자와 협의 후 반품 접수를 하셔야하며,
   반품접수 없이 반송하거나, 우편으로 보낼 경우 상품 확인이 어려워 환불이 불가능할 수 있으니 유의하시기 바랍니다.
배송예정일 안내
인터파크 도서는 모든 상품에 대해 배송완료예정일을 웹사이트에 표시하고 있습니다.
<인터파크 직배송 상품>
상품은 월~토요일 오전 10시 이전 주문분에 대하여 당일 출고/당일 배송완료를 보장하는 상품입니다.
상품은 서울지역/평일 주문분은 당일 출고/익일 배송완료를 보장하며,
서울외지역/평일 주문분의 경우는 오후 6시까지 주문분에 대하여 익일 배송완료를 보장하는 상품입니다.
(단, 월요일은 12시까지 주문에 한함)
상품은, 입고예정일(제품출시일)+택배사배송일(1일)에 배송완료를 보장합니다.
~ 상품은 유통특성상 인터파크에서 재고를 보유하지 않은 상품으로
주문일+기준출고일+택배사배송일(1일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※기준출고일:인터파크가 상품을 수급하여 물류창고에서 포장/출고하기까지 소요되는 시간
<업체 직접배송/오픈마켓 상품>
~ 상품은 업체가 주문을 확인하고, 출고하기까지 걸리는 시간입니다.
주문일+기준출고일+택배사배송일(2일)에 배송완료를 보장합니다.(토/공휴일은 배송기간에 포함되지 않습니다.)
※5일이내 출고가 시작되지 않을시, 오픈마켓 상품은 자동으로 주문이 취소되며, 고객님께 품절보상금을 지급해 드립니다.
배송비 안내
도서(중고도서 포함)만 구매하시면 : 배송비 2,000원 (1만원이상 구매 시 무료배송)
음반/DVD만 구매하시면 : 배송비 1,500원 (2만원이상 구매 시 무료배송)
잡지/만화/기프트만 구매하시면 : 배송비 2,000원 (2만원이상 구매 시 무료배송)
도서와 음반/DVD를 함께 구매하시면 : 배송비 1,500원 1만원이상 구매 시 무료배송)
도서와 잡지/만화/기프트/중고직배송상품을 함께 구매하시면 : 2,000원 (1만원이상 구매 시 무료배송)
업체직접배송상품을 구매시 : 업체별로 상이한 배송비 적용

   * 세트상품의 경우 부분취소 시 추가 배송비가 부과될 수 있습니다.
   * 북카트에서 배송비없애기 버튼을 클릭하셔서, 동일업체상품을 조금 더 구매하시면, 배송비를 절약하실 수 있습니다.
해외배송 안내
인터파크도서에서는 국내에서 주문하시거나 해외에서 주문하여 해외로 배송을 원하실 경우 DHL과 특약으로 책정된 요금표에
   의해 개인이 이용하는 경우보다 배송요금을 크게 낮추며 DHL(www.dhl.co.kr)로 해외배송 서비스를 제공합니다.
해외배송은 도서/CD/DVD 상품에 한해 서비스하고 있으며, 다른 상품을 북카트에 함께 담으실 경우 해외배송이 불가합니다.
해외주문배송 서비스는 인터파크 도서 회원 가입을 하셔야만 신청 가능합니다.
알아두세요!!!
도매상 및 제작사 사정에 따라 품절/절판 등의 사유로 취소될 수 있습니다.
오픈마켓업체의 배송지연시 주문이 자동으로 취소될 수 있습니다.
출고가능 시간이 서로 다른 상품을 함께 주문할 경우 출고가능 시간이 가장 긴 기준으로 배송됩니다.
유통의 특성상 출고기간은 예정보다 앞당겨지거나 늦춰질 수 있습니다.
택배사 배송일인 서울 및 수도권은 1~2일, 지방은 2~3일, 도서, 산간, 군부대는 3일 이상의 시간이 소요됩니다.
  • 0개
  • 0개