알라딘: 저자파일

헤더배너

분야보기

알라딘 굿즈

온라인중고

1/0 photos

신간알리미 신청

상품평점

분류

이름:

캐서린 자멀 (Katharine Jarmul)

	최근작
	2018년 12월 <파이썬 웹 스크래핑 2/e>

파이썬 웹 스크래핑 2/e

인터넷에는 매우 유용한 데이터가 존재한다. 대부분의 데이터는 공개돼 있고 무료로 접근할 수 있다. 그러나 이 데이터는 쉽게 사용할 수 없다. 웹 사이트의 구조와 스타일에 포함돼 있기 때문에 신중하게 추출해야 한다. 웹 스크래핑은 온라인에서 사용할 수 있는 풍부한 정보를 수집한 후 정보를 이해하는 수단으로 점점 더 유용해지고 있다. 이 책은 파이썬 3.7의 최신 기능을 사용해 웹 사이트에서 데이터를 스크래핑할 수 있는 최고의 가이드를 제공한다. 이 책의 초반의 여러 장에서는 정적 웹 페이지에서 데이터를 추출하는 방법을 설명한다. 레디스와 파일을 캐싱으로 사용해 시간을 절약하고 서버의 부하를 관리하는 방법을 배울 것이다. 기본적인 내용을 다룬 후에 브라우저, 크롤러, 병렬 스크래퍼를 사용해 더 정교한 크롤러를 직접 구현해 볼 것이다. PyQt와 Selenium을 사용해 자바 스크립트를 의존하는 웹 사이트에서 언제 어떻게 데이터를 스크래핑할 수 있는지 결정할 수 있을 것이다. 캡차(CAPTCHA)로 보호되는 복잡한 웹 사이트에 폼을 제출하는 방법에 대해 더 잘 이해할 수 있을 것이다. 또한 Scrapy 라이브러리로 클래스 기반 스크래퍼를 생성하는 방법을 살펴본 후 다뤘던 모든 지식을 활용해 실제 웹 사이트를 대상으로 스크래퍼을 구현할 것이다. 이 책을 다 읽고 나면 스크래퍼, 원격 스크래핑, 모범 사례, 캡차 해결하기, 기타 관련된 많은 주제를 활용해 웹 사이트를 탐험할 수 있을 것이다.

주제 분류별

소설 l 에세이 l 시 l 희곡 l 문학일반 l 문화평론 l 만화 l 어린이/유아 l 인문/사회과학 l 역사 l 경제경영/자기계발 l 과학/공학/기술 l 여행 l 예술 l 취미/실용/레저 l 가정/건강/요리/교육 l 외국어/사전 l 잡지 l 종교/역학 l 컴퓨터/인터넷 l 학습서/수험서 l 교재 l 번역 l 사진/그림

가나다별

가 l 나 l 다 l 라 l 마 l 바 l 사 l 아 l 자 l 차 l 카 l 타 l 파 l 하 l 기타

	국내문학상수상자

	국내어린이문학상수상자

	해외문학상수상자

	해외어린이문학상수상자

(주)알라딘커뮤니케이션

대표이사 최우경 고객정보보호 책임자 최우경 사업자등록 201-81-23094 통신판매업신고 2003-서울중구-01520 이메일 privacy@aladin.co.kr 호스팅 제공자 알라딘커뮤니케이션 (본사) 서울시 중구 서소문로 89-31

ⓒ Aladin Communication. All Rights Reserved.

고객센터 1544-2514 (발신자 부담)

서울시 마포구 백범로 71 숨도빌딩 7층 Fax 02-6926-2600

1:1 문의 FAQ

중고매장 위치, 영업시간 안내