도서상세보기

도서명 Python 2학년 스크래핑의 구조 : 체험으로 배우고! 대화 형식으로 공부!
저자 모리 요시나오
출판사 성안당(주
출판일 2021-11-17
정가 17,000원
ISBN 9788931556896
수량
들어가며
이 책의 예제 테스트 환경 며
이 책의 대상 독자와 2학년 시리즈에 대해
이 책을 보는 법
예제 파일과 회원 특전 PDF의 다운로드에 대해


제1장 파이썬으로 데이터를 다운로드

LESSON 01 스크래핑이 뭘까?
크롤링과 스크래핑
주의해야 할 점도 있다
robots.txt란?

LESSON 02 파이썬을 설치해 보자
윈도에 설치하는 방법
macOS에 설치하는 방법

LESSON 03 requests로 액세스해 보자
라이브러리 설치 방법
HTML 파일을 읽어 들이는 프로그램
IDLE을 시작하자
프로그램을 만들어 보자
텍스트 파일에 쓰기: open, close
텍스트 파일에 쓰기: with문


제2장 HTML을 해석해 보자

LESSON 04 HTML을 해석해 보자
Beautiful Soup 설치하기
Beautiful Soup로 해석하기
태그를 찾아 표시하기
모든 태그를 찾아 표시하기
id나 class로 검색 범위 좁히기

LESSON 05 최신 뉴스 기사 목록을 구해 보자
디벨로퍼 툴을 사용해 범위를 좁히자

LESSON 06 링크 목록을 파일로 출력해 보자
모든 링크 태그의 href 속성 표시하기
모든 링크 태그의 href 속성을 절대 URL로 표시하기
링크 목록 자동 작성 프로그램

LESSON 07 이미지를 한꺼번에 다운로드해 보자
이미지 파일을 읽어 들여 저장하기
다운로드용 폴더를 만들어 저장하기
모든 img 태그의 이미지 파일 URL을 표시한다
페이지 안 이미지를 한꺼번에 다운로드하는 프로그램


제3장 표 데이터를 읽고 쓰자

LESSON 08 pandas를 사용해 보자
pandas 설치하기
표 데이터란?
CSV 파일 읽어 들이기
열, 행 데이터 표시하기
열, 행 데이터 추가하기
열, 행 데이터 삭제하기

LESSON 09 다양한 데이터 가공
필요한 정보 추출하기
데이터 집계하기
데이터 정렬하기
행과 열 바꾸기
CSV 파
■ 이 책은

머신러닝(기계학습이나 데이터를 분석하는 데 반드시 필요한 ‘데이터’는 인터넷상에 방대하게 퍼져 있지만 파이썬을 사용하면 효율적으로 수집할 수 있다. 이러한 방법을 ‘스크래핑’이라고 합니다.

파이썬을 대략적으로 알고 계신 분들이 간단한 샘플을 만들어 보며 대화 형식으로 스크래핑의 구조를 배울 수 있습니다.

■ 대상 독자

● 파이썬의 기본 문법을 알고 있는 분(『파이썬 1학년』을 다 읽으신 분

● 데이터 수집이나 데이터 분석 초보자

■ 2학년 시리즈의 포인트 셋

● 포인트(1 기초 지식을 알 수 있다

각 장의 첫 부분에 만화나 일러스트를 넣어서 각 장에서 배울 내용을 소개합니다. 그 이후는 일러스트를 섞어가며 기초 지식에 대해 설명합니다.

● 포인트(2 프로그램의 구조를 배운다

필요한 문법을 최소한으로 선별하여 중간에 포기하지 않도록 주로 대화 형식을 통해 알기 쉽게 설명합니다.

● 포인트(3 개발 체험을 할 수 있다

프로그래밍 언어(애플리케이션 초보자들도 재미있게 배울 수 있도록 다양한 예제를 마련했습니다.

■ 이 책의 포인트

염소 박사님, 다솜 양과 함께 인터넷에서 파일을 다운로드하는 방법, HTML을 해석하는 방법, 여러 데이터를 읽고 쓰기, ‘API의 사용법’으로 불리는 데이터 수집, 편리한 라이브러리를 이용한 간단한 가시화 방법을 알아봅니다.