전자책
전자책
서비스 메인 이미지
상세이미지-0상세이미지-1상세이미지-2상세이미지-3상세이미지-4상세이미지-5
목차

[목차]

왜 이 책으로 공부해야하는가?
왜 하필 전처리를 공부하는가?
PYTHON 시작하기
- Anaconda 설치
- 가상환경 구성
- Jupyter Notebook 사용
탐색적 자료 분석 (EDA, EXPLORATORY DATA ANALYSIS)
- 실습 Data (Kaggle : Data scientist salary)
- info
- describe
- shape
- type
- isna
- notnull
- head & tail
데이터 선택하기
- DataFrame
- Series
- loc
- iloc
- boolean indexing
- select_dtypes
- drop
- reset_index
- 계통추출
- quantile (IQR)
데이터 합치기
- 실습 Data (Kaggle : Life Expectancy)
- merge
- concat
데이터 처리하기
- groupby
- pivot_table
- stack
- unstack
- apply
- map
- lambda
시계열 데이터
- 실습 Data (서울 열린 데이터광장 : 서울시 소비자물가지수(지출목적별) 통계)
- to_datetime
- strptime, strftime
- date_range
- shift
- rolling
마치며

서비스 설명

이 책을 만들게 된 계기는 ADP 취득을 위해 제가 겪었던 시행착오를 여러분들이 겪지 않기를 바라기 때문입니다.


시중에 ADP 취득을 위한 교재와 강의가 있지만 실전에서의 전처리를 다루기보단 이론적인 설명이 대부분이었습니다. 그래서 실제로 데이터를 가지고 이런저런 방식으로 전처리를 하면서 모르는 것들은 블로그도 돌아다니고 라이브러리 공식 문서도 보면서 해결했습니다.


우여곡절 끝에 ADP를 취득하고 나서 제가 했던 시행착오를 정리해서 전처리만 집중적으로 다룬 모음집을 만들고 싶었고 전자책을 만들게 되었습니다.


Python은 데이터 분석 뿐만 아니라 다양한 용도로 사용되는 언어입니다. 따라서 동일한 결과를 다양한 방법으로 도출해낼 수 있는 장점이 있지만 반면에 배워야할 것들이 기하급수적으로 늘어난다는 단점이 있습니다.


데이터 분석 전처리에 필요한 방법을 최소화 하기 위해 Pandas 라이브러리에 집중했습니다. 기본적인 Python 객체와 numpy 라이브러리도 일부 사용했지만 극히 일부라고 생각하시면 됩니다.

이 책에서 제시하는 수준만 도달한다면 ADP에 합격할 수 있습니다. 왜냐하면, 제가 딱 이정도만 알고 합격했기 때문입니다.


난이도가 매우 어렵다는 소문에 겁먹지 마시고 차근차근 배워서 꼭 ADP 취득하시기 바랍니다!


* Github에 notebook이 공유되어 있으며 주소는 책에 포함되어 있습니다.

취소 및 환불 규정

다른 분들이 함께 본 서비스

상품정보고시
리뷰
0.0
| 0건