전체적인 느낌은 실제 파이썬을 활용한 데이터 분석 내용을 꾹꾹 눌러 담았다. 였습니다.


총평

도서관련 전체적인 감상

시중에 나온 일반적인 파이썬 데이터분석 도서들은 파이선 기초 2/5, Pandas Numpy 2/3 그리고 시각화를 위한 Matplotlib 1/3 로 구성되어 있습니다. 이러한 초보자를 대상으로 하는 책들은 파이썬을 활용한 기본적인 분석 까지만 가능하고 실무에 적용하기 까지는 비어있는 부분이 많은 것 또한 사실 입니다.

이 책은 실제 실무에 적용하는 분석방법을 차례로 알려주고 있는 책이었습니다. 대략 400 페이지 속에서 파이썬 문법 (특히 Pandas) 및 통계적인 지식 을 기초로 실무분석 내용까지 함께 다루고 있습니다. 이 책을 적극 추천하는 분은 초보자 대상의 파이썬을 활용한 데이터분석 관련 강의를 한번 이해하신 분들 중, 통계적인 분석 과 관련하여 기본적인 내용들을 접하신 뒤에 이 책을 진행하신다면 많은 부분은 챙겨가실 수 있었습니다.

이는 이 책을 진행하다가 코딩 부분이 어려우신 분 들이라면, 파이썬 데이터 분석 관련 얇은책 하나를 보고나서 진행하신다면 많은 도움이 될 것이고, 혹은 통계적인 분석 부분이 이해가 어려운 분 들이라면 통계적 기초 관련 얇은책을 읽은 뒤 나머지 내용들을 진행한다면 많은 도움이 될 것입니다.

Pandas-Profiling (ydata-profiling)

이 책의 가장 큰 장점은 Chat GPT 그리고 ydata-profiling (Pandas-Profiling) 모듈을 활용하여 도메인 지식 (domain knowledge : 정의역 지식, 분야 지식은 특정한 전문화된 학문이나 분야의 지식) 을 빠르게 파악하는 능력까지 독자들에게 전달해 주는 부분이 가장 유익한 부분이었습니다.

위에서 언급한 것처럼 일반적인 통계적 분석 너머까지 이해하기 위해서는 분석비용이 많이 드는데, 이처럼 ChatGPT 의 무료기능과 파이썬 오픈소스 를 활용하여 전문적인 데이터 분석 리포트 를 무료로 독자들이 직접 작성할 수 있도록 해주는 부분이 이 책의 가장 큰 장점 입니다. 이 부분만 이해하신다면 이 책의 값어치 그 이상을 가져가실 수 있을 것입니다.

Pandas-Profiling 모듈은 올해 23년 6월 이후로 ydata-profiling 으로 변경이 되었습니다. 이유는 대규모 데이터를 핸들링하는 Apache Spark 를 함께 지원하면서 모듈이 합쳐지게 되었습니다.

ydata profile 분석내용


도서 둘러보기

1장 데이터 드리븐 보고

이 부분은 인문학적인 내용을 다루는 부분으로, 데이터 중심의 의사결정 의 개념 및 필요한 사전지식들을 다루고 있습니다. 저자가 조직 내부의 인력관리 (Human Resource) 분야에서 일하고 있어서 이 부분에 관련한 예시 및 내용들이 나오고 있어서 기업에서 생활을 하시는 분들이라면 예시까지도 흥미있게 접근하실 수 있을 것입니다.

2장 데이터 드리븐 보고절차

Pandas & Scipy 파이썬 모듈 학습

파이썬을 활용한 기술통계적 분석 을 다루고 있습니다. 파이썬 실습 뿐만이라 아니라, 통계적인 내용을 아래의 사진과 같이 함께 다루고 있어서 통계지식이 부족한 독자들에게 많은 도움이 될 것입니다.

2장 96p

3장 데이터 드리븐 보고 실전사례 with 챗GPT

기술통계적 분석 에 관한 용어와 개념들의 이해, 그리고 이를 바탕으로 파이썬 실습하는 과정이 2장의 내용이었다면, 3장에서는 도메인 지식 (domain knowledge : 정의역 지식, 분야 지식은 특정한 전문화된 학문이나 분야의 지식) 을 얻는데 필요한 오픈소스 및 무료 도구들을 활용하는 내용을 다루고 있습니다.

ydata profile 분석내용

챗GPT 도 앞에서 다룬 것처럼 파이썬 코딩이 아닌, OpenAI 의 ChatGPT 서비스를 활용하는 방법을 다루고 있습니다. 이 책에서는 도메인 지식을 얻는 내용 보다는 효과적인 파이썬 소스코드를 얻는 용도로 챗GPT 서비스를 활용하고 있습니다.

Chat GPT 를 활용한 파이썬 코드

4장 데이터 드리븐 커뮤니케이션

마지막 50p 에 해당되는 내용으로 분석한 내용을 조직내에서 소통하는데 보다 효과적인 스킬들을 정리하고 있습니다.


마무리

이 책의 핵심은 2장과 3장 입니다. 특히 2장의 기술통계 분석 은 분석 프로세스 단위로 개념들을 설명하고, 설명한 내용을 파이썬 실습과정까지 연결하여 내용의 이해 및 실습을 할 수 있도록 짜임새 있게 구성되어 있었습니다. 이러한 점으로 인해 기술통계 내용을 이해하고 있는 파이썬 초보자 분들에 가장 적합한 내용들을 담고 있습니다.

반대로 파이썬은 다룰줄 알지만 기술통계 내용이 부족한 분들에게도 기술통계적인 내용 설명들을 차근차근 따라가다 보면, 실전 업무에 투입되더라도 당황하지 않고 대처가 가능할 정도로 많은 도움이 될 것입니다.

※ 본 리뷰는 IT 현업개발자가, 한빛미디어 책을 제공받아 작성한 서평입니다.

데이터 드리븐 리포트 (리뷰도서)