금융에 특화된 파이썬(Python) 책은 흔치 않다. 그런 관점에서 이 책은 금융에 관련된 다양한 파이썬 라이브러리는 물론 최근의 딥러닝 기법까지 같이 소개하고 있다. 이 책 한 권이면 금융 데이터의 처리와 기술분석부터 시작해 시계열을 모델링하는 방법을 배울 수 있다. 이와 함께 다팩터 모델은 물론 변동성을 모델링하는 GARCH와 자산을 배분하는 방법도 파이썬을 통해 실습해 볼 수 있다.
각 장별로 코드를 따라 하다 보면 금융과 관련된 다양한 지식을 파이썬과 동시에 습득할 수 있게 되는 것은 물론 머신리닝 기법을 사용해 신용불량 예측을 수행해 보는 실습을 할 수 있다.
이 책의 후반부에는 금융에 사용되는 다양한 딥러닝 기법도 소개하고 있다. 금융과 직접 연계된 실습을 따라 해 볼 수 있는 흔치 않은 기회가 될 것이다.
데이터 과학은 통계적 지식을 기반으로 하고 있다. 이 책은 데이터 과학의 기초가 되는 이론에서부터, SPSS나 Stata 등의 응용 프로그램을 사용하는 방법까지 예제를 통해 설명하고 있다. 데이터 과학을 기초부터 이해하고자 하는 초심자는 이 책을 꾸준히 학습하기를 권한다.
인공지능은 이제 우리 근처의 일상으로 다가오고 있다. 마이크로소프트의 Azure 포털에는 이미지 처리, 지능형 검색, NLP, 챗봇과 같은 다양한 애플리케이션이 통합돼 제공되며, 사용자는 몇 번의 마우스 클릭만으로도 다양한 서비스를 생성할 수 있다. 이 책은 Microsoft Cognitive Services를 중심으로 다양한 인공지능 솔루션의 사용 방법을 매뉴얼 형식으로 설명하고 있다.
이 책을 따라가다 보면, 이제 인공지능이 정말 우리 근처에 가까이 다가왔다는 사실을 깨닫게 될 것이다.
딥러닝의 기초부터 최신 기술 동향까지 한눈에 쉽게 파악할 수 있도록 구성돼 있다. 특히 케라스를 완전 통합한 텐서플로 2.0의 풍부한 예제와 함께 현재 활발히 연구가 진행중인 AutoML까지 다룬다. 딥러닝을 처음 시작하는 사람도 어렵지 않을 정도로 친절히 안내하면서도 딥러닝의 핵심인 역전파의 이면에서 벌어지고 있는 수학적 의미에 대한 해부에 한 장을 할애할 정도로 전문적인 설명도 빠트리지 않는다.
책의 후반부에는 최신 트렌드인 에지에서의 연합학습을 포함해 분산 훈련에 관한 자세한 설명과 함께 TPU를 사용해 수행 속도를 향상시킬 수 있는 방법을 예제와 함께 제공한다.
편안한 마음으로 책을 따라가다 보면 어느새 최신 기조인 텐서플로 2.0의 전문가가 돼 있을 것이다.
수치 해석 알고리즘을 공부해본 사람이라면 『Numerical Recipes』(William Press, 2007)를 잘 알고 있을 것이다. 이 책은 'Numerical Recipes in Python'이라는 별명을 붙여도 될 만큼 Python을 사용한 과학 컴퓨팅에 있어 이와 유사한 수준의 정교하고 깊이 있는 설명이 담겨 있다.
SciPy, NumPy를 기반으로 수많은 과학 및 공학 문제를 Python을 이용해 기호적 기법과 수치적 기법으로 처리하는 방법, scikit-learn을 이용한 머신 러닝을 설명하고 있다. 각 모듈 설명은 사용법에만 그치지 않고 모듈의 종속성 및 구현 철학도 자세히 설명하고 있다. 행렬 및 희소 행렬, 벡터, 상미분과 편미분, 적분, 인수분해, 시계열, 선형 대수, 통계 모델링, 머신 러닝, 신호 처리 등과 같은 이공계의 대표적인 문제 해결에 있어 Python을 어떻게 활용할 수 있는지 예제를 통해 상세히 설명해준다. 이 책에서 제공하는 풍부한 예제를 따라 하다 보면 Python을 통한 과학적 연산을 효과적으로 익히게 될 것이다.
파이썬을 사용해 마케팅 분석을 수행하는 각종 방법론을 설명한 책이다. 통계적인 유의성에 기반해 다양한 마케팅 사례를 설명하는데, 마케팅 사례 분석을 위해 파이썬의 문법과 함께 통계적 분석 또한 동시에 배울 수 있으므로 일석삼조의 효과를 볼 수 있다. 특히 다양한 그래픽 기법을 통해 데이터 분석에 있어 가장 중요한 시각화 기법을 익힐 수 있다.
다양한 통계 수학이 동원되지만, 복잡한 수식을 전개하는 것은 최대한 자제했으며 대부분의 개념을 어려운 수학을 이해하지 않고도 습득할 수 있도록 배려한 부분 또한 돋보인다. 마케팅에 종사하고 있는 사람이거나, 혹은 마케팅 분야가 아니더라도 기초 데이터의 통계적 분석 기법을 파이썬을 통해 배우고자 한다면 이 책은 좋은 선택이 될 것이다.
파이썬을 전혀 모르는 사람들을 위해 한 장에 걸쳐 파이썬의 주요 기본 문법과 데이터 유형을 일목요연하게 정리했다. 따라서 데이터 분석에 관심이 있는 사람은 물론 처음으로 파이썬을 배우고자 하는 사람들에게도 좋은 지침서가 될 수 있을 것이다.
구조화된 데이터를 다룰 때 최적의 편의성을 제공해주는 pandas 라이브러리의 거의 모든 것을 정리해 둔 책이다. 이미 1판에서 다양한 예제를 통해 pandas 라이브러리를 상세히 설명했지만, 2판에서는 더 많은 예제를 통해 좀 더 친절하고 풍부한 내용을 전달한다. 특히 pandas의 그룹화, 체인, 집계 함수를 동시에 사용하는 방법을 접하게 되면 기존의 까다롭고 복잡한 연산을 단순하게 구현하는 일을 할 수 있음에 놀랄 것이다.
데이터 분석의 중요성과 데이터 과학자의 필요성에 대한 목소리는 하루가 다르게 커져가고 있지만, 데이터 분석에서 소위 '정돈된 데이터(Tidy data)'의 필요성과 데이터 전처리의 중요성을 여전히 잘 인식하지 못하는 듯하다. 특히 파이썬을 이용해 데이터를 분석하는 대부분의 사람들은 늘 pandas를 사용하면서도 정작 pandas의 전체 기능을 제대로 학습하려는 노력은 많이 부족한 듯하다. DataFrame과 Series 등 pandas의 근간이 되는 데이터 구조에서 자신이 원하는 부분만 정확히 선택하되 가장 효율적인 방식으로 처리하는 방법을 풍부한 예제를 통해 배울 수 있다.