데이터는 많은 기업에서 매우 중요해지고 있으며, 이제는 다양한 측면에서 중추적인 역할을 담당하고 있다. 사실 기업들은 데이터를 활용해 스스로를 변화시키고 있다. 이 책은 데이터에 대한 소개와 기업 및 데이터의 관련성, 그리고 디지털 방식으로 변화할 때 데이터를 사용하는 방법을 소개하면서 시작된다. 데이터를 활용하려는 기업은 우선 데이터 저장소가 필요하며, 현대에는 이를 데이터 웨어하우스가 아닌 데이터 레이크라 부른다.
최근에는 빅데이터 기술을 활용한 사례를 많이 목격할 수 있다. 데이터 레이크라는 개념은 꽤 오래됐지만, 최근 들어 기업 환경에서 더 주목 받고 있다. 이 책에서는 빅데이터와 데이터 레이크 두 가지 모두를 융합해 잘 정립한 아키텍처 패턴에 따라 최신 빅데이터 기술을 사용해 직접 데이터 레이크를 구축해본다.
이 책은 데이터 레이크와 람다 아키텍처를 하나로 결합해 독자가 기업에서 실제로 데이터 레이크를 운영할 수 있게 안내할 것이다. 여러 가지 빅데이터 기술을 상위 수준으로 소개할 것이며, 기술별로 다루는 내용은 별도의 책으로 나올 정도로 방대하기 때문에 이 책을 매뉴얼 대용으로 사용할 수는 없을 것이다. 이 책은 선택된 기술을 사용한 패턴 설명과 구현 방법 위주로 다룬다.
여기에 소개된 기술은 미래에 조직의 관련 표준에 따라 좀 더 적합한 기술로 대체될 수 있으며, 이를 염두에 두고 작성됐기 때문에 지금뿐만 아니라 오랜 시간 동안 유의미한 책이 될 수 있을 것이다. 특정 버전을 기준으로 소프트웨어 기술을 서술하지 않았기 때문에 이 책이 갖는 유효 기간은 같은 주제를 다루는 다른 책과 비교할 때 상당히 길 것이다.
이 책은 직관적이고 흥미로운 구조를 통해 당신을 환상적인 데이터 레이크의 세계로 안내할 것이다.