우리는 이른바 데이터의 황금기에 살고 있다. 사람이나 사회에 대해 궁금해 할 만한 모든 질문에 통계적으로 정확한 답변을 제공하는 데 활용할 수 있는 방대한 데이터가 존재한다. "친구의 행동은 당신이 어떤 TV 프로를 볼지 또는 어떤 사람에게 투표할지를 정하는 데 영향을 줍니까?"라는 질문에 대한 답변은 전 세계 사람들 수억 명의 사회적 활동을 기록하고 있는 페이스북 데이터로 할 수 있다. 운동을 자주 하는 사람들은 이메일을 비교적 덜 확인할까? 만약 애플 워치(Apple Watch)나 구글 핏(Google Fit) 앱을 설치한 안드로이드 폰 사용자들이라면 데이터로 답을 알 수 있을 것이다. 또한 타깃 마케팅을 원하는 유통 회사를 위해 고객이 어디서 주로 시간을 보내는지에 관한 데이터를 판매하는 수십 개의 회사가 이미 경쟁 중이다. 이는 우리를 매우 복잡한 상황으로 이끈다. 즉, 전례가 없던 풍요로운 데이터로부터 얻게 되는 통찰력을 통해 사회의 동작 방식을 새롭게 이해하고, 공중 보건과 서비스, 소비자 제품을 개선할 수 있다. 그러나 개인이 이런 데이터 분석의 수혜자가 되는 것이 아니다. 분석에 사용되는 데이터가 바로 나와 당신이며, 우리에 대한 중요한 결정을 내리는 데도 바로 그 데이터가 사용되는 것이다.
데이터 수집과 분석이 급증하면서 발생하는 걱정거리가 단지 프라이버시만은 아니다. 왜냐하면 휴대폰과 인터넷을 이용할 수 있게 해주는 작은 기계 코드, 알고리즘은 우리가 이동하면서 생성하는 데이터를 분석하는 정도에서 끝나지 않기 때문이다. 이는 우리 생활에 영향을 끼치는 결정을 내리는 데 활발히 사용된다. 예를 들어, 신용카드를 발급받으려고 신청서를 내면 아마도 그 신청서는 사람이 검토하지 않을 것이다. 대신 알고리즘이 신청자(또는 신청자와 유사한 그룹의 사람들)에 대한 정보를 여러 기관에서 수집한 후, 자동으로 발급 승인을 하거나 거절할 것이다. 이렇듯 요청이 승인될 때까지 5~10일 정도 기다리지 않고 바로 결과를 알 수 있다는 것은 장점이 많지만, 좀 더 생각해볼 필요가 있다. 미국의 많은 주에서는 이른바 머신러닝(machine learning)이라 부르는 알고리즘을 보석과 가석방, 형사 선고를 하는 데도 사용하고 있다. 또한 경찰관을 도시 전역에 배치하는 데도 알고리즘이 사용된다. 사람들의 삶에 직접적이고 실제적인 영향을 끼치는 모든 분야의 결정 과정에 알고리즘이 사용되고 있는 것이다. 이 모든 현상은 프라이버시뿐만 아니라 공정성이나 안전, 투명성, 책임성, 도덕성을 포함한 다양한 사회적 가치에 대해 의문을 제기한다. 따라서 앞으로도 계속 빅데이터를 생성하고, 이를 통해 중요한 결정을 자동화할 것이라면(그렇지 않을 가능성은 농경사회로 다시 돌아갈 것이라는 가정만큼 현실성이 없다), 반드시 몇 가지 중요한 주제를 진지하게 고려해야 한다. 여기에는 데이터와 알고리즘의 사용을 제한하는 것과 이런 제한을 법제화하는 것, 규제를 시행하는 조직이 모두 포함된다. 그러나 우리는 이러한 우려 사항을 과학적으로 해결하려는 시도, 좀 더 자세히 말하자면 우리 삶에 점점 깊이 들어오는 알고리즘을 설계하는 데 있어 윤리적 원칙을 직접 코딩해서 반영한다는 사실이 의미하는 바를 진지하게 고려해야 한다. 이 책은 바로 그러한 윤리 알고리즘의 설계를 다루는 최신 과학 분야의 책이다.