고등학교 2학년 때 인공지능에 매료됐고, 학부시절에 대학원에 진학해서 자연언어 처리에 집중하기로 했다. 펜실베이니아 대학에서 텍스트 처리, 기계학습, 일반적인 알고리즘과 데이터 구조에 대해 믿기 어려울 만큼 많이 배웠다. 자연언어 처리의 최고 지성 몇몇과 일하고 배울 기회도 있었다.
대학원 연구 과정에서 다수의 NLP 시스템 일을 했고 DARPA가 지원하는 동일 지시어, 요약, 질의응답에 대한 수많은 평가에 참여했다. 이 작업 과정에서 루씬과 더 큰 오픈소스 움직임에 익숙해졌다. 또한 효율적인 종단 간 처리를 제공할 수 있는 오픈소스 텍스트 처리 소프트웨어에 구멍이 있는 것도 알아챘다. 학위 논문을 기반으로 해서 OpenNLP 프로젝트에 광범위하게 기여했고, ETS(Educational Testing Services)에서 자동화된 에세이와 짧은 답변 채점에 대한 일을 하는 동안에도 NLP 시스템에 대해 계속 학습했다.
오픈소스 커뮤니티에서 일하는 동안 다른 사람들과 일하는 것에 대해 많이 배웠고, 그래서 훨씬 더 나은 소프트웨어 엔지니어가 됐다. 오늘날 이 책에서 설명한 도구와 기법 상당수를 사용하는 소프트웨어 엔지니어 팀들과 같이 컴캐스트(Comcast Corporation)에서 일한다. 이 책이 내가 대학원에서 가르침을 받은 여러 연구자들과 실제 사람을 위한 현실적인 문제를 해결하기 위해 텍스트 처리를 사용하려는 목적을 가진 모든 소프트웨어 엔지니어 사이의 간극을 메우는 데 도움이 되기를 바란다.