빅데이터 인문학: 진격의 서막. 에레즈 에이든&장바티스트 미셸. p252
역사적 변화를 측정하는 현미경이 있다면
오랫동안 완벽한 구라고 믿었던 달에 갈릴레오가 망원경의 초점을 맞추자 계곡과 평원과 사들이 눈에 들어왔는데, 산들은 늘 해의 반대편을 향해 그늘을 뚜렷이 드리웠다…갈릴레오는 은하수라고 불리던, 밤하늘을 가로지는 밝은 띠를 탐구해 오늘날 우리가 갤럭시라고 부르는 이것이 사실은 셀 수 없이 많은 아주 작은 별들로 이루어져 있음을 알아냈다.
250여 년이 지난 오늘날에도 현미경과 망원경은 과학적 진보에서 엄청난 의의를 가진다…빅데이터 혁명…이 혁명의 결과물은 우리가 우리 자신을 바라보는 방법을 바꿀 것이다. 또 우리 사회의 본질을 더 효율적으로 탐색할 수 있는 관찰도구를 창조하게 해줄 것이다. 빅데이터는 인문학을 바꾸고, 사회과학을 변형시키고, 상업 세계와 상아탑 사이의 관계를 재조정할 것이다.
우리가 현대적인 삶이 제공하는 모든 것을 경험하고, 삶의 점점 더 많은 부분을 인터넷 상에서 영위하게 되면서 우리의 디지털 부스러기는 점점 더 철저하게 자취를 남기기 시작했다. 우리 개개인이 남기는 기록은 그 폭과 깊이가 믿기 어려울 정도다!
구글의 야심, 단 하나의 도서관
구글 북스는 단순히 빅데이터가 아니라 롱데이터다
더 많은 데이터, 더 많은 문제들. 빅데이터는 우리의 주변 세계를 이해할 새로운 기회를 제공하지만, 동시에 새로운 과학적 도전 과제를 만들어낸다.
요약하자면 이 책은 로봇이 말하는 역사, 디지털 렌즈로 들여다봤을 때 보이는 인류의 과거에 관한 책이다.
새로운 관찰도구의 급성장. 세상을 변하고 있다. 우리가 세상을 보는 방식도 변하고 있다. 우리가 그러한 변화를 보는 방식들 역시, 음, 변하고 있다.
#데이터 오디세이: 언어는 어떻게 진화하는가
언어는 문화를 총제적으로 연구할 수 있게 해주는 거대한 소우주다…문자언어는 빅데이터의 가장 오래된 조상 가운데 하나인 셈이다.
#데이터로 사전 만들기
영어 사전 가운데 가장 포괄적인 사전인 「옥스퍼드 영어 사전」은 50만 개에 조금 못 미치는 단어들을 수록했다. 이 어휘목록은 우리가 가진 목록의 대략 3분의 1 규모다…사전 편찬자들은 정말로 언어에 무슨 일이 일어나고 있는지 알지 못했던 것일까?
#사람은 어떻게 유명해지는가
엔그램을 이용해 명성을 탐구하는 것은 아주 흥미롭고 당황스럽고 재미있다. 그러나 엔그램 주변에는 어둠이 도사리고 있다. 어떤 비밀도 이것보다 더 어둡지는 않을 것이다. 바로 극도로 사악한 행동보다 더 효율적으로 명성을 만들어내는 것은 없다는 점이다. 우리는 명성으로 가는 가장 확실한 길이 사람을 죽이는 일인 세계에 살고 있다. 이것이 뜻하는 바가 무엇인지는 우리 모두가 깊이 생각해보아야 한다.
#침묵의 소리: 빅데이터가 말하는 억압과 검열의 역사
나치의 분서 정책. 인터넷이 없던 세계에서 그토록 많은 정보가 공적 영역에서 제거되었을 때 생겨날 충격은 상상하기조차 힘들다…우리는 엔그램을 사용하여 그들이 벌인 검열 운동의 효과에 관한 통계적 통찰을 얻을 수 있다.
#기억과 망각의 속도
오랜 시간에 걸친 집단적 학습은 확연히 달랐다. 19세기 초기의 기술들은 영향력이 최고치의 4분의 1에 도달하기까지 65년이 걸렸다. 세기 전환기의 발명품들은 겨우 26년이 걸렸다. 집단학습 곡선은 10년마다 2.5년씩 줄어들며 갈수록 짧아지고 있다. 사회는 점점 더 빨리 배우고 있다.
계속해서 속도가 빨라지는 기술의 진보와 인간의 삶의 방식의 변화는…우리가 알고 있는 인간사가 더는 계속될 수 없는, 인류 역사의 어떤 순수한 특이점에 접근하고 있다는 인상을 준다.-미래학자 레이 커즈와일
커즈와일이 자신의 분야를 잘 안다는 데에는 의심할 여지가 없다. 그렇지만 그가 옳은가? 우리는 정말로 모른다. 엔그램들은 과거에 대해서만 말해준다. 그들은 미래를 예측하지는 못한다. 아직까지는.
문화를 수량화할 수 있을까
데이터가 그리는 아름다운 곡선
#유토피아, 디스토피아, 데이터토피아
어느 누구도 이것을 정확히 뭐라고 불러야 할지 모른다. 그리고 이것이 어디로 가고 있는지 아는 사람도 없다. 그러니 한 가지는 확실하다. 과학과 인문학이 다시 한 번 같은 목표를 향해 가고 있다는 것이다. 갈릴레오가 17세기에 우리 세계에 대한 이해를 바꿔놓았듯이, 21세기에 이 두 개의 렌즈는 서로 등을 맞댄 채 갈릴레오가 했던 것과 똑같은 일을 해낼 것이다.
데이터는 권력이다
우리를 시대착오적이라고 부를지도 모르겠지만, 인생기록이 가능해지는 것이 명백한 만큼 공적 인생기록이 아주 위험한 개념이라는 사실 또한 마찬가지로 명백해 보인다. 당연하게도 마케터들은 성가신 광고물을 우리에게 쏟아붇기 위해 그것을 사용할 것이다…우리는 마케터들과 글로벌 기업들이 아무런 제약 없이 인생기록에 접근할 경우, 상황이 얼마나 불쾌하게 진행될지 상상할 수 있다.
역사 기록의 성격이 바뀌면서 과학과 인문학 사이의 경계가 뒤섞이고 있다. 그렇게 만들어진 뒤죽박죽은 여러 가지 이름으로 통한다. 이런 일을 하는 역사학자는 자신을 ‘디지털 인문학자’라고 부르길 좋아한다.
데이터는 사회과학의 오랜 꿈을 실현할 수 있을까
아마도, 정말로 역사에서는 예측적 과학이 가능할지도 모른다. 정말로 아마도 우리의 문화는 결정론의 법칙들을 따를지도 모른다. 정말로 아마도 우리의 모든 데이터가 우리를 데려가는 곳이 이곳일지 모른다.
