읽는 데 4분 소요
Daniel DeLeon은 음악을 향한 열정 덕분에 머신러닝으로 바다를 연구하게 되었습니다.
커뮤니티 칼리지에 다니기 시작할 때만 해도 Daniel은 엔지니어링이 무엇인지조차 몰랐습니다. 하지만 지금은 머신러닝을 활용하여 멸종 위기에 처한 고래를 추적하면서 큰 업적을 세우고 있습니다.
Daniel DeLeon의 어머니 Betty와 아버지 Narciso는 멕시코 산 블라스에서 열린 교회 수련회에서 처음 만났습니다. 당시 Betty는 스페인어를, Narcisso는 영어를 하지 못했기 때문에 두 사람은 음악이라는 색다른 방식으로 소통했습니다.
지금은 캘리포니아 폴리테크닉 주립대학에 다니는 만 26세의 학생 Daniel이 탁월한 음감을 가지게 된 것은 우연이 아닙니다. Daniel의 부모님은 '트리오 과달루페뇨'라는 전통 멕시코 트리오 밴드를 결성했습니다. 덕분에 Daniel은 매주 이루어진 밴드 리허설을 듣고, 지역 킨세아녜라 세례식 및 파티에서 부모님이 공연하는 모습을 보면서 자랐습니다.
물리학 강의를 들으며 음파가 귓속에서 어떻게 퍼지는지 배웠어요. 이런 음파가 우리를 행복하고 신나게 만든다는 사실이 정말 놀라웠죠.
Daniel DeLeon
음악을 향한 Daniel의 열정이 음향학에 대한 관심으로 발전한 것은 커뮤니티 칼리지에서 들은 물리학 수업 덕분입니다. 음악적 배경에 더해 음향에 관한 새로운 지식을 갖추게 된 Daniel은 치열한 경쟁을 뚫고 몬터레이만 수족관 연구소(MBARI)에서 인턴십을 시작했습니다. 여기에서 과학자 Danelle Cline과 John Ryan이 고래 울음소리를 통해 바다를 연구하는 프로젝트에 참여하게 되었습니다.
저희 부모님께서 처음 만나셨을 때 음악을 통해 서로를 이해하신 것처럼, 고래도 소리를 활용하여 서로 소통합니다. 이 사실을 알고 나니 부모님의 음악에 관해 생각하고, 부모님께 음악이 얼마나 중요했는지 깨닫게 됐죠.
Daniel DeLeon
과학자들은 멸종 위기에 처한 대왕고래와 큰고래의 울음소리 및 변화하는 이주 패턴을 추적함으로써 인간이 해양생물에 미치는 폭넓은 영향에 관해 많은 것을 배울 수 있습니다. John과 Danelle은 음악을 좋아하는 Daniel이 연구소의 음파 탐지기에서 들려 오는 바닷소리를 여름 내내 듣는 일을 마다하지 않으리라고 생각했습니다. 이 음파 탐지기는 해저 900미터 깊이에 설치된 수중 마이크입니다. 하지만 Daniel이 맡게 된 일은 그저 소리만 듣고 있어도 될 정도로 단순하지는 않았습니다.
바다는 지구 면적의 70%를 차지하며 매우 깊습니다. 하지만 물속으로 23미터만 들어가도 빛의 99%가 사라집니다. 반면에 소리는 수천 킬로미터 떨어진 곳까지 전달됩니다. 그래서 바닷속에 사는 포유동물들은 살아가는 데 필요한 모든 활동에 소리를 이용합니다. 소리를 듣기만 해도 이들의 삶에 관해 많은 것을 알 수 있습니다.
John Ryan, 해양생물학자
음파 탐지기를 통해 밤낮으로 소리를 녹음하면서 과학자들은 데이터가 너무 많다는 문제에 직면했습니다. 녹음된 오디오를 모두 면밀히 분석하려면 천 년이 넘는 시간이 걸리기 때문입니다. 그러나 Daniel은 Google의 오픈소스 머신러닝 도구인 텐서플로우를 사용하여 오디오 파일을 분석하고 고래 울음소리를 구분하는 지루한 작업을 몇 년이 아닌 단 며칠 만에 완료할 수 있었습니다.
Daniel이 인턴십을 시작할 때는 텐서플로우를 사용해 본 적도 없었습니다. 하지만 머신러닝에서 제일 중요한 수학에는 능통했습니다. 머신러닝의 핵심은 데이터를 분석하고 패턴을 인식하도록 학습하는 일련의 알고리즘입니다.
대왕고래와 큰고래는 지구상에서 소리가 가장 큰 동물에 속합니다. 이 고래들이 내는 저주파 울음소리는 바닷속에서 아주 먼 곳까지 전달되기 때문에 연구하기에 아주 좋습니다. MBARI의 음파 탐지기를 사용하면 최대 500km 떨어진 고래의 울음소리를 들을 수 있습니다.
음파 탐지기가 녹음한 음파는 시간 경과에 따른 소리의 지도인 스펙트로그램이라는 시각 데이터로 변환되어야 합니다. Daniel은 이러한 스펙트로그램을 텐서플로우 모델에 입력하여 대왕고래와 큰고래의 울음소리가 어떤 형태로 되어 있는지 학습시킵니다. 배변 훈련을 하는 강아지처럼, 머신러닝 모델은 반복을 통해 학습합니다. Daniel이 텐서플로우에 더 많은 예를 입력할수록 모델은 더욱 정확해집니다. 이렇게 18,000개가 넘는 개별 고래 울음소리 예로 텐서플로우 모델을 학습시켰습니다.
머신러닝이란 단순히 컴퓨터에 패턴을 학습시키는 것입니다.
Daniel DeLeon
Daniel은 텐서플로우가 98.05%의 정확도로 고래의 울음소리를 구분해 내도록 시간을 두고 학습시켰습니다. 이제 텐서플로우 모델을 사용하여 대왕고래와 큰고래의 울음소리를 구분할 수 있습니다. 또한 고래가 하루 중 언제, 얼마나 큰 소리로, 얼마나 오랫동안 울음소리를 내는지 확인할 수 있게 되었습니다.
대왕고래
큰고래
지금은 해양과학 분야에서 아주 중요한 시점입니다. 머신러닝 분야에 있어서도 굉장히 흥미로운 시기예요. 고작 5년 전만 해도 풀 수 없었던 문제가 마침내 해결되고 있기 때문이죠.
Danelle Cline, 수석 소프트웨어 엔지니어
머신러닝을 활용한 Daniel의 연구 덕분에 John과 Danelle은 고래 울음소리를 자동으로 감지하고 분류하는 방법의 토대를 마련할 수 있었습니다. 이들은 이제 더 중요한 질문의 답을 찾는 데 집중할 수 있게 되었습니다. 고래라는 거대한 생물의 이주 패턴이 아주 먼 옛날부터 지금까지 어떻게 변화했으며, 이러한 변화가 소음공해와 기후변화와 같이 물 밖의 인간이 물속의 해양생물에 미치는 폭넓은 영향에 관해 무엇을 알려 주는지 등의 질문이 아직 남아 있기 때문입니다.
과학자가 될 거라고는 생각도 못 했어요. 과학자가 될 만한 능력은 없다고 생각했거든요. 그런데 세상과 전 우주를 향한 호기심 때문에 한번 해 보자고 마음먹은 거죠.
Daniel DeLeon