预计阅读用时:4 分钟
音乐如何引导 Daniel DeLeon 利用机器学习技术来研究海洋
Daniel 在就读社区大学时对工程学一窍不通。现在,他已经在运用机器学习技术来跟踪研究濒危鲸类,并取得了突破性进展。
Daniel DeLeon 的母亲 Betty 在参加教会举办的墨西哥圣布拉斯之旅时,初次与 Daniel DeLeon 的父亲 Narciso 见面,当时 Betty 不会说西班牙语,而 Narciso 也不会说英语,于是他们就用一种与众不同的方式来交流 - 音乐。
Daniel 现在是加州理工大学的一名 26 岁的学生,他对音乐的敏感度源于他的家庭背景。他的父母组建了一支名为 Trio Guadalupeño 的传统墨西哥三重奏乐队,他们每周都会排练,并且在当地的quinceañeras(拉丁美洲女孩成人礼)、基督教洗礼和各种聚会上演出,在这种环境下成长的 Daniel 自然对音乐不陌生。
我在物理课上学到声波如何传播到我们的耳中,这感觉太不可思议了。那些声波能够影响我们的情绪,让我们感到开心或者兴奋。
Daniel DeLeon
在社区大学接触到物理课后,Daniel 对音乐的热爱进一步发展为对声音学的着迷。他凭借着自身的音乐背景加上新掌握到的声学知识,在激烈的竞争中赢得了蒙特里湾水族馆研究学会 (MBARI) 的实习机会。他在实习期间负责聆听鲸鱼叫声,协助 Danelle Cline 和 John Ryan 两位科学家进行海洋研究。
鲸鱼用声波相互交流,就像我父母初次相见时通过音乐交流一样。这让我想起了他们的音乐,并意识到那有多重要。
Daniel DeLeon
通过跟踪研究濒危蓝鲸和长须鲸的叫声及其不断变化的迁徙模式,科学家们可以深入了解人类活动对海洋生物产生的更广泛影响。Daniel 非常热爱音乐,因此 John 和 Danelle 认为他会很乐意用一整个夏天的时间聆听研究所的水听器(一种放置在海中 900 米深处的水下麦克风)在海里录下的声音。不过,Daniel 的工作不只是单纯地聆听声音。
海洋覆盖了地球表面 70% 的面积,而且深不见底。仅仅下潜 23 米,便会隔绝 99% 的光线。相反,声音在海里可以传播数千英里。因此,海洋哺乳动物在各种日常活动中都会运用声音。只要细细聆听,就能推敲出这些动物的生活习性和环境。
海洋生物学家 John Ryan
由于水听器全天候记录声音,这给科学家们带来了一个难题 - 数据太多。如果要完整分析所有录音,必须花上好几辈子的时间。因此,Daniel 使用 Google 的开放源代码机器学习工具 TensorFlow 来解析音频文件和识别鲸鱼叫声,只要短短几天,就能搞定原本需要好几年才能完成的繁琐工作。
Daniel 在实习之前从未使用过 TensorFlow,不过他擅长数学,而数学的核心概念正是机器学习技术的精髓:通过一系列算法来分析数据和学习识别各种模式。
蓝鲸和长须鲸是地球上发出声音最大的其中两种动物。它们发出的低频音能够在海里传播相当长的距离,因此是最佳的研究对象。蒙特里湾水族馆研究学会 (MBARI) 的水听器最远可侦测到 500 公里远的鲸鱼叫声。
水听器录下的声波必须转换成声谱图形式的视觉数据,将特定时间段内的声音以图表呈现出来。Daniel 把这些声谱图输入到 TensorFlow 模型中,训练它识别蓝鲸和长须鲸的叫声。这跟训练小狗不在室内随地大小便的方法差不多,机器学习模型也是通过不断重复的模式来学习。Daniel 输入的样本越多,模型的准确度就越高。Daniel 总共用了超过 18000 个不同的鲸鱼叫声样本来训练 TensorFlow 模型。
机器学习的目的就是让计算机掌握各种模式。
Daniel DeLeon
经过一段时间后,Daniel 成功训练了 TensorFlow 识别鲸鱼叫声,而且准确度高达 98.05%。这个模型可以区分蓝鲸和长须鲸,帮助确认每次叫声发生的时间、叫声的音量以及叫声持续时间。
蓝鲸
长须鲸
目前是海洋科学发展的关键时期,机器学习也发展到了一个非常有趣的阶段,因为我们终于开始解决 5 年前令人束手无策的难题。
资深软件工程师 Danelle Cline
Daniel 在机器学习方面的研究帮助 John 和 Danelle 奠定了对鲸鱼叫声自动侦测和分类的基础。他们现在能够留出更多时间来关注重大问题,比如这些大型生物长久以来的迁徙模式为何发生变化,以及人类在水平面上的活动对水下海洋生物产生的更广泛影响(包括噪音污染和气候变化等)给我们带来了什么经验和教训。
我从未想过要当一名科学家。我觉得自己没有这个能力。我对这个世界乃至整个宇宙的好奇心,点燃了我对科学的热情。
Daniel DeLeon