山洪灾害是全球最致命的天气事件之一,每年导致超过 5000 人丧生。它们也是最难以预测的事件之一。但谷歌认为它已找到一种意想不到的方式来攻克这一难题——那就是阅读新闻。
虽然人类已经收集了大量气象数据,但山洪持续时间太短、影响范围太局部,无法像气温甚至河流流量那样随时间进行全面的监测。这种数据缺口意味着,尽管深度学习模型在天气预报方面越来越强大,却无法预测山洪。
为了解决这个问题,谷歌研究人员使用了 Gemini——谷歌的大语言模型——来梳理来自全球的 500 万篇新闻文章,筛选出涉及 260 万次不同洪水的报告,并将这些报告转化为名为"Groundsource"的带地理标签时间序列。据谷歌研究产品经理 Gila Loike 称,这是该公司首次使用语言模型进行此类工作。该研究和数据集于本周四上午公开共享。
以 Groundsource 作为现实世界的基准,研究人员训练了一个基于长短期记忆(LSTM)神经网络的模型,用于接收全球天气预报,并生成特定区域发生山洪的概率。
谷歌的山洪预报模型现在正在其 Flood Hub 平台上标示 150 个国家的城市地区风险,并与世界各地的应急响应机构共享数据。南部非洲发展共同体(SADC)的应急响应官员 António José Beleza 表示,他与谷歌合作试用了该预报模型,这帮助他的组织更快地应对洪水。
该模型仍存在局限性。首先,它的分辨率相当低,识别的是 20 平方公里范围内的风险。此外,它不如美国国家气象局的洪水警报系统精确,部分原因是谷歌的模型未纳入当地雷达数据,而后者能够实现降水的实时追踪。
不过,该项目的设计初衷之一,是使其能够在地方政府无力投资昂贵的气象传感基础设施或缺乏广泛气象记录的地方发挥作用。
“因为我们聚合了数百万份报告,Groundsource 数据集实际上有助于重新平衡地图,”谷歌韧性团队的项目经理 Juliet Rothenberg 本周告诉记者。“这使得我们能够推断出那些信息较少的其他地区。”
Rothenberg 表示,团队希望利用大语言模型从书面、定性的来源开发定量数据集的方法,能够应用于构建其他短暂但需重点预报的现象的数据集的努力中,比如热浪和泥石流。
Upstream Tech 的首席执行官 Marshall Moutenot 表示,谷歌的贡献是日益增长的为基于深度学习的天气预报模型组装数据努力的一部分。Upstream Tech 是一家利用类似深度学习模型为客户(如水力发电公司)预报河流流量的公司。Moutenot 共同创立了 dynamical.org,这是一个为研究人员和初创公司策划机器学习就绪气象数据集合的组织。
“数据稀缺是地球物理学中最具挑战性的问题之一,”Moutenot 说。“同时,地球数据太多了,而当你想要对照真实情况进行评估时,数据却不足。这是一种获取数据的非常有创意的方法。”
免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。