机器学习技术开始试图预测罕见的灾难性事件 如地震或大流行病|全球动态

来自布朗大学和麻省理工学院的研究人员表示,科学家们可以使用先进的机器学习和顺序采样技术的组合来预测极端事件,而不需要大型数据集。当涉及到预测极端事件带来的灾难时(例如地震、大流行病或可能摧毁海岸结构的"流氓波浪"),计算模型面临着一个几乎不可逾越的挑战:从统计学上讲,这些事件非常罕见,以至于没有足够的数据来使用预测模型来准确预测它们下次何时发生。

然而,来自布朗大学和麻省理工学院的一组科学家表明,这不一定是这样的。

在《自然-计算科学》上发表的一项研究中,研究人员解释了他们如何利用需要较少数据进行准确预测的统计算法,并与布朗大学开发的机器学习技术相结合。这种结合使他们能够在缺乏历史数据的情况下预测罕见事件的情景、概率甚至是时间线。


(资料图片仅供参考)

这样做,研究小组发现,这个新的框架可以提供一种方法来规避传统上这些类型的计算所需要的大量数据,而基本上将预测罕见事件的巨大挑战归结为质量大于数量的问题。

"你必须意识到这些是随机事件,"布朗大学应用数学和工程系教授、研究报告作者乔治-卡尔尼亚达基斯说。"像COVID-19这样的大流行病的爆发,墨西哥湾的环境灾难,地震,加利福尼亚的巨大野火,30米高的海浪掀翻了一艘船……这些都是罕见的事件,由于它们是罕见的,我们没有大量的历史数据。我们没有足够的过去的样本来预测它们在未来的发展。我们在论文中解决的问题是。什么是我们可以使用的最佳数据,以尽量减少我们需要的数据点的数量?"

研究人员在一种称为主动学习的顺序采样技术中找到了答案。这些类型的统计算法不仅能够分析输入它们的数据,更重要的是,它们可以从信息中学习,标记新的相关数据点,这些数据点对正在计算的结果同样重要,甚至更重要。在最基本的层面上,它们允许用更少的钱做更多的事。

这对研究人员在研究中使用的机器学习模型至关重要。该模型被称为DeepOnet,是一种人工神经网络,它使用连续层中相互连接的节点,大致模仿人脑中神经元的连接。DeepOnet被称为深度神经算子。它比典型的人工神经网络更先进、更强大,因为它实际上是两个神经网络合一,在两个平行网络中处理数据。这使它能够以极快的速度分析巨大的数据集和场景,一旦它学会了它所寻找的东西,就能吐出同样巨大的概率集。

这个强大的工具的瓶颈,特别是在涉及到罕见事件时,是深度神经操作者需要大量的数据来训练,以进行有效和准确的计算。

在论文中,研究团队表明,结合主动学习技术,DeepOnet模型可以得到训练,了解要寻找哪些参数或前兆,导致有人正在分析的灾难性事件,即使没有很多数据点。

Karniadakis说:"主旨不是把每一个可能的数据都放进系统,而是主动寻找将标志着罕见事件的事件,我们可能没有很多真实事件的例子,但我们可能有那些前兆。通过数学,我们识别它们,它们与真实事件一起将帮助我们训练这个数据饥渴的运算装置。"

在论文中,研究人员将该方法应用于确定大流行期间危险尖峰的参数和不同的概率范围,寻找和预测"流氓波浪",以及估计一艘船何时会因压力而裂成两半。例如,对于流氓波浪--大于周围波浪大小两倍的波浪--研究人员发现他们可以通过观察可能的波浪条件来发现和量化无赖波何时形成,这些波浪随着时间的推移非线性地相互作用,导致波浪有时是其原始大小的三倍。

研究人员发现他们的新方法优于更多的传统建模工作,他们认为它提出了一个框架,可以有效地发现和预测各种罕见事件。

在论文中,研究小组概述了科学家应该如何设计未来的实验,以便他们能够最大限度地降低成本并提高预测的准确性。例如,Karniadakis已经在与环境科学家合作,使用这种新方法来预测气候事件,如飓风。

这项研究由麻省理工学院的Ethan Pickering和Themistoklis Sapsis领导。DeepOnet是由Karniadakis和其他布朗研究人员在2019年推出的。他们目前正在为该技术申请专利。这项研究得到了国防高级研究计划局、空军研究实验室和海军研究办公室的资金支持。

推荐DIY文章
迅雷任务出错是怎么回事 迅雷任务出错后该怎样才可以继续下载
天天看热讯:台式机可以连无线网吗?为什么台式机更推荐用USB的无线网卡
win7桌面ie删不掉的处理方法(图文) 这个操作你可以试试 世界简讯
win7打开扫描仪出现未能创建视频预览,请检查设备连接 该情况是否是设置出现问题_天天新动态
Xp系统提示“没有找到comres.dll”的解决方案 重新安装应用程序可以修复此问题吗
索尼vaio笔记本重装系统教程 具体操作流程详细分享一看就会
精彩新闻

超前放送