人工智能如何帮助科学家寻找新粒子?

  • 时间:
  • 浏览:0
  在搜寻新基本粒子的过程中,物理学家无缘无故并能对粒子的行为作出假设,但新的机器学习算法却我不要 没人做。

  9月13日消息,据国外媒体报道,大型强子对撞机(LHC)并能在一秒钟之内撞击十亿对质子。有时,这台巨大的机器可能性会给现实世界带来惊喜,可能性在少数碰撞中,会产生一些前所未有的东西。要是,曾经 的惊喜并没人什么规律可言,物理学家不须确切知道要寻找什么。亲们担心,在将数十亿次碰撞所获得的数据梳理成更易管理的数字时,可能性会无意中删掉物理学新理论的证据。在欧洲核子研究中心(CERN)参与超环面仪器(ATLAS)实验的纽约大学粒子物理学家凯尔·克兰默(Kyle Cranmer)说:“亲们无缘无故担心自己会把婴儿和洗澡水一块儿倒掉。”

  面对智能数据规约的挑战,一些物理学家尝试使用“厚度神经网络”的机器学习技术来挖掘同例如件组成的数据海洋,寻找新的物理学难题。

  在初步使用案例中,厚度神经网络通过研究几瓶标记为“猫”的图片和标记为“狗”的图片,学习怎么区分猫和狗。然而,一些土辦法 在寻找新粒子时不须适用,可能性物理学家无法为机器提供亲们从未见过的东西的图片。要是,物理学家转而采用所谓的“弱监督学习”(weakly supervised learning)土辦法 ,即机器从已知粒子开使了了,利用细化的信息(比如总体上可能性处于的频率)来寻找罕见事件。

  在今年5月份发表于科学预印本网站arxiv.org上的一篇论文中,三位研究人员提出应用相关策略对“撞击狩猎”(bump hunting)进行扩展。一些经典的“粒子狩猎”技术曾用于希格斯玻色子的发现。美国劳伦斯伯克利国家实验室的研究者本·纳赫曼(Ben Nachman)表示,具体的思路是训练机器在数据集中寻找罕见的变化。

  试想一下,亲们并能在猫狗实验的原理基础上做有3个 游戏:在充满北美森林观察记录的数据集中寻找新的动物物种。假设任何新的动物物种都倾向于聚集在某个特定的地理区域(与新粒子围绕某个特定质量的概念相对应),那算法就应该并能通过邻近区域的系统比较,将它们挑出来。可能性加拿大不列颠哥伦比亚省刚好有113只驯鹿,美国华盛顿州有19只驯鹿(即使数据集涵盖数百万只松鼠),那进程并能在没人直接研究驯鹿的清况 下,学会将驯鹿与松鼠区分开来。弱监督学习研究者、俄勒冈大学的理论粒子物理学家说:“这都有魔术,但感觉像魔术一样。”

  相比之下,粒子物理学中的传统搜索土辦法 通常要求研究人员对新难题是什么样子做出假设。亲们会创建有3个 描述新粒子行为的模型。例如,有3个 新粒子可能性有衰变成一大群已知粒子的趋势。并能在定义了所要寻找的东西要是,亲们并能设计出自定义的搜索策略。这项工作通常需至少有3个 博士研究生至少一年的时间,而纳赫曼认为,一些过程并能完成得调慢、更彻底。

  有研究者提出了CWoLa算法,即无标签分类(Classification Without Labels),并能搜索任意未知粒子的现有数据,无论该粒子是衰变成有3个 例如型未知粒子,还是有3个 例如型或不例如型已知粒子。利用常规的搜索模型,LHC企业合作机构可能性并能至少20年时间来寻找后一些清况 的可能性性,而目前对前一些清况 的搜索仍没人任何结果。参与ATLAS项目的纳赫曼表示,CWoLa算法并能一次完成所有什么工作。

  一些实验粒子物理学家也认为,这将是有3个 很有价值的项目。在ATLAS项目中搜寻新粒子碰撞的物理学家凯特·帕查尔(Kate Pachal)说:“亲们可能性分析了一些可预测的区域,要是接下来亲们要开使了了填补什么尚未分析的角落,这是特别要的有3个 方向。”去年,她和一些同事就在尝试设计一些灵活的软件,对一系列不同质量的粒子进行补救,但亲们中没人人对机器学习有足够的了解。“我随后现在是尝试一下的要是了,”帕查尔说道。

  厚度神经网络有希望在不能够目前建模工作的数据中发现微妙的相关性。一些机器学习技术可能性成功提高了LHC进行特定任务的强度,比如识别由底夸克粒子产生的“喷注”。在这项工作中,物理学家毫无难题也会错过一些信号。加州大学欧文分校的粒子物理学家丹尼尔·怀特森(Daniel Whiteson)说:“亲们把信息遗留在桌面上,而当你在有3个 机器上花了80亿美元,你我不要 想把信息留在桌子上。”

  不过,机器学习实在充满了进程将手臂混淆为哑铃的警示故事(甚至还有更糟糕的清况 )。对于LHC,村里人 担心机器学习的“捷径”最终反映的是LHC机器一些的各种小难题,而什么难题正是实验物理学家努力我随后忽视的。ATLAS项目的物理学家蒂尔·艾费特(Till Eifert)问道:“当你发现有3个 异常时,你实在它是新物理学突破呢,还是探测器处于了什么有意思的清况 ?”