通过AI指导人类直觉来推进数学

  在监督的学习阶段,数学家提出了一个假设,即X(Z)和Y(Z)之间存在关系。在这项工作中,我们假设没有从x(z)到y(z)映射的已知函数,这又意味着x不可逆转(否则将存在已知的函数y°x -1)。虽然当该功能已知时,此过程仍然可能有价值,但我们将其留给将来的工作。为了测试x和y是相关的假设,我们生成了一个x(z),y(z)对的数据集,其中z是从分布pz采样的。后续阶段的结果仅适用于分布PZ,而不是整个空间z。最初,PZ的明智选择将在Z的第一个N项上均匀地统一,并在Z上订购概念,或在可能的情况下随机均匀。在随后的迭代中,可以选择PZ来了解空间z的不同部分的行为(例如,Z的区域可能更有可能为特定假设提供反例)。首先测试是否可以找到X(Z)和Y(Z)之间的关系,我们使用监督学习将大约映射到y(z)映射到y(z)的函数。在这项工作中,我们将神经网络用作监督学习方法,部分是因为它们很容易适应了许多不同类型的X和Y,并且可以将输入域X的任何固有几何形状(以不可知性和对称性)进行了解,可以将其纳入网络的架构中。如果从统计学上,从统计学上讲,从统计学上讲,从统计学上讲,我们考虑了X(Z)和Y(Z)之间的关系,以高于未经训练模型的PZ的进一步样本的机会。相反是不正确的;也就是说,如果该模型无法更好地预测关系而不是机会,则可能意味着存在模式,但足够复杂,无法通过给定模型和培训程序捕获它。如果确实存在, 这可以使数学家有信心在一个可能仅是投机性的问题中追求特定的询问线。   如果找到关系,归因阶段是用归因技术探测学习的功能,以进一步了解关系的性质。这些技术试图解释哪些特征或结构与所做的预测相关,这些特征或结构可用于了解问题的哪些部分与进一步探索有关。关于机器学习和统计的文献体系中,有许多归因技术,包括逐步向前的特征选择38,功能阻塞和注意力重量39。在这项工作中,我们使用基于梯度的技术40,与经典统计中的灵敏度分析大致相似,有时也称为显着图。这些技术将重要性归因于X(Z)的元素,通过计算X(Z)中的小变化的预测的变化进行了多少变化。我们认为,这些是一类特别有用的归因技术,因为它们在概念上是简单,灵活且易于计算的机器学习库,这些库支持自动分化41,42,43。然后,通过归因技术提取的信息可以很有用来指导数学推理的下一步,例如猜测封闭形式的候选f'F',更改采样分布PZ或产生有关Z的对象的新假设,如图1所示。然后,这可以导致这些定量关系之间的改进或校正版本。   并非所有的结都承认双曲线几何形状。但是,大多数都可以使用卫星操作从双曲线和圆环结构建所有结。44。在这项工作中,我们仅关注双曲线结。我们通过许多易于计算的不变式来表征结的双曲结构。这些不变的人不能完全定义双曲线结构,但它们代表了几何学最常见的特性。我们最初的一般假设是,双曲线不变性将预测代数不变性。我们研究的具体假设是几何形状可以预测标志性。该签名是理想的候选人,因为它是一个易于理解且常见的不变性,它很容易计算出大的结,并且是一个整数,这使得预测任务特别直接(与例如多项式相比)。   我们使用活泼的软件包45从不同分布的PZ生成了许多数据集,如下所示。   对于上述数据集,我们计算了许多代数和几何结和几何结。不同的数据集涉及计算它们的不同子集,这取决于它们在形成和检查主要猜想中的作用。每个数据集都包含以下不变列表的子集:签名,斜率,音量,子午翻译,纵向翻译,注射率半径,积极性,阳性,Chern -imons不变性组,对称组,双胞胎扭转,双重物质的隔音,双重痕量痕量痕量痕迹痕迹,无形的痕迹,正常的边界鞋类和链接范围的范围数字,包括链接范围的数字,包括链接数字的范围数字。   在我们的数据生成过程中,随机生成结的规范三角剖分在我们的数据生成过程中失败了,在跨数据集的0.6%至1.7%之间。在较小的结上,在较小的结上,在较小的打结上,距离较小的时间的计算在2.8%的时间内失败了。在从里贾纳数据集的最多16个交叉口的结上,在5.2%的情况下,注射率半径计算失败。在大多数不变计算中,偶尔可能发生故障,在这种情况下,对于所请求的集合中其余的不变式的计算将继续进行。此外,由于某些不变性的计算复杂性很高,如果操作需要超过5分钟的不变,则可以超时。这是一种灵活的界限,最终是我们仅用于不关键的分析,以避免偏向结果的不变性。   以下编码方案用于将不同类型的特征转换为网络的真实有价值输入:真实的直接编码;复杂数字作为对应于真实和虚构部分的两个实数;分类为单速向量。   通过减去平均值并除以方差,将所有功能归一化。为了简单起见,在图3a中,通过获取其编码特征的最大值来汇总分类物的显着性值。   用于实验的模型架构是一个完全连接的馈电神经网络,具有隐藏的单位尺寸[300,300,300]和Sigmoid激活。该任务被框起来是一个多类分类问题,签名的独特值为类,跨膜片损失作为优化的损耗函数和测试分类精度作为性能的度量。使用标准优化器(ADAM)对其进行了固定数量的步骤训练。选择所有设置作为先验的合理值,而无需优化。   首先,为了评估打结的几何形状和代数之间的关系,我们训练了一个馈送前向神经网络,以从随机采样结的数据集上的几何图测量中预测签名。该模型能够在持有的测试集中达到78%的精度,而错误没有大于±2的错误。这显着高于机会(基线准确度为25%),这使我们对可能存在关系的信心充满信心。   为了了解网络的预测是如何进行的,我们使用基于梯度的归因来确定几何的测量值与签名最相关。我们使用一个简单的灵敏度测量RI来做到这一点,该测量RI平均在数据集中的所有示例x上相对于给定输入功能XI的损失梯度:   每个输入特征的此数量如图3A所示,我们可以确定几何形状的相关测量值似乎是所谓的尖形状:子午翻译,我们将表示μ和纵向翻译,我们将表示λ。通过训练一个新模型来证实这一点,以预测这三个测量值的签名,该测量能够达到与原始模型相同的性能水平。   为了确认斜率是要关注的几何学的足够方面,我们训练了一个模型,以预测斜率的签名。在扩展数据中对斜率和签名的视觉检查图1A,B显示了明显的线性趋势,并在此数据上训练线性模型导致测试精度为78%,这与原始模型的预测能力相当。这意味着斜率线性地捕获了有关原始模型从几何形状提取的签名的所有信息。   通过以不同的火车/测试分裂和不同的随机种子初始化网络重量和训练程序来计算特征分析的置信区间。   对于我们的主要数据集,我们考虑对称组的S9。第一个包含非平凡的bruhat间隔的对称组,其KL多项式不仅是1是S5,而S9中最大的间隔包含9!≈3.6×105节点,当用作网络输入时,它开始构成计算问题。对称组SN的间隔数为O(n!2),在S9中导致数十亿个间隔。跨间隔均匀的KL多项式系数的分布非常不平衡,因为较高的系数特别罕见,并且与未知的复杂结构相关。为了调整这一点并简化学习问题,我们利用了消除许多冗余小多项式47的bruhat间隔的等效类别。这具有减少每个对称组间隔数量的额外好处(例如,S9中的间隔约为290万)。我们通过为所有具有相同数量的节点数量的图表的每个不同KL多项式的单个间隔进一步降低数据集,从而为S9提供24,322个非同态图。我们以80%/20%的速度将间隔随机分为火车/测试分区。   一对排列的Bruhat间隔是组元素的部分排序集,可以表示为有向的无环形图,其中每个节点都由置换标记,每个边缘都用反射标记。我们在每个节点上添加两个特征,代表该节点的内数和超级。   为了建模BRUHAT间隔,我们使用了一种特定的石墨网架构,称为消息通话神经网络(MPNN)48。模型架构的设计(就激活功能和方向性而言)是由用于从标记的BRUHAT间隔计算KL多项式的算法的动机。虽然标记的Bruhat间隔包含特权信息,但这些算法暗示了可能对计算KL多项式系数有用的计算。因此,我们将MPNN设计为算法与此计算49的一致性。该模型是双向的,隐藏的层宽度为128,四个传播步骤和跳过连接。我们将KL多项式每个系数的预测视为一个单独的分类问题。   首先,为了确保猜想是正确的,我们训练了一个模型,以预测来自未标记的BRUHAT间隔的KL多项式的系数。我们能够以合理的精度(扩展数据表1)在不同的系数上这样做,提供了一些证据表明可能存在一般函数,因为四步MPNN是一个相对简单的函数类别。我们根据新假设的表示训练了一个图形网模型,并可以实现更好的性能,并借出证据表明它是一种足够且有用的表示,可以理解KL多项式。   为了了解学习函数如何进行预测,我们使用基于梯度的归因来定义每个示例间隔G的显着子图SG,该间隔在该间隔中由一个节点子集引起,其中l是损失,XV是Vertex v:v的功能。   然后,我们通过其边缘类型(每种反射)汇总边缘,并将其发生的频率与整体数据集进行了比较。显着子图中存在对极端边缘的影响,以预测高阶术语(Q3,Q4),这是较复杂且不容置疑的术语。   选择显着节点的阈值CK先验选择了整个数据集的归因值的第99个百分点,尽管结果在不同范围内的CK值[95,99.5]中存在。在图5A中,我们可视化了用于说明性目的的训练有素模型的特定快照的边缘归因度量。这种观点将在时间和随机种子之间发生变化,但是我们可以通过查看许多训练模型的总统计数据来确认该模式仍然存在,如图5B所示。在此图中,两个样本的两面t检验统计量如下:简单边缘:t = 25.7,p = 4.0×10-10;极端边缘:t = -13.8,p = 1.1×10-7;其他边缘:t = -3.2,p = 0.01。这些显着性结果对于模型的超参数的不同设置是可靠的。

本文来自作者[lejiaoyi]投稿,不代表言希号立场,如若转载,请注明出处:https://lejiaoyi.cn/life/202506-1122.html

(4)
lejiaoyi的头像lejiaoyi签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • lejiaoyi的头像
    lejiaoyi 2025年06月18日

    我是言希号的签约作者“lejiaoyi”

  • lejiaoyi
    lejiaoyi 2025年06月18日

    本文概览:  在监督的学习阶段,数学家提出了一个假设,即X(Z)和Y(Z)之间存在关系。在这项工作中,我们假设没有从x(z)到y(z)映射的已知函数,这又意味着x不可逆转(否则将存在已知...

  • lejiaoyi
    用户061810 2025年06月18日

    文章不错《通过AI指导人类直觉来推进数学》内容很有帮助

联系我们

邮件:言希号@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信