从欧氏空间到流形:基于Busemann函数的Horospherical深度理论与应用

Tukey深度流形数据Busemann函数
于 2026-06-02 03:20:12 修改
·本内容遵循CC 4.0 BY-SA版权协议

1. 项目概述:从欧氏空间的经典深度到流形上的内在几何

在多元统计分析里,我们常常需要回答一个看似简单却至关重要的问题:对于一个数据集,哪个点最能代表它的“中心”?在欧几里得空间里,Tukey深度(也叫半空间深度)提供了一个极其优雅的答案。它不依赖于任何参数假设,通过计算一个点被所有可能的半空间“包围”的最小概率来定义其深度。深度最大的点,即Tukey中位数,不仅是一个稳健的位置估计,还天然地提供了一种从中心向外排序数据的方式,以及一系列嵌套的凸深度轮廓。这套理论之所以强大,是因为它将数据的排序、几何结构和鲁棒性完美地封装在了一起。

然而,现实世界的数据并不总是乖乖地待在平坦的欧氏空间里。想象一下,你处理的是一组扩散张量成像数据(每个点是一个对称正定矩阵),或者是用于表示层次结构的双曲空间中的嵌入点,甚至是系统发育树空间中的树形结构。这些数据点天然地生活在弯曲的“流形”上。在这些空间里,直线(测地线)不再是通常意义上的直线,而“半空间”这个在欧氏空间中由线性不等式定义的简单概念,也失去了其内在的几何意义。如果我们生搬硬套欧氏空间的方法,就会破坏数据本身的几何结构,得到的“中心”可能毫无意义。

这就引出了本文的核心工作:如何在保持Tukey深度所有优良性质的前提下,将其推广到弯曲的空间?我们选择了一个特别适合的舞台:Hadamard流形。这类流形具有非正曲率,保证了任意两点间存在唯一的测地线,并且保持了“凸性”这一关键几何概念。我们的解决方案是引入Horospherical深度。其核心思想是用Busemann函数和其水平集——horosphere(极限球面)——来替代欧氏空间中的线性泛函和超平面。简单来说,在欧氏空间中,一个方向u定义的半空间是{x: ⟨u, x⟩ ≤ ⟨u, z⟩};在Hadamard流形上,我们用一个“指向无穷远点ξ”的Busemann函数Bξ(x)来替代内积⟨u, x⟩,从而定义内在的“半空间”{x: Bξ(x) ≥ Bξ(z)}。这个构造不仅是几何自然的(它是距离函数沿测地线射线趋于无穷的极限),而且自动继承了horoball(horosphere所围区域)的测地凸性。

因此,Horospherical深度不仅仅是一个数学上的类比,它是在弯曲几何下,对“中心性”和“排序”概念的真正内在重构。它保持了Tukey深度的灵魂:等距不变性、在对称中心处取最大值、从最深点出发的单调性、以及在无穷远处消失。更重要的是,我们证明了在任意d维Hadamard流形上,对于任何Borel概率测度,都存在深度至少为1/(d+1)的点(中心点定理),这直接推广了欧氏空间的经典结果。在曲率为负的条件下,深度函数甚至是严格拟凹的,从而保证了Busemann中位数的唯一性。这套理论为流形数据的非参数、稳健统计分析提供了一个坚实而富有几何直观的新框架。

2. 核心思路拆解:为什么是Busemann函数和Horosphere?

要理解Horospherical深度,我们必须先跳出欧氏空间的线性思维,进入弯曲几何的语境。关键在于找到欧氏空间中“方向”和“半空间”在流形上的正确对应物。

2.1 欧氏空间的启示:半空间的另一种解读

R^d中,Tukey深度定义为: D_T(z; P) = inf_{u∈S^{d-1}} P( {x: ⟨u, x⟩ ≤ ⟨u, z⟩} ) 这里,每个单位向量u定义了一个线性函数f_u(x) = ⟨u, x⟩,其水平集是超平面,子水平集就是半空间。

我们可以从距离的角度重新审视这个线性函数。固定一个方向u,考虑从原点出发沿u的射线γ(t) = t u。计算点xγ(t)的距离: d(x, γ(t)) = ||t u - x|| = t - ⟨u, x⟩ + o(1) (当 t → ∞) 你会发现,当t趋于无穷时,d(x, γ(t)) - t的极限恰好是-⟨u, x⟩。也就是说,线性函数⟨u, x⟩可以理解为“沿某方向逃逸到无穷远时,距离函数的某种正则化极限”。这个观察是通往流形推广的钥匙。

2.2 流形上的对应物:视觉边界与Busemann函数

在Hadamard流形X上,没有全局的线性结构,但我们有测地线。一个“方向”在无穷远处的终点,被称为一个“边界点”,所有边界点的集合构成视觉边界 ∂X。这替代了欧氏空间中的单位球面S^{d-1}

对于从某点p出发、指向边界点ξ的测地线射线γ,我们模仿上面的极限过程,定义Busemann函数B_ξ(x) = lim_{t→∞} [ d(γ(t), x) - t ] 这个极限在Hadamard流形上总是存在的。直观上,B_ξ(x)衡量了从x“看向”无穷远点ξ时的某种“对齐”程度。如果x在指向ξ的射线上,B_ξ值会线性递减;如果x偏离了该方向,B_ξ值会更大。

Busemann函数的几个关键几何性质:

  1. 平移不变性:如果改变定义中射线γ的起点,B_ξ只会相差一个常数(该常数等于新旧起点之间B_ξ值的差)。这意味着由B_ξ(x) ≥ B_ξ(z)定义的集合是内在的,不依赖于基点的选择。
  2. 凸性与Lipschitz连续性B_ξ是1-Lipschitz的测地凸函数。其梯度模长恒为1,方向正好指向(即与指向ξ的射线相切的方向相反)。
  3. 水平集的结构B_ξ(x) = t的集合称为horosphere(极限球面),可以想象为以无穷远点ξ为“圆心”的球面。B_ξ(x) ≤ t的集合称为horoball(极限球),它是测地凸的。这正是我们寻找的“弯曲的半空间”。

2.3 Horospherical深度的定义与单边选择的智慧

基于以上,Horospherical深度的定义就水到渠成了: D(z; P) = inf_{ξ ∈ ∂X} P( {x: B_ξ(x) ≥ B_ξ(z)} ) 对于每个边界方向ξ,我们考虑那个以z所在的horosphere为边界的、指向ξ的horoball(即B_ξ(x) ≥ B_ξ(z)的区域),并计算数据落在这个区域内的概率。然后对所有可能的方向ξ取下确界。深度最大的点集就是Busemann中位数

这里有一个精妙之处:为什么我们使用单边定义P(H^+_{ξ,z}),而不是看起来更对称的min{P(H^+_{ξ,z}), P(H^-_{ξ,z})}?在欧氏空间,由于H^+_{u,z}H^-_{-u,z}是同一个半空间,两者等价。但在弯曲空间,对于给定的ξ,通常不存在一个相反的边界点η使得H^+_{ξ,z} = H^-_{η,z}对所有z成立。只有当流形截面曲率为零(即平坦)时,这才可能。因此,采用双边定义会破坏深度的内在几何性质,导致深度区域不再是horoball的交集,从而失去凸性。单边定义虽然形式上不对称,但通过对所有ξ取inf,它自然地让相反方向相互竞争,同时保留了horoball交集的优美结构,这是后续所有凸性理论的基础。

2.4 深度区域的凸性表示定理

这是整个理论的基石。定义每个边界方向ξ上Busemann投影的生存函数S_ξ(t) = P({x: B_ξ(x) ≥ t})及其上分位数t_ξ(α) = sup{t: S_ξ(t) ≥ α}。那么,深度区域可以表示为: D_α(P) = {z: D(z; P) ≥ α} = ∩_{ξ∈∂X} {z: B_ξ(z) ≤ t_ξ(α)} = ∩_{ξ∈∂X} H_ξ(t_ξ(α)) 这个表示是革命性的。它告诉我们,α-深度区域就是所有horoball H_ξ(t_ξ(α))的交集。由于每个horoball都是测地凸的,而凸集的交集仍是凸的,因此每一个深度区域D_α(P)都是测地凸集。这完美复现了Tukey深度区域在欧氏空间中是凸多面体(半空间交集)的这一核心几何特征。

3. 理论支柱:性质、存在性与中心点定理

定义了深度函数之后,我们需要验证它是否具备一个优秀深度函数应有的基本性质,并证明其最深点(中位数)总是存在的。

3.1 四大核心公理的满足情况

我们参照欧氏空间深度函数的公理框架,逐一检验:

  1. 等距不变性:这是内在性的直接体现。设φ: X → XX上的一个等距映射。因为等距映射将测地线映为测地线,从而保持视觉边界∂X和Busemann函数(至多差一个常数),所以有D(φ(z); φ_#P) = D(z; P)。这意味着整个深度景观(深度函数、深度区域、中位数)都会随着流形的等距变换而协变。在欧氏空间,这对应于仿射不变性;在这里,对称群变成了流形本身的等距群。

  2. 在对称中心处取最大值:我们需要定义流形上的“对称”。有两种自然的定义:

    • 中心对称:关于点θ的测地对称(即沿测地线反射)保持测度P不变。
    • Horospherical对称:对于所有边界方向ξ,都有P(H^+_{ξ,θ}) ≥ 1/2。 可以证明,中心对称蕴含horospherical对称。如果P关于唯一的点θ是horospherical对称的,那么θ就是深度的唯一最大值点,即µ*(P) = {θ}。这符合直觉:如果一个点从所有“方向”看,都至少有半数数据在其“前方”,那它自然是中心。
  3. 在无穷远处消失:可以证明,当点z远离原点(即d(o, z) → ∞)时,其深度D(z; P) → 0。这意味着深度函数确实能将中心点与外围点区分开来,最深点必然位于空间的某个有界区域内。

  4. 从最深点出发的单调性:设z*是一个最深点,z是任意点,γ是连接z*z的测地线段。那么对于线段上任意点γ(t),其深度不小于z的深度,即D(γ(t); P) ≥ D(z; P)。深度沿着从最深点出发的射线非递增。在负曲率条件下,这个性质可以加强为严格拟凹性。

3.2 存在性与中心点定理:确保深度非平凡

仅仅有定义和性质还不够,我们必须确保对于任意概率测度P,深度函数确实能给出一个有意义的“中心”。这里的关键是中心点定理

定理:设X是d维Hadamard流形,P是其上的Borel概率测度。则存在点z* ∈ X,使得D(z*; P) ≥ 1/(d+1)

这个定理是Tukey深度经典结论在流形上的直接推广。其证明思路精巧地结合了几何与概率:

  1. 正则化:首先用热核光滑化测度P,得到一系列绝对连续于体积元的测度P_h,且P_h弱收敛于P
  2. 切空间投影:对于光滑后的测度P_h,在每一点z,我们可以考虑切空间T_zX中的“半空间”。Rusciano的切空间深度中心点定理保证,存在点z_h,使得任何切空间半空间都包含至少1/(d+1)P_h质量。
  3. 与Horospherical深度关联:关键的一步是,利用Busemann函数的凸性,可以证明在点z_h处,任何切空间半空间都包含在某个horospherical半空间H^+_{ξ, z_h}中。因此,z_h的Horospherical深度也至少为1/(d+1)
  4. 取极限:由于(P_h)是紧的,点列{z_h}不会逃逸到无穷远。取其收敛子列,利用深度函数的联合上半连续性,即得到极限点z*满足D(z*; P) ≥ 1/(d+1)

这个定理有多个重要推论:

  • Busemann中位数非空:深度最大值D*(P) ≥ 1/(d+1) > 0,结合深度函数的上半连续性和在无穷远处消失的性质,可以证明最大值点集µ*(P)是非空紧集。
  • 深度区域的结构:对于任意α > 0,深度区域D_α(P)是测地凸的紧集。对于0 < α ≤ 1/(d+1)D_α(P)非空。如果深度函数连续,那么对于0 < α < D*(P)D_α(P)同胚于一个d维拓扑球。

至此,我们建立了一个完整的理论框架:Horospherical深度在任意Hadamard流形上定义良好,满足核心公理,其深度区域是凸的、嵌套的紧集,并且总是存在深度至少为1/(d+1)的“中心点”。然而,最深区域µ*(P)可能是一个点,也可能是一个具有正直径的凸集。为了得到唯一的中位数,我们需要更严格的几何条件。

4. 严格负曲率下的强化理论:唯一性与鲁棒性

在截面曲率严格为负(Sec_X < 0)的Hadamard流形上,几何结构本身提供了更强的约束,可以迫使深度函数呈现更“尖锐”的形态,从而保证中位数的唯一性。

4.1 Busemann函数的严格凸性与深度严格拟凹性

在负曲率下,Busemann函数沿着不与自身渐近的测地线是严格凸的。具体来说:

  • γ是一条完备测地线,其两个端点为ξ+ξ-
  • 对于任意边界点ξ,如果ξ既不是ξ+也不是ξ-,那么复合函数B_ξ ◦ γR上是严格凸的。
  • 只有当ξγ的端点时,B_ξ ◦ γ才是仿射的(斜率为±1)。

这个性质是负曲率的直接结果。它意味着,除了沿着指向horosphere“圆心”ξ或完全相反方向的测地线,Busemann函数在其他任何测地线上都是弯曲的。由此可以推出,在负曲率下,每个horoball H_ξ(t)都是严格测地凸的:连接其中任意两点的测地线,其内部完全落在horoball的内部。

为了将几何的严格凸性转化为深度函数的严格拟凹性,我们需要两个关于测度P的温和正则性假设:

  • 假设1:对于所有ξ ∈ ∂Xt ∈ R,有P({x: B_ξ(x) = t}) = 0。即每个Busemann投影(B_ξ)_#P都是无原子的。一个充分的条件是P关于体积元绝对连续。
  • 假设2:对于所有ξ ∈ ∂X,投影测度(B_ξ)_#P的支撑集是R中的一个区间。这要求P的支撑集是连通的。

在这些假设和负曲率条件下,我们可以证明深度函数D(·; P)在正深度区域上是严格拟凹的:对于任意两个深度为正且不同的点xy,以及连接它们的测地线段γ上的任意内点s ∈ (0,1),都有D(γ(s); P) > min{D(x; P), D(y; P)}

严格拟凹性的直接推论就是唯一性:最深点集µ*(P)是一个单点集。也就是说,Busemann中位数是唯一的。这是一个比欧氏空间更强的结论。在欧氏空间中,Tukey中位数的唯一性通常需要测度绝对连续且支撑集为凸等额外条件。而在负曲率流形上,几何的刚性(horoball的严格凸性)直接贡献了严格性,我们只需要对一维投影测度施加相对较弱的正则性条件。

4.2 鲁棒性分析:对污染数据的稳健响应

深度函数的一个核心优势是鲁棒性。我们主要从两个角度分析Horospherical深度的鲁棒性:全变差扰动和污染点逃逸至无穷远(视觉边界)。

全变差稳定性:在唯一性成立的条件下(负曲率+假设1&2),Busemann中位数作为P的函数,关于全变差距离是连续的。存在一个模函数ω(η),满足ω(η) → 0 (η → 0),使得对于任意Borel概率测度Q,有: sup_{z ∈ µ*(Q)} d(z, µ*(P)) ≤ ω( ||P - Q||_{TV} ) 这意味着,当污染测度Q与真实测度P相差很小时,其中位数也不会偏离太远。

边界污染分析:这是一个特别有趣且能体现几何特性的场景。考虑一个污染模型P_ε = (1-ε)P + εδ_y,其中污染点y沿着某条测地线射线逃逸至无穷远(即d(o, y) → ∞)。我们关心当y逃逸时,深度函数D(z; P_ε)和中位数µ*(P_ε)的极限行为。

分析表明,深度函数会逐点收敛到一个明确的极限函数D_∞(z; P),该极限由污染点逃逸的方向ξ决定。更关键的是,如果极限深度函数D_∞(·; P)在某个水平ε之上有唯一的最大值点,那么污染后的中位数µ*(P_ε)会收敛到该最大值点。这与基于距离的估计量(如Frèchet均值)形成鲜明对比:Frèchet均值会被逃逸的污染点“拉向”边界。这从理论上印证了深度中位数对离群值的更强抵抗力。

实操心得与注意事项

  • 唯一性的前提:唯一性严重依赖于负曲率。在具有平坦因子(零曲率子空间)的乘积流形(如S^+_p在仿射不变度量下)中,唯一性可能不成立,中位数可能是一个集合。在应用时,需要先判断流形的曲率性质。
  • 样本中位数的非唯一性:即使总体中位数唯一,对于有限样本的经验测度P_n,假设1(无原子性)几乎必然不成立。因此,样本Busemann中位数µ*(P_n)通常是一个具有正直径的凸集,而非单点。这并非缺陷,而是非参数深度估计的共性。在实践中,我们可以取该集合的某种中心(如重心)作为代表,或者直接报告整个集合。
  • 边界方向的选取与计算:理论要求对所有边界方向ξ ∈ ∂X取inf,这在计算上是不可行的。在实际算法中,必须对边界方向进行离散化采样。如何有效采样∂X(在双曲空间是球面,在SPD流形则更复杂)是一个重要的计算问题。

5. 统计理论:样本深度的一致收敛性

任何统计理论最终都需要落实到样本推断上。设X_1, ..., X_n是来自总体P的独立同分布样本,P_n为相应的经验测度。我们定义样本Horospherical深度D_n(z) := D(z; P_n)。一个核心问题是:D_n(z)是否一致地收敛到总体深度D(z; P)

答案是肯定的,但证明策略因流形结构而异。

5.1 对称空间情形:VC理论的应用

在非紧型对称空间(如双曲空间H^d、对称正定矩阵流形S^+_p等)上,我们可以利用Vapnik-Chervonenkis(VC)理论。关键在于证明,由集合{H^+_{ξ,z}: ξ ∈ ∂X, z ∈ X}构成的函数类是VC类。这意味着该集合类具有有限的VC维数。

一旦证明了VC性质,标准的一致性定理(如Glivenko-Cantelli定理的泛函形式)就能保证: sup_{z∈X} |D_n(z) - D(z; P)| → 0 几乎必然成立。 此外,我们还能得到深度区域Hausdorff收敛的结论:对于满足P({z: D(z; P) = α}) = 0α,有D_α(P_n)在Hausdorff距离下收敛到D_α(P)。如果总体中位数唯一,样本中位数集µ*(P_n)也会Hausdorff收敛到{µ*(P)}

5.2 一般Hadamard流形情形:紧致性与连续性论证

对于一般的Hadamard流形,视觉边界∂X在锥拓扑下是紧的,且Busemann函数(ξ, x) ↦ B_ξ(x)是连续的。在总体测度P满足假设1(所有Busemann投影无原子)的条件下,我们可以绕过VC理论,直接利用紧致性和连续性,证明样本深度的一致强相合性。

定理:设X为Hadamard流形,P满足假设1。则 sup_{z∈K} |D_n(z) - D(z; P)| → 0 几乎必然成立, 其中KX的任意紧子集。如果P的支撑集包含在某个紧集内,则一致收敛在整个X上成立。

这些一致性结果为基于Horospherical深度的推断(如构造深度轮廓图、进行异常值检测)提供了理论保障。

6. 实例与计算构造

理论需要实例来具象化。我们考虑两个最重要的Hadamard流形例子:双曲空间和对称正定矩阵流形。

6.1 双曲空间 H^d

在庞加莱球模型下,H^d可视为单位球内部。视觉边界∂H^d等同于单位球面S^{d-1}。对于从原点o指向ξ ∈ S^{d-1}的测地线射线,其Busemann函数有显式表达式: B_ξ(x) = log( ||x - ξ||^2 ) - log( 1 - ||x||^2 ) 其中||·||是欧氏范数。此时,horosphere {x: B_ξ(x) = c}是一个在边界点ξ处与单位球面内切的欧氏球面。

计算步骤示例

  1. 离散化边界:在S^{d-1}上生成一组均匀或拟均匀的点集{ξ_1, ..., ξ_m}作为边界方向的近似。
  2. 计算样本深度:对于待评估点z和每个方向ξ_i,计算B_{ξ_i}(X_j)B_{ξ_i}(z),统计满足B_{ξ_i}(X_j) ≥ B_{ξ_i}(z)的样本比例P_n(H^+_{ξ_i, z})
  3. 取最小值D_n(z) = min_{i=1,...,m} P_n(H^+_{ξ_i, z})
  4. 寻找中位数:通过优化算法(如梯度下降、随机搜索)在H^d上寻找最大化D_n(z)的点或区域。

由于H^d的负曲率性质,在总体测度绝对连续且支撑连通时,Busemann中位数理论上是唯一的。样本中位数集可能是一个小区域,可以用其重心作为点估计。

6.2 对称正定矩阵流形 S^+_p

S^+_p在仿射不变度量下是一个Hadamard流形。其视觉边界∂S^+_p可以理解为“退化矩阵射线”的集合,结构比球面复杂。Busemann函数的计算也更为复杂,通常涉及矩阵对数和特征值。

一个实用的简化方法是利用对称空间的结构S^+_p是一个非紧型黎曼对称空间,其视觉边界可以与一个紧齐性空间(一个旗流形)等同。我们可以在这个旗流形上采样方向ξ

对于给定的方向ξ(对应于一个“极大抛物子群”或一个“边界点”),Busemann函数可以表示为: B_ξ(Σ) = tr( Λ * log( U^T Σ U ) ) 其中U是一个正交矩阵,Λ是一个对角矩阵,它们共同参数化了方向ξ。具体形式依赖于ξ的选取。

计算挑战与策略

  1. 边界参数化:高效参数化和采样∂S^+_p是一个前沿课题。一种方法是利用KAK分解(Cartan分解),在极大阿贝尔子代数上定义方向。
  2. 函数求值:计算B_ξ(Σ)涉及矩阵对数和特征值分解,对于大的p计算量较大。
  3. 优化:在S^+_p上优化深度函数D_n(z)是非凸优化问题。可以利用流形优化工具包(如Manopt),结合深度函数的上半连续性和区域凸性,设计有效的搜索算法。

注意事项

  • S^+_p的截面曲率非正但不一定严格为负,它包含平坦子空间(对应于交换的矩阵子集)。因此,唯一性定理不一定适用,Busemann中位数可能是一个非单点集。这在解释结果时需要特别注意。
  • 在实际计算中,由于只能采样有限个方向,计算出的深度是真实深度的上界。需要研究离散化方向数m与深度估计精度之间的关系。

7. 总结、比较与未来方向

Horospherical深度成功地将Tukey深度的核心思想移植到了Hadamard流形上。其成功的关键在于用Busemann函数和horosphere这一对几何对象,精准地捕捉了“方向”和“半空间”在弯曲空间中的内在类比。

7.1 与现有流形深度方法的比较

  • 与度量半空间深度的比较:度量半空间深度D_M(z; P) = inf_{y≠z} P({x: d(x,z) ≤ d(x,y)})仅依赖于距离,具有等距不变性,适用范围更广(任何度量空间)。但其深度区域不一定凸,也缺乏中心点定理。Horospherical深度牺牲了部分通用性,换来了更丰富的欧氏深度几何结构(凸性、中心点定理)。
  • 与切空间深度的比较:切空间深度将数据投影到某点切空间,然后在切空间中应用欧氏深度。它依赖于基点的选择,不是完全内在的。Horospherical深度是彻底内在的,不引入外部坐标系。
  • 与透镜深度的比较:透镜深度基于度量球,虽然能定义中心性,但完全丢失了“半空间”的几何,其深度区域没有凸性。

因此,Horospherical深度在“保留经典深度几何结构”和“保持内在性”之间取得了最佳平衡。

7.2 局限性与开放问题

  1. 计算复杂度:需要对高维视觉边界进行采样,并对每个方向计算Busemann函数,计算成本高昂。发展高效的离散化方案和优化算法是实际应用的关键。
  2. 超越光滑流形:理论建立在Hadamard流形(光滑、非正曲率)上。一个重要的扩展方向是奇异的CAT(0)空间,例如系统发育树空间。在这些空间上,Busemann函数和horosphere仍有定义,但光滑性缺失,许多分析工具需要重新开发。
  3. 高秩空间的唯一性:在像S^+_p (p>2)这样的高秩空间(包含平坦)中,唯一性定理失效。如何刻画这些空间中Busemann中位数的结构(例如,它是否必然包含在一个平坦里?)是一个有趣的几何问题。
  4. 统计推断:基于样本深度的置信区域构造、假设检验等推断方法尚未开发。由于深度函数的非光滑性和中位数可能为集值,这带来了新的理论挑战。
  5. 与机器学习结合:在表示学习、图神经网络等领域,数据常被嵌入双曲空间。Horospherical深度为这些嵌入向量的稳健聚合、异常检测提供了新的理论工具,值得探索。

7.3 实操心得与最终建议

从我尝试实现和实验的角度来看,有几点心得:

对于理论验证者:如果你想在具体流形上验证理论性质,从双曲空间H^2H^3开始是最佳选择。庞加莱圆盘或半球模型可视化效果好,Busemann函数有简单表达式。可以先在均匀分布或混合分布上计算深度轮廓,直观感受凸性、对称性和中心点定理。

对于算法实现者:边界方向的离散化是精度和效率的权衡。在球面边界上,使用斐波那契格点或Halton序列比随机均匀采样覆盖更均匀。在优化深度时,由于深度函数是上半连续且通常非光滑,直接使用基于梯度的算法可能失败。建议结合全局搜索(如流形上的粒子群优化)和局部改进(在凸的深度区域内求重心)。

对于应用研究者:在将Horospherical深度应用于新领域(如SPD矩阵的脑连接数据分析)时,首要任务是确认数据空间的几何模型是否合理(是否真是Hadamard流形?)。其次,要意识到样本中位数可能是一个区域,这本身可能包含有用信息(例如,反映了数据的某种不确定性或多模态性)。报告整个深度轮廓图比只报告一个点估计更能反映数据分布的全貌。

最后,这个框架的魅力在于其几何的纯粹与统计的深刻之间的融合。它告诉我们,即使在弯曲的空间里,“中心”和“顺序”这些基本概念仍然可以有坚实而优美的数学定义,并且这些定义直接继承了经典理论中最宝贵的特质:鲁棒性、凸性和内在性。这为处理日益复杂的非欧氏数据打开了一扇新的大门。

只有一个B-函数的完备非紧具非负曲率流形 (2000年)
这些引理涉及到流形上射线的性质,以及这些射线相关的Busemann函数的性质。例如,对于流形上的每条测地线,都可以定义一个Busemann函数,这些函数的渐近性决定了流形的某些全局性质。
weixin_38740848
2
具二次渐近非负曲率的黎曼流形 (2001年)
Busemann函数是微分几何中一种重要的函数测地线紧密相关。在完备的非紧黎曼流形上,Busemann函数可以用来研究测地射线的渐近性质,而测地射线是连接流形上两点间的局部最短路径。
weixin_38744803
5
HoroPCA双曲维水平投影降维_HoroPCA Hyperbolic Dimensionality Reduction via
资源摘要信息:"HoroPCA双曲维水平投影降维(Hyperbolic Dimensionality Reduction via Horospherical Projections)是一种面向非欧几里得几何空间——特别是双曲空间(Hyperbolic Space)——所设计的新型流形感知型降维方法,其核心思想是将经典欧氏空间中主成分分析(PCA)的三大支柱性机制——子空间参数化、正交投影算子方差最大化目标函数——系统性地推广至双曲几何框架下,并以水平球面(horosphere)为基本几何载体,构建具备严格微分几何基础、良好可解释性强保持结构能力的降维范式。该方法并非简单地将欧氏PCA平移至双曲坐标系,而是深度依托双曲空间的负常曲率特性(K = −1)、指数增长的体积增长律、树状/层级结构天然嵌入优势,以及共形模型(如庞加莱圆盘模型或洛伦兹模型)中的度量张量、测地线、指数映射对数映射等内在结构,重新定义‘方向’‘子空间’‘投影’‘信息保留’等根本概念。在HoroPCA中,‘主方向’不再对应于特征向量张成的线性子空间,而是由一组指向无穷远边界∂ℍᵈ的单位切向量所诱导的horospherical foliation(水平球层叠),即一族以某固定理想点ξ∈∂ℍᵈ为‘中心’、沿测地射线ρₜ收敛于ξ的嵌套水平球面;投影操作则被重构为沿测地法线方向向特定水平球面h_ξ^c进行horospherical projection(水平球面投影),该投影具有唯一性、连续性局部等距性,在极限情形下退化为欧氏正交投影;而优化目标亦从最大化投影点集的欧氏方差,转为最大化其在水平球面上诱导的共形度量下的广义分散度(generalized dispersion),该度量通过引入horospherical coordinate system(水平球坐标系)下的拉普拉斯–贝尔特拉米算子能量泛函或基于Busemann函数的渐近距离方差来刻画。HoroPCA不仅在理论上严格满足双曲空间的协变性(covariance under isometry group O⁺(1,d))、尺度不变性边界一致性,更在实践层面展现出对超大规模层次化图数据(如知识图谱、引文网络、生物分类树、社交关注链)嵌入任务的卓越性能它能无损保留原始图的层级深度、分支因子、跨层跳跃关系及长程依赖,显著优于传统双曲嵌入方法(如Poincaré GloVe、Hyperbolic Graph Convolutional Networks)在低维压缩下的结构保真度;同时,其计算复杂度可控(O(nkd)含预处理),支持批量梯度更新GPU加速,可无缝集成进端到端几何深度学习流水线。尤为关键的是,HoroPCA首次建立了双曲主成分黎曼几何中Busemann函数、horocycle动力学、Anosov流及Gromov双曲性之间的深刻联系,为理解高维非线性数据的内在几何本质提供了全新范式,标志着从‘欧氏主导的统计学习’向‘几何原生的流形学习’范式跃迁的重要里程碑。"
易小侠
大数据-算法-Finsler流形上的若干曲率性质和几何向量场.pdf
这种几何理论在20世纪90年代后,由于陈省身等学者的推动,发展迅速,并在物理学、生物学等领域有广泛应用。文章主要分为三个部分1.
programxh
8
大数据-算法-二阶拟线性退化抛物方程的Cauchy问题和黎曼流形平行性的研究.pdf
此外,利用Busemann函数探讨了平行射线的性质,揭示了在截曲率满足特定条件时,流形的平行性质欧几里得空间的平行性质相似。
programxh
9
Wasserstein空间PCAGromov-Wasserstein距离优化原理、算法与应用
凿船尸爷
【信息科学工程学】【数据科学】数据科学领域——第三篇 数学08 几何学00总篇
编号英文名称中文名称简要说明/归属1Foundations of Geometry几何基础公理化方法, Hilbert《几何基础》2Euclidean Geometry (Synthetic)欧几里得几何(综合法)《几何原本》传统3Analytic Geometry解析几何坐标方法, Descartes, Fermat4Plane Geometry平面几何三角形、圆、共点共线等经典问题5Solid Geometry立体几何三维空间中的图形度量6Non-Euclidean Geometry非欧几何平行公设不