单细胞CRISPR筛选新视角:从效应大小到几何稳定性的范式转变

单细胞CRISPR筛选几何稳定性效应大小
于 2026-05-28 03:06:15 修改
·本内容遵循CC 4.0 BY-SA版权协议

1. 项目概述:从“移动多远”到“如何移动”的范式转变

在单细胞CRISPR筛选领域,我们长久以来习惯于用一个核心指标来评估一次基因扰动的效果:效应大小。简单来说,就是看一群被编辑过的细胞,它们的平均基因表达谱,相比未编辑的对照组细胞,在降维后的空间里“移动”了多远。这个距离值越大,通常意味着扰动越“有效”。这个思路直观且强大,驱动了无数关键基因的发现。

然而,在我处理了越来越多的单细胞扰动数据后,一个挥之不去的疑问逐渐浮现:“移动了多远”真的能完整描述一次扰动吗? 想象一下,你指挥一队士兵从A点前往B点。如果所有士兵都整齐划一、步调一致地前进,最终他们会在B点形成一个紧密的方阵。但如果每个士兵都收到了模糊甚至矛盾的指令,他们虽然也都离开了A点,但可能各自朝着不同方向散开,最终在B点周围形成一片松散的、方向各异的散兵。从“平均移动距离”来看,两队士兵可能走了相同的路程,但最终的状态和稳定性天差地别。

细胞对基因扰动的响应,恰恰存在着这种根本性的差异。两个扰动可能产生相同的效应大小,但一个(比如敲低谱系特异性转录因子KLF1)会驱动所有细胞沿着红细胞分化的既定轨迹,协调一致地“刹车”或转向;而另一个(比如敲低多效性主调控因子CEBPA)虽然也让细胞群体整体上远离了初始状态,但每个细胞可能被激活了免疫、代谢、细胞周期等不同下游程序,导致它们在基因表达空间中“四散奔逃”。前者产生的是一个几何稳定的细胞群体,后者则产生了一个几何不稳定的群体。

这种“方向一致性”的差异,传统基于距离的指标完全捕捉不到。但它至关重要,因为它直接关联到细胞状态的鲁棒性可预测性。一个几何不稳定的细胞群体,就像站在山脊上的球,稍有风吹草动就可能滚向未知的谷底,导致实验结果难以重复,或在细胞治疗中引发不可控的细胞命运漂移。因此,我们迫切需要一个新的度量标准,来回答这个更本质的生物学问题:细胞在响应扰动时,是作为一个协调的整体在移动,还是各自为政地散开?

这就是“扰动几何稳定性”概念诞生的背景。它不是要取代效应大小,而是提供一个与之正交的、互补的评估维度。本文将深入拆解我们开发的几何稳定性度量方法——Shesha,并分享如何将其应用于你的单细胞CRISPR数据分析中,以揭示隐藏在数据背后的调控架构逻辑和细胞应激状态。

2. 核心原理拆解:Shesha度量与细胞状态流形几何

要理解几何稳定性,我们首先得抛弃将细胞视为孤立数据点的思维,转而接受一个更符合生物学现实的图景:细胞状态空间是一个高维的、弯曲的流形。你可以把它想象成一个复杂多变的山地地形图。山谷代表稳定的细胞状态(如静息态、特定分化终点),山脊则代表不稳定的过渡状态。细胞就像这个地形图上的小球,其基因表达谱决定了它的具体位置。

一次基因扰动,相当于给这个小球施加了一个推力。效应大小度量的是这个推力平均让小球滚了多远。而几何稳定性度量的则是:所有被推的小球,它们的滚动方向是否一致? 如果推力方向与山谷的斜坡方向一致,所有小球都会沿着山谷协调地向下滚,最终聚集在新的谷底(高稳定性)。如果推力方向是横切山脊,或者同时激活了多个冲突的下游通路,那么不同小球可能会被推向不同的山坡,导致群体分散(低稳定性)。

2.1 Shesha稳定性的数学定义与计算

基于上述几何直观,我们定义了扰动稳定性度量Shesha。其计算流程清晰,可直接集成到你的分析管线中:

  1. 数据准备与嵌入:使用标准的单细胞分析流程(如Scanpy)处理你的CRISPR扰动数据。关键步骤包括:文库大小归一化、log1p转换、筛选高变基因(例如前2000个),然后进行主成分分析(PCA)降维,通常取前50个主成分。这一步将每个细胞映射到PCA空间中的一个点(坐标向量)。
  2. 计算位移向量:对于某个特定的扰动p,假设有n_p个细胞受到了该扰动。对于其中第i个细胞,其位移向量 d_i 定义为: d_i = x_i - μ_ctrl 其中,x_i 是该扰动细胞在PCA空间中的坐标,μ_ctrl 是所有对照(未扰动)细胞在PCA空间中的质心。
  3. 计算平均扰动方向:将所有扰动细胞的位移向量求平均,得到整个扰动群体的平均移动方向 d_bard_bar = (1 / n_p) * Σ d_i
  4. 计算稳定性得分 S_p:这是Shesha的核心。它计算每个细胞的位移向量 d_i 与平均方向 d_bar 之间的余弦相似度,然后对所有细胞取平均: S_p = (1 / n_p) * Σ ( (d_i · d_bar) / (||d_i|| * ||d_bar||) )

这个公式的生物学解读非常直接

  • 余弦相似度:衡量两个向量方向的接近程度。值域为[-1, 1],1表示完全同向,0表示垂直(不相关),-1表示完全反向。
  • S_p ≈ 1:意味着所有细胞的位移方向几乎与平均方向完全一致,群体响应高度协调。就像士兵方阵齐步走。
  • S_p ≈ 0:意味着细胞的位移方向杂乱无章,与平均方向几乎正交,群体响应是分散的。就像散兵游勇。
  • S_p 为负值:在理论上可能,但在实际生物学扰动中极为罕见,那意味着许多细胞在朝相反方向移动。

实操心得:在计算S_p时,务必确保对照组的定义准确。对于不同的数据集,对照标签可能不同(如“control”、“NT”、“non-targeting”)。我们开发的多阶段匹配协议(精确匹配、分隔符感知的正则表达式、子串匹配)能较好地处理这种异质性。建议每个扰动至少包含50个细胞,以保证稳定性估计的可靠性。细胞数过少(如少于10个)会导致置信区间过宽,结果不可靠。

2.2 为什么是“几何税”?——多效性调控的代价

通过将S_p应用于超过2200个CRISPR扰动(涵盖CRISPRa、CRISPRi和混合筛选),我们发现了一个普遍规律:效应大小(移动距离)和几何稳定性(方向一致性)通常是强相关的(Spearman ρ 在0.75到0.97之间)。这很好理解,要产生一个大的平均位移,大多数细胞的移动方向总不能相差太远。

但最有生物学启示的,恰恰是那些背离这个普遍规律的“离群点”。我们通过计算“失谐度”(标准化残差)来识别它们:那些效应很大但稳定性很低的扰动,以及效应不大但稳定性很高的扰动。

  • 支付高额“几何税”的扰动:以转录因子CEBPA和GATA1为例。它们是典型的多效性主调控因子,能同时激活大量涉及不同生物学过程的下游基因。当敲低它们时,细胞群体确实发生了巨大的转录组变化(效应大),但每个细胞被影响的“侧重点”可能不同——有的更偏向代谢重编程,有的更偏向炎症响应。结果就是,位移向量d_i指向四面八方,平均余弦相似度S_p很低。这种因调控目标过于广泛而导致的群体响应不一致性,我们称之为“几何税”
  • “免税”或“低税”的扰动:以红细胞特异性转录因子KLF1为例。它的下游靶基因功能高度协同,都指向同一个生物学目标——终末红细胞分化。敲低KLF1,所有细胞几乎都沿着“红细胞分化”这个山谷的斜坡发生位移,方向高度一致,因此S_p很高。

这背后的深层逻辑是基因调控网络的拓扑结构。谱系特异性因子的调控网络就像一个设计良好的管道,将细胞引向一个明确的、深陷的“吸引子”状态(山谷底部)。而多效性因子的网络则像一张四通八达但缺乏明确出口的网,将细胞推向一个平坦的或有多条岔路的区域(山脊),导致细胞命运决策缺乏协调性。

3. 实操指南:在你的数据中计算与应用几何稳定性

理解了原理,下一步就是动手实践。我们将整个方法封装成了开源Python包 shesha-geometry,旨在与基于Scanpy/AnnData的标准工作流无缝集成。

3.1 环境配置与数据准备

首先,安装必要的包并准备你的AnnData对象。

BASH
# 安装 shesha-geometry
pip install shesha-geometry
PYTHON
import scanpy as sc
import shesha.bio as shesha_bio
 
# 假设你的数据已经是一个AnnData对象 `adata`
# 它必须包含一个观测列(例如 .obs['perturbation'])来标注每个细胞属于哪个扰动或对照组
# 以及经过标准预处理(归一化、取log、HVG、PCA)后的降维坐标,例如存储在 .obsm['X_pca']
 
# 1. 预处理流程(标准步骤)
sc.pp.normalize_total(adata, target_sum=1e4)
sc.pp.log1p(adata)
sc.pp.highly_variable_genes(adata, n_top_genes=2000, subset=True)
sc.tl.pca(adata, n_comps=50, svd_solver='arpack')

3.2 核心计算:一键获取稳定性与效应大小

shesha-geometry 提供了简洁的函数来计算所有扰动的稳定性和效应大小。

PYTHON
# 2. 计算扰动稳定性 (S_p) 和效应大小 (M_p)
# perturbation_key: 标注扰动分组的列名
# control_label: 对照组的标签,支持列表或正则表达式
# embedding_key: 使用的嵌入矩阵,默认为PCA结果
# metric: 距离度量,默认为‘euclidean’
 
results_df = shesha_bio.compute_perturbation_metrics(
adata,
perturbation_key='perturbation',
control_label=['control', 'NT', 'non-targeting'], # 根据你的数据调整
embedding_key='X_pca',
metric='euclidean',
n_jobs=-1 # 使用所有CPU核心加速
)
 
# results_df 是一个DataFrame,包含以下列:
# perturbation: 扰动名称
# n_cells: 该扰动的细胞数
# stability (S_p): 几何稳定性得分 (0到1之间)
# magnitude (M_p): 效应大小 (欧氏距离)
# 以及其他统计信息
print(results_df.head())

3.3 结果可视化与解读

计算完成后,可视化是理解结果的关键。

PYTHON
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
 
# 3. 绘制效应大小 vs 稳定性散点图
plt.figure(figsize=(8, 6))
scatter = plt.scatter(results_df['magnitude'], results_df['stability'],
c=results_df['n_cells'], cmap='viridis', alpha=0.7, s=50)
plt.colorbar(scatter, label='Number of Cells')
plt.xlabel('Effect Magnitude (Euclidean Distance)')
plt.ylabel('Perturbation Stability (S_p)')
plt.title('Perturbation Geometry: Magnitude vs Stability')
 
# 添加回归线
z = np.polyfit(results_df['magnitude'], results_df['stability'], 1)
p = np.poly1d(z)
x_range = np.linspace(results_df['magnitude'].min(), results_df['magnitude'].max(), 100)
plt.plot(x_range, p(x_range), "r--", alpha=0.8, label=f'Fit (ρ={results_df[["magnitude", "stability"]].corr(method="spearman").iloc[0,1]:.3f})')
plt.legend()
plt.tight_layout()
plt.show()
 
# 4. 识别高失谐度扰动(离群点)
# 计算标准化残差(失谐度)
from scipy import stats
# 使用稳健的线性回归,避免离群点影响
slope, intercept, r_value, p_value, std_err = stats.linregress(results_df['magnitude'], results_df['stability'])
predicted_stability = intercept + slope * results_df['magnitude']
residuals = results_df['stability'] - predicted_stability
# 标准化残差
results_df['discordance'] = (residuals - residuals.mean()) / residuals.std()
 
# 找出最不稳定(高失谐度)和最稳定(低失谐度)的扰动
top_unstable = results_df.nlargest(10, 'discordance')[['perturbation', 'magnitude', 'stability', 'discordance']]
top_stable = results_df.nsmallest(10, 'discordance')[['perturbation', 'magnitude', 'stability', 'discordance']]
 
print("Top 10 Unstable Perturbations (High Discordance):")
print(top_unstable)
print("\nTop 10 Stable Perturbations (Low Discordance):")
print(top_stable)

3.4 高级分析:关联几何稳定性与细胞应激

我们的研究发现,几何不稳定性与内质网应激标志物HSPA5(BiP/GRP78)的表达升高独立相关。你可以在自己的数据中验证这一关联。

PYTHON
# 5. 分析稳定性与应激基因表达的关系
# 假设你的 adata.raw 或某个层中存储了原始或归一化的计数数据用于基因表达分析
stress_markers = ['HSPA5', 'DDIT3', 'ATF4', 'XBP1'] # 常见内质网应激/UPR标记
 
# 计算每个扰动中应激基因的平均表达
perturbation_groups = adata.obs.groupby('perturbation')
marker_expression = {}
for marker in stress_markers:
# 这里需要根据你的数据结构获取基因表达值,例如从 .raw.X 或 .layers['log1p']
# 假设表达数据在 adata.X (log1p normalized)
if marker in adata.var_names:
exp_series = perturbation_groups.apply(lambda x: adata[x.index, marker].X.mean())
marker_expression[marker] = exp_series
else:
print(f"Warning: Gene {marker} not found in var_names.")
 
# 合并到结果DataFrame
for marker, exp_series in marker_expression.items():
results_df[f'{marker}_expr'] = results_df['perturbation'].map(exp_series)
 
# 计算偏相关(控制效应大小)
import pingouin as pg
partial_corr_results = {}
for marker in stress_markers:
if f'{marker}_expr' in results_df.columns:
# 移除缺失值
df_temp = results_df[['stability', 'magnitude', f'{marker}_expr']].dropna()
if len(df_temp) > 3: # 确保有足够样本
partial_corr = pg.partial_corr(data=df_temp, x='stability', y=f'{marker}_expr', covar='magnitude', method='spearman')
partial_corr_results[marker] = partial_corr
print(f"Partial correlation (stability vs {marker}, controlling for magnitude):")
print(f" rho = {partial_corr['r'].values[0]:.3f}, p = {partial_corr['p-val'].values[0]:.4f}")
 
# 可视化稳定性与HSPA5表达的关系
if 'HSPA5_expr' in results_df.columns:
plt.figure(figsize=(7, 5))
plt.scatter(results_df['stability'], results_df['HSPA5_expr'], alpha=0.6)
plt.xlabel('Perturbation Stability (S_p)')
plt.ylabel('Mean HSPA5 (BiP) Expression')
plt.title('Geometric Instability Associated with ER Stress')
# 添加中位数分界线,观察象限缺失
median_stab = results_df['stability'].median()
median_expr = results_df['HSPA5_expr'].median()
plt.axvline(median_stab, color='gray', linestyle='--', alpha=0.5)
plt.axhline(median_expr, color='gray', linestyle='--', alpha=0.5)
plt.tight_layout()
plt.show()

注意事项:偏相关分析是关键。因为效应大小本身可能与应激基因表达相关(大扰动可能引发更强应激),只有控制了效应大小后仍然显著的负相关,才能说明几何不稳定性本身与应激激活独立相关。在我们的数据中,HSPA5在CRISPRi数据集中表现出了这种稳健的负偏相关。

4. 方法稳健性验证与高级话题

任何新提出的度量指标,都必须经过严格的稳健性检验。我们在原始研究中进行了多方面验证,这里为你提供复现和扩展的思路。

4.1 嵌入方法鲁棒性:超越PCA

一个核心质疑是:S_p度量的稳定性是否只是PCA这种线性降维方法的人工产物?为了回答这个问题,我们在非线性基础模型scGPT的嵌入空间中也计算了S_p

PYTHON
# 假设你已经使用scGPT生成了细胞嵌入并存储在 adata.obsm['X_scGPT'] 中
# 使用相同的函数,但指定不同的嵌入矩阵
results_scGPT = shesha_bio.compute_perturbation_metrics(
adata,
perturbation_key='perturbation',
control_label=['control', 'NT', 'non-targeting'],
embedding_key='X_scGPT', # 使用scGPT嵌入
metric='euclidean'
)
 
# 比较PCA和scGPT结果
comparison_df = results_df[['perturbation', 'stability', 'magnitude']].copy()
comparison_df = comparison_df.merge(
results_scGPT[['perturbation', 'stability', 'magnitude']],
on='perturbation',
suffixes=('_pca', '_scGPT')
)
 
# 计算两种嵌入下稳定性得分的相关性
corr_stab = comparison_df[['stability_pca', 'stability_scGPT']].corr(method='spearman').iloc[0,1]
corr_mag = comparison_df[['magnitude_pca', 'magnitude_scGPT']].corr(method='spearman').iloc[0,1]
 
print(f"Stability correlation between PCA and scGPT: ρ = {corr_stab:.3f}")
print(f"Magnitude correlation between PCA and scGPT: ρ = {corr_mag:.3f}")
 
# 可视化
fig, axes = plt.subplots(1, 2, figsize=(12, 5))
axes[0].scatter(comparison_df['stability_pca'], comparison_df['stability_scGPT'], alpha=0.6)
axes[0].plot([0,1], [0,1], 'r--', alpha=0.5)
axes[0].set_xlabel('Stability (PCA)')
axes[0].set_ylabel('Stability (scGPT)')
axes[0].set_title(f'Stability Concordance\nρ = {corr_stab:.3f}')
 
axes[1].scatter(comparison_df['magnitude_pca'], comparison_df['magnitude_scGPT'], alpha=0.6)
axes[1].plot([0, comparison_df['magnitude_pca'].max()],
[0, comparison_df['magnitude_scGPT'].max()], 'r--', alpha=0.5)
axes[1].set_xlabel('Magnitude (PCA)')
axes[1].set_ylabel('Magnitude (scGPT)')
axes[1].set_title(f'Magnitude Concordance\nρ = {corr_mag:.3f}')
plt.tight_layout()
plt.show()

关键发现:在scGPT嵌入中,效应大小与稳定性的强相关性依然存在(Spearman ρ 在0.71到0.94之间),且数据集的排序保持一致。这强有力地证明,几何稳定性是细胞状态空间本身的性质,而非特定降维方法引入的假象。scGPT的相关性略低于PCA,这恰恰符合预期,因为非线性嵌入能揭示被PCA压平的流形复杂结构,可能将一些在PCA中看似一致的轨迹识别为分叉或离群。

4.2 距离度量与维度选择

我们测试了不同的距离度量(欧氏距离、马氏距离、k近邻匹配对照)和不同的PCA维度(10, 20, 30, 50, 100)。结论是:核心关系是稳健的

  • 距离度量:马氏距离(白化处理)和k-NN匹配方法通常能得到同等或更强的相关性,因为它们能减少批次效应和对照组异质性带来的噪声。shesha-geometry 包支持这些选项。
  • PCA维度:稳定性估计随着使用的PC数量增加而趋于稳定。选择50个PC是一个在计算效率和保留信息量之间的良好折衷。只要不使用过少的PC(如<10),结果不会发生本质改变。

4.3 组合扰动的启示

在Norman的CRISPRa数据集中,我们观察到一个有趣的现象:同时扰动两个基因的组合,其几何稳定性显著高于单基因扰动。这并非仅仅因为组合扰动效应更大,因为在控制效应大小后差异依然存在。

这可以用Waddington景观来理解:同时扰动两个协同作用的基因,更可能将细胞推入一个既有的、较深的“吸引子”山谷(如某个分化路径),从而产生协调的响应。而单基因扰动可能只激活了复杂调控程序的一部分,导致细胞陷入不稳定的“山脊”状态。

给你的启示:在设计CRISPR筛选实验,尤其是旨在获得稳定、可重复表型时,考虑靶向基因组合而非单个基因,可能会提高成功率。几何稳定性S_p可以作为一个量化指标,来评估哪些组合能产生最协调的细胞状态转变。

5. 应用场景与避坑指南

几何稳定性不仅仅是一个学术概念,它在多个实际应用场景中具有重要价值。

5.1 应用场景一:优化高通量筛选的Hit优先级排序

传统的CRISPR筛选主要依据效应大小(如基因的log2 fold change或富集分数)来排序候选基因。这可能会优先选择那些产生巨大但混乱表型的多效性因子(如CEBPA),而错过那些效应适中但能产生高度协调、稳定表型的谱系特异性因子(如KLF1)。

新策略:将几何稳定性S_p作为第二排序标准。

  1. 首先,根据效应大小筛选出显著扰动的基因集。
  2. 然后,在这个集合内,按照S_p从高到低排序。
  3. 优先选择那些效应大小足够且稳定性高的扰动。这些基因更可能产生可重复、一致的表型,是更可靠的候选靶点。

5.2 应用场景二:细胞治疗产品的质量监控

在CAR-T或干细胞衍生细胞产品的制造中,当前的质量控制主要基于表面标志物表达、活力和功能测定。这些是“静态”指标。一个产品即使所有标志物都达标,如果其细胞群体在基因表达空间中处于一个几何不稳定的区域(浅盆地或山脊),那么在输注后微环境扰动下,更容易发生命运漂移(如衰竭、去分化)。

新思路:在生产过程的关键节点取样,进行单细胞转录组测序,并计算终产品相对于理想参照状态的几何稳定性S_p

  • S_p:表明细胞群体状态集中、协调,占据一个稳定的吸引子,产品质量和预期稳定性高。
  • S_p:即使标志物达标,也提示产品存在内在异质性和不稳定性,有较高的失效风险,应触发更严格的审查或工艺调整。

5.3 应用场景三:评估计算扰动预测工具

像GEARS、CellOracle、CPA这样的工具可以预测基因扰动后的细胞状态。如何评估这些预测的可靠性?除了比较预测状态与真实状态的相似度,几何稳定性提供了一个新的维度。

评估方法:对工具预测的“扰动后”细胞群体,计算其预测状态的S_p

  • 如果一个预测产生了高效应大小但低稳定性的表型,我们需要高度怀疑:这可能是一个计算上可行但生物学上不稳定的“幻觉中间态”,真实的细胞很难长期维持这种状态。
  • 反之,高稳定性的预测更可能对应一个生物学上合理的、稳定的吸引子状态。

5.4 常见问题与排查技巧

在实际操作中,你可能会遇到以下问题:

Q1: 我的数据中S_p值普遍很低(<0.3),这是否说明实验失败了? A1: 不一定。S_p的绝对值受多种因素影响,包括细胞类型、扰动强度、数据质量和技术噪音。更关键的是扰动之间的相对比较。关注S_p的分布以及哪些扰动显著高于或低于基于效应大小的预期(即高/低失谐度)。如果所有扰动的S_p都极低且接近,可能需要检查数据预处理步骤,或考虑该细胞系统本身是否对扰动响应本身就高度异质。

Q2: 对照组的选择对结果影响大吗? A2: 非常大S_p的计算核心是相对于对照质心的位移。务必确保你的对照组是真正的未处理/非靶向对照,并且有足够的细胞数(建议>1000)以稳健估计质心。如果实验中有多个批次,建议使用批次校正方法或将对照与处理样本在批次上匹配,以避免批次效应扭曲位移向量的计算。

Q3: 对于细胞数很少的扰动(n<20),S_p还可靠吗? A3: 可靠性会下降。样本量小会导致S_p估计的方差很大。我们建议在分析中设置一个细胞数阈值(如n>=50),并将低于此阈值的扰动单独标注或谨慎解释。shesha-geometry包输出的结果中包含bootstrap置信区间,对于细胞数少的扰动,其区间会很宽,这是一个重要的参考。

Q4: 除了HSPA5,还有哪些基因或通路与几何不稳定性相关? A4: 我们的研究发现,内质网未折叠蛋白反应(UPR)通路的相关基因(如ATF4, XBP1)关联性不一致,而整合应激反应标志物DDIT3的关联在很大程度上被效应大小所混淆。这表明应激关联具有高度的标记物特异性和通路依赖性。建议你根据自己的研究系统和感兴趣的生物学过程,探索其他与蛋白稳态、代谢压力、DNA损伤响应相关的基因集。S_p可以作为一个表型,用于进行基因集富集分析(GSEA),来系统性发现与几何不稳定性相关的通路。

Q5: 这个框架能用于非CRISPR的扰动数据吗?比如药物处理或细胞因子刺激? A5: 原则上完全可以。Shesha度量的核心是评估细胞群体响应的一致性,不依赖于扰动类型。只要你有单细胞转录组数据,并且能明确定义扰动组和对照组,就可以计算S_p。这对于评估药物诱导分化的协调性、比较不同细胞因子刺激的特异性等场景同样具有潜力。

几何稳定性这个视角,为我理解单细胞扰动数据打开了一扇新的大门。它让我意识到,在追求“效应”的同时,绝不能忽视“秩序”。一个协调、稳定的细胞群体响应,往往是通往可靠生物学发现和稳健应用转化的更优路径。希望这套方法和思路,也能成为你工具箱里一件有力的新武器。

单细胞CRISPR文库应用全解析这些突破性进展你不可错过!
单细胞CRISPR文库技术结合CRISPR筛选单细胞测序,可在无显著表型条件下解析基因功能,广泛应用于靶点筛选、蛋白复合物功能分析及细胞分化机制研究,实现多基因扰动下转录组的高分辨率分析。
小源在线
793
泛癌+单细胞+预后模型,纯生信思路也能轻取12+
本文介绍了研究人员通过整合单细胞和批量RNA测序数据,发现癌症干细胞特性与免疫检查点抑制剂抵抗性密切相关。他们开发的Stem.Sig标志可以预测免疫疗法效果,同时通过CRISPR筛选数据揭示了潜在的治疗靶点,为提高免疫疗法的疗效提供了新视角
生信风暴
1241
单细胞扰动数据分析新视角:scPerturb如何破解高维数据挑战
本文系统介绍scPerturb工具及其核心方法——能量距离(E-distance),用于量化单细胞扰动效应。该方法在高维、稀疏、异质的单细胞数据中,通过比较细胞表达分布间的整体差异,克服传统均值法局限;支持扰动效应强度评估、多扰动相似性比较、实验质量判别及多模态数据整合;配套E-test提供统计显著性检验,并强调预处理、降维、可视化与交叉验证等关键实践要点。
丞高
247
Nat Comput Sci | 分而治之!基于子任务分解的单细胞扰动人工智能模型 STAMP
单细胞遗传扰动转录结果研究有局限,迫切需要计算方法预测遗传扰动后的转录变化。同济大学介绍人工智能方法STAMP,将扰动预测任务分解为三个子任务。该方法能提升预测能力,适应高维稀疏数据,为研究基因调控机制提供新视角
生信碱移
1888
人鳞状细胞癌成分和空间结构的多峰分析(空间转录组与单细胞文章)
文章探讨了如何利用空间转录组技术解析皮肤鳞状细胞癌(cSCC)的细胞组成和结构,通过结合单细胞RNA测序和多重离子束成像,揭示了肿瘤细胞亚群的特性,尤其是肿瘤特异性角质形成细胞(TSK)的作用。研究还揭示了T细胞和免疫抑制的交互,以及特定基因网络在肿瘤发生中的作用,为cSCC的治疗策略提供了新视角
追风少年ii
1206
【药物靶点筛选】如何根据你的研究基础选择靶点发现思路?
本文系统梳理了药物靶点发现的四大核心路径基于靶点的药物发现(TBDD)、基于表型的药物发现(PDD)、基于疾病模型的药物筛选、以及基于多组学的疾病新靶点挖掘。重点阐述了高通量筛选、化学蛋白质组学、热蛋白质组学(TPP)、CRISPR筛选、类器官模型及AI驱动结构预测(如AlphaFold)等关键技术在各路径中的应用逻辑与实证案例。强调AI、靶向蛋白降解(TPD)、知识图谱与多模态数据整合正加速靶点验证与机制解析,提升成药性评估效率。
谱度众合
414
单细胞论文记录(part3)--Multimodal Analysis of Composition and Spatial Architecture in HumanSquamousCell ...
本文结合单细胞RNA测序、空间转录组学和多重离子束成像技术,研究了人类皮肤鳞状细胞癌(cSCC)的细胞组成和空间结构。发现四个肿瘤亚群,其中角质细胞(TSK)群体在纤维血管龛中定位,可能是细胞间交流的关键。此外,研究揭示了TSK细胞的免疫抑制特性,为理解肿瘤微环境提供了新视角
GUI Research Group
603
Nat. Methods | 全基因组尺度的细胞形态学扰动图谱
2025年发表于Nature Methods的研究,通过大规模基因过表达与CRISPR敲除技术,结合多通道成像,绘制了覆盖1.5万个基因的形态学图谱。研究展示了单细胞形态学在功能基因组学和药物发现中的应用潜力,为揭示基因功能网络和新型生物学关系提供了新视角
生信宝典
235
生物学前沿技术深度解析从基因剪刀到AI造蛋白的革命性突破
本文综述了基因编辑、单细胞测序、AI蛋白质设计等前沿生物技术进展,重点探讨人工智能在蛋白质结构预测与功能设计中的关键作用,并涉及合成生物学、类器官、微流控传感等多个交叉领域,展示了AI与生物技术深度融合带来的医学与产业变革。
终端域名
1222
个性化分析内容更新!原核生物抗病毒系统鉴定
研究人员在深海冷泉沉积物中发现了丰富的病毒及复杂的抗病毒防御系统。DefenseFinder和PADLOC两种软件被用来预测原核生物的抗病毒系统,揭示了冷泉病毒的适应策略,如抗CRISPR蛋白和可变遗传编码。这项研究为理解极端环境病毒进化提供了新视角
SHANGHAILINGEN
1471
泛素连接酶STUB1调控干扰素γ受体稳定性及其在肿瘤免疫中的功能
本研究发现E3泛素连接酶STUB1通过介导IFNGR1和JAK1的泛素化降解,负向调控IFNγ信号通路,影响肿瘤细胞对T细胞杀伤的敏感性及免疫治疗响应,揭示了STUB1-IFNGR1轴在肿瘤免疫中的关键作用,为联合免疫治疗提供新靶点。
优爱蛋白
535
NC | 西湖大学陶亮组-TMPRSS2“助攻”病毒感染并介导索氏梭菌出血毒素的宿主入侵...
西湖实验室陶亮课题组在Nature Communications发表研究,发现跨膜丝氨酸蛋白酶2(TMPRSS2)是索氏梭菌出血毒素TcsH的肠上皮受体,填补了该毒素研究的空白。TcsH是导致组织坏死和严重疾病的病原体,其细胞识别机制一直未知。研究通过CRISPR/Cas9筛选确定了TMPRSS2的重要角色,为理解索氏梭菌的致病机制提供了新视角
刘永鑫Adam
691
Nature Genetics | 本周最新文献速递
本文综述Nature Genetics最新研究利用多祖先脑蛋白组数据结合MESuSiE精细映射,识别858个多祖先因果pQTL,29%为编码变异,通过孟德尔随机化揭示119个pQTL-蛋白对在21种神经精神疾病中的因果作用;同时报道RNA稳定性遗传调控机制,发现超5000个等位基因特异asRS变异,富集于免疫通路并关联多种免疫疾病风险。
橙子牛奶糖
694
Cell水平基因转移在昆虫中广泛存在,增强鳞翅目雄性昆虫求偶行为
本文揭示了昆虫广泛存在的水平基因转移现象,尤其在鳞翅目中发现了一个增强求偶行为的基因。研究通过高通量筛选和基因编辑实验,证实了HGT在昆虫适应性和行为调控中的作用,为昆虫生物学和农业防治提供新视角
SHANGHAILINGEN
842
Nature Genet|缺氧诱导因子HIF复合体招募组蛋白甲基转移酶SET1B激活缺氧诱导基因
文章探讨了HIFs如何通过与染色质修饰酶SET1B的相互作用,在低氧环境中激活特定基因。研究发现,SET1B的缺失会影响HIF靶基因的表达,尤其是在缺氧条件下,其H3K4甲基化对HIF反应至关重要。这揭示了HIF在缺氧环境中的精细调控机制,为进一步理解细胞对低氧适应性和肿瘤生长提供了新视角
爱基百客
1311
热门 | 细胞死亡家族再添新成员——铜死亡
研究发现,铜离子过量可引发一种新的细胞死亡方式——铜死亡(Cuproptosis),通过破坏线粒体代谢和蛋白质硫辛酰化,导致细胞毒性应激反应。铜死亡与凋亡、铁死亡等传统途径不同,为理解铜稳态失调和疾病治疗提供了新视角
爱博泰克生命科学
1791
Nature Communications|新生转录本(RNA)捕获技术助力发现LEMD3在染色质三维结构中的新功能
本研究发现内核膜蛋白LEMD3通过与CBX3互作,将异染色质锚定于核周,维持血管平滑肌细胞的三维染色质结构和收缩表型。结合Hi-C与新生RNA捕获技术,证实LEMD3缺失导致TAD间异常互作、染色质可及性下降及关键基因转录抑制,揭示了从染色质空间结构到细胞功能调控的新通路。
启衡星
1066
项目文章 | CUT&Tag助力解析鲸类四肢退化的分子机制
南京师范大学研究团队借助爱基百客的CUT&Tag技术,从不同角度揭示鲸类四肢形态变化的分子机制。研究发现Tbx4 - HLEA增强子功能衰减或致后肢退化,还鉴定出与肢体变化相关的特异性CNEs。CUT&Tag是研究蛋白和DNA互作的新兴方法,有诸多优势。
爱基百客
932
三组学联合→HiC+Meta+Virome
本文通过在银川平原地下水样本中运用宏基因组、宏病毒组测序和Hi-C技术,揭示了低营养地下水环境中病毒群落的多样性和与宿主的互动,以及病毒携带的辅助代谢基因。研究发现地下水病毒具有独特的生态功能和栖息地特异性,为进一步理解全球病毒多样性提供了新视角
SHANGHAILINGEN
361
基因之河,表型之舟 | 论基因和表型的关系
本文探讨了基因与表型之间的复杂关系,阐述了基因如何通过与环境的相互作用影响生物体的多样性。文章通过自然选择理论、基因编辑技术、表型组学等角度,揭示了基因与表型相互依存、共同演化的生命现象,并强调了随机因素和动态变化在这一过程中的重要性。
生信分析笔记
1338
行业-电子政务-生物芯片电穿孔仪及其在全方位单细胞电穿孔中应用.zip
在癌症研究、遗传疾病分析以及药物筛选等领域,全方位单细胞电穿孔技术已经成为不可或缺的工具。电穿孔仪的设计通常包括两个关键部分电场发生器和细胞处理装置。
programcx
9
【表观遗传学和基因组编辑】CRISPR-Cas9原理基因组编辑技术的突破
刘兮
行业分类-设备装置-多糖粘液形成菌的靶基因缺失.zip
可能涉及的内容包括1. 靶基因的筛选和鉴定如何确定参与粘液形成的候选基因,可能基于基因表达谱、基因功能注释或已有的文献研究。2.
programcx
12
扩散模型在单细胞领域的5个妙用除了数据生成,scDiffusion还能做什么?
昝雄风
单细胞多组学分析【挑战与机遇并存】,如何抓住机遇?
SW_孙维
植物抗病新视角:m6A修饰如何帮助作物抵抗病原体入侵?
五个橘核
神经科学的新视角:基因工程技术在研究中的关键作用
SW_孙维
浙江专用版2019高考语文二轮复习优编增分练第一部分瞄准题点精准训练专题二精准训练六提高非连续性实用文本概括题的概括精度
综上所述,高考语文非连续性实用文本阅读要求学生具备较高的信息筛选、整合和概括能力,同时,科学研究的进步也为理解和应对蚊子叮咬提供了新视角
超级源码阿
【神经系统研究新视角膜片钳技术在疾病研究中的关键作用
SW_孙维
表观遗传学新视角:启动子甲基化分析的关键作用
SW_孙维