📄 Nature Microbiology · 2026 · Open Access

人工菌群理性设计:上位效应如何指导 BPA 土壤生物修复

Yousef 等(Seppe Kuehn 团队,University of Chicago)用 16 株土壤分离株组装 70 个合成菌群,横跨 60–150 ppm BPA 浓度梯度,把「群落–功能景观」+ 二阶岭回归 + SoftImpute 补矩阵,做成了首个可外推到真实污染土壤修复的合成生态模型。
合成菌群 SynCom上位效应 Epistasis群落–功能景观BPA 双酚 A土壤生物修复机器学习 · 岭回归 · SoftImpute
一句话结论:污染毒性越高,菌群功能就越不是"各菌加总",而是"互作接管"——加性系数集体退位,成对上位系数扩散;一株自身无法降解 150 ppm BPA 的伴生菌 NL109 反而成为高毒环境的关键单元。用推断出的景观计算机设计菌群,可在真实污染土壤中显著提升 BPA 降解。

1 · 文献身份 & 证据来源

题目
Epistatic interactions inform rational design of synthetic microbial communities for bioremediation
中文
上位效应指导合成菌群理性设计以用于生物修复
作者
Mahmoud Yousef, Kiseok Keith Lee, Junivere Tang, Paige Mullen, Vasileios Charisopoulos, Rebecca Willett, Seppe Kuehn(通讯,seppe.kuehn@gmail.com)
单位
The University of Chicago(Ecology & Evolution / Center for Physics of Evolving Systems / Center for Living Systems / Data Science Institute / Pritzker School of Medicine);National Institute for Theory and Mathematics in Biology
期刊 / 卷期
Nature Microbiology · Volume 11 · pages 1995–2007 · July 2026
收发日期
Received 31 March 2025 · Accepted 12 May 2026 · Published online 29 June 2026
DOI
获取方式
Open Access(CC BY 4.0)· nature.com 文章页 · PDF
证据边界
本解读基于论文 PDF 全文(Nature Microbiology 官网原文,25 页)逐节精读整理;正文所有数值与结论均可回溯到论文 Fig. 1–5 与 Methods / Discussion。原文 Figure 1–5 图像块由 PDF 内页面渲染后按 caption 位置裁剪得到,与相应 caption 一一对应。

2 · 目录

3 · 背景:污染毒性下的菌群修复难题

双酚 A(Bisphenol A,BPA)是塑料、环氧树脂中广泛使用的内分泌干扰物,普通环境背景值通常 < 1 ppm,但受污染场地实测浓度可达 10–200 ppm。这些高浓度不仅超过一般单菌的耐受极限,中间代谢产物本身仍有毒性,往往需要多菌协同才能完成矿化。

合成菌群(SynCom)为什么难 " 理性设计 "?作者概括了三个障碍:
① 菌株之间同时存在加性效应(每株的平均贡献)与上位互作(成对及更高阶偏离加性的部分),单纯挑"最强菌"并不最优;
② 缺乏对"污染毒性如何改写菌群协作"的可预测数学模型;
③ 以往景观类研究多集中在低毒或稳态环境,难以外推到真实污染场景。

作者的解决思路是把遗传学里的适应度景观(fitness landscape)类比迁移到菌群:把物种在/不在当作变量,用统计模型把"群落组成 → 群落功能"这张映射(community–function landscape)显式估计出来,同时拆出加性项 βi 与二阶上位项 γi,j;再让景观本身随环境(这里是 BPA 浓度)变化,看毒性如何改写景观结构。

4 · 核心问题与研究策略

核心科学问题

随着毒性升高,菌群互作会如何演化?能否用少量随机组合数据推断"群落–功能景观",并直接指导土壤生物修复

策略四步走

  1. 从 5 处疑似 BPA 污染土壤连续富集,分离 16 株 Proteobacteria(10 株可单独降解 30 ppm,6 株伴生)。
  2. 随机组装 70 个合成菌群,同时在 60/80/100/125/150 ppm 五档初始 BPA 浓度下测降解动力学,用 AUC 量化功能。
  3. 拟合二阶岭回归 + SoftImpute 补矩阵,得到每档浓度的景观 βi / γi,j
  4. 用景观计算机设计 10 个未测过的新菌群,在液体培养复测,并进入两种真实污染土壤做 in situ 修复。

5 · Fig. 1|16 株分离株构建 70 个合成菌群

Fig. 1 · 分离株可用于构建跨初始浓度降解 BPA 的合成细菌菌群
Figure 1: enrichment protocol, phylogenetic tree of 16 isolates, monoculture degradation at 60 and 150 ppm, community degradation curves at five BPA concentrations
图示信息:Panel a 为土壤富集–划板纯化–BPA 降解筛选流程;Panel b 是 16 株分离株基于 16S 的系统发生树,红色标注 10 株可单独降解 30 ppm BPA 的降解菌;Panel c 上下两栏分别为 10 株降解菌在 60 ppm(上)与 150 ppm(下)单菌培养的 BPA 时间曲线;Panel d 是 70 个合成菌群在 60/80/100/125/150 ppm 下的降解曲线,Mix8/Mix19/Mix20/Mix41/Mix70 各以蓝/黄/绿/红/紫标出。
论文结果 / 观点:① 4/16 株经全基因组测序检出杂菌但不影响后续景观建模——文中把每个分离株当作"整体单元"处理;② 60 ppm 下 10 株降解菌各自都能完成 BPA 降解,但升到 150 ppm 后全部单菌失去降解能力;③ 群落规模并非决定因素——含全部 16 株的 Mix20 在任一浓度都不是最快;由 6 株非降解菌组成的 Mix19 反而能在 60 ppm 下降解 BPA;④ 只有 60 与 150 ppm 两档中"丰富度 vs. 降解"存在显著相关(Extended Data Fig. 4a)。
研究意义 / 边界:这张图直接给出了"高毒环境下降解必须靠群体"的实证基础。但注意:所有单菌与群落均在 M9 最小培养基 + BPA 为唯一碳源体系中测得,尚未考虑真实土壤中的其他碳源、pH 波动、原生菌竞争等因素。
图源:Yousef et al. 2026, Nature Microbiology, Fig. 1,Open Access · CC BY 4.0;本报告图像从原文 PDF 第 2 页按 caption 位置裁剪并压缩为 JPEG。

6 · Fig. 2|跨浓度 AUC 的低维结构 & SoftImpute

Fig. 2 · BPA 降解在不同初始浓度间以低维方式变化
Figure 2: AUC definition; pairwise AUC comparisons across concentrations; PCA showing first two components explain 79% variance; SoftImpute schematic and predictions
图示信息:Panel a 定义群落功能用 BPA 时间序列 AUC 衡量——AUC 越小说明降解越快越彻底;Panel b 把 60 ppm 与其他 4 档浓度的 AUC 两两配对散点,误差棒为 2 次技术重复标准差,虚线为等 AUC 参考;Panel c 是所有群落在 5 档浓度下 AUC 的 PCA,前两个主成分解释 79% 方差;Panel d 左:SoftImpute 示意图(群落×浓度矩阵,抠掉一格用 SVD 补回 ˜Z−c,k = UDV);右:所有格子的 log10(AUC) 预测 vs. 实测,R² = 0.89。
论文结果 / 观点:① 没有一个群落"随浓度升高反而更快"(Fig. 2b 无点落在虚线下方),即低毒表现是高毒表现的必要非充分条件;② 60 vs. 高浓度出现"两个方向"的变异——一组是低浓度快、高浓度弥散,一组是高浓度差、低浓度散;③ 变异结构极其低维,前两个主成分解释 79% 方差,也就是说 70 个菌群其实处在一个非常薄的功能空间上;④ SoftImpute(矩阵秩 2)在全部数据 R²=0.89、留出 10% 群落时仍匹配良好(Extended Data Fig. 4c)。
研究意义 / 边界:低维结构 + SoftImpute 意味着不用测遍所有可能的 65 000 多个组合——少量随机抽样 + 补矩阵就能预测群落功能。但 SoftImpute 只是"跨浓度插值",还没告诉你"哪些菌株的哪种组合"决定了这块景观,这交给下一步的二阶回归。
图源:Yousef et al. 2026, Fig. 2,Open Access · CC BY 4.0;本报告图像来自 PDF 第 3 页页面渲染并按 caption 裁剪。

7 · Fig. 3|群落–功能景观模型指导菌群设计

Fig. 3 · 推断群落–功能景观并据此计算机设计菌群
Figure 3: leave-one-out predictions vs measurements at 5 BPA concentrations; validation of 10 designed communities at 100 ppm; visualization of five community-function landscapes
图示信息:Panel a 是对每个 BPA 浓度独立拟合的二阶模型 f(x) = Σ βixi + Σ γi,jxixj 的留一交叉验证结果:每一格散点是 70 个群落的实测 log10(AUC) vs. 用其余 69 组训练模型给出的预测,虚线为完美预测;Panel b 是用 100 ppm 训练好的景观计算机新设计 10 个从未测过的菌群,在实验中真实测得 log10(AUC) vs. 模型预测,Pearson ρ = 0.53, P < 0.001(1000 次 bootstrap 单侧检验);Panel c 把 5 档浓度的景观分别可视化:x-y 平面是群落组成 PCA 投影,z 轴是 −log10(AUC)。
论文结果 / 观点:① 二阶(加性 + 成对)模型足够,加入三阶项并未改善拟合(Supplementary Fig. 1c);② 拟合难度随浓度上升——高浓度点更分散,是因为 70 个群落只覆盖了 ~65 000 种可能组合中极小的一部分;③ 尽管如此,用低浓度学出的景观外推设计出的新菌群在 100 ppm 独立实验中显著与预测相关(P < 0.001);④ 景观可视化显示:低 BPA 浓度下景观平滑(低崎岖度),高浓度下景观粗糙、局部极值增多——正是"上位效应变强"的直接图像。
研究意义 / 边界:这是全文最重要的方法验证——"少量随机抽样 + 二阶岭回归 → 计算机设计新组合"这条路在实验室内已闭环。但 Panel c 的 3D 景观图作者明确说明"不宜做定量解读,因为平滑参数会影响细节;定性上的浓度依赖崎岖度增强是稳健的"。
图源:Yousef et al. 2026, Fig. 3,Open Access · CC BY 4.0;本报告图像来自 PDF 第 5 页页面渲染并按 caption 裁剪。

8 · Fig. 4|毒性升高,上位效应接管加性效应

Fig. 4 · 毒性越高,上位互作越强(全文核心机制发现)
Figure 4: additive coefficients beta_i shifting toward zero as BPA rises; degrader-degrader epistasis; non-degrader-non-degrader epistasis; F1 index of relative importance of epistasis vs additive terms
图示信息:Panel a 是 5 档浓度下加性系数 βi 的分布(水平线为均值),随浓度升高整体上移趋近 0;Panel b 上/下分别为"降解菌–降解菌"γi,j(红)和"非降解菌–非降解菌"γi,j(蓝)在各浓度的分布;Panel c 直接对比 60 ppm 与 150 ppm 下全部 γi,j 分布,150 ppm 明显更分散(P < 0.001);Panel d 用指数 F1 = Σβi² / (Σβi² + Σγi,j²) 量化"加性 vs. 上位"的相对比重,含/不含 NL109 两条曲线对比。
论文结果 / 观点:
  1. 加性效应集体退位:60 ppm 下大量 βi 为显著负值(自身能加速降解),到 > 100 ppm 后普遍趋近 0(甚至变正),说明"单菌平均贡献"越来越不足以解释群落功能。作者在 60 ppm 单菌实验中验证了这一点(Extended Data Fig. 6b)。
  2. NL109 是高毒环境的关键单元:150 ppm 下仅剩一个大幅负 β 系数,指向NL109——这株菌单培养下 无法 降解 150 ppm BPA(Fig. 1c),但只要出现在群落里,就显著提升整体降解,作者称其为高浓度菌群的"核心功能菌"。
  3. 降解菌–降解菌互作:60 ppm 下 γi,j 显著为正(P = 1.04×10⁻¹⁰),即彼此竞争、拖慢总体降解;浓度升高后均值回到 0 附近,但分布更宽——竞争淡化,强协同 / 强拮抗都出现。
  4. 非降解菌–非降解菌互作:80–125 ppm 均值显著为负(协同促进降解,P 值分别 0.00190、1.08×10⁻⁶、0.00395),到 60、150 ppm 又回到 0,说明它们在中等毒性带作为"辅助者"贡献最大。
  5. F1 指数:随浓度升高,加性项占比下降、上位项占比升高,把 NL109 从模型里扣掉后这个趋势更陡——直接量化了"毒性驱动上位效应接管"。
研究意义 / 边界:这是本文最强的因果证据——用同一批菌、同一套装配方式,仅改变 BPA 浓度,就看到景观从加性主导转为互作主导。它把"合成菌群设计原则"从"选强菌拼积木"改写为"低毒时挑降解主力,高毒时必须一并考虑伴生菌的协同上位项"。但需注意:所有上位效应都是统计意义上的成对交互项,并非直接的代谢机制证据——具体是氧化中间产物解毒、共代谢、群体感应还是别的机制,本文并未展开。
图源:Yousef et al. 2026, Fig. 4,Open Access · CC BY 4.0;本报告图像来自 PDF 第 6 页页面渲染并按 caption 裁剪。

9 · Fig. 5|设计菌群在真实污染土壤中修复 BPA

Fig. 5 · 面向土壤环境的 BPA 修复菌群设计
Figure 5: soil slurry protocol; BPA degradation curves in Soil 6 and Soil 7 at 100 and 125 ppm with 10 designed communities; scatter of AUC in soil vs in vitro
图示信息:Panel a 是"BPA 污染水 + 土壤 → 泥浆 → 接种设计菌群 → 采样测 BPA"的实验流程示意;Panel b 是 10 个模型设计出的合成菌群在两种土壤(Soil 6、Soil 7)、两档 BPA(100 与 125 ppm)下的降解曲线,黑虚线表示"不接种、仅靠土著微生物"的对照;Panel c 是每个菌群在土壤 vs. 液体培养中 AUC 的相关散点,虚线为对角线,Pearson ρ 分别标注。
论文结果 / 观点:① 在 Soil 1(100 ppm)与 Soil 2(125 ppm)中土著微生物无法自行降解 BPA,接种明显加速;② 不同设计菌群在同一土壤中的降解表现差异明显——说明组成本身在真实土壤里仍然重要,即使有复杂原生菌群存在;③ 由于 BPA 从土壤中的提取效率有限(Extended Data Fig. 8),作者不期望土壤 vs. 液体 AUC 出现 1:1 严格对应,但两种土壤两档浓度下均出现正相关:100 ppm Soil 6 ρ=0.64(P=0.034)、Soil 7 ρ=0.42(P=0.067,未达显著);125 ppm Soil 6 ρ=0.64(P<0.001)、Soil 7 ρ=0.42(P=0.024);④ 这与"生态位专门化理论"一致——BPA 降解能力在常见土壤菌群中稀有,所以设计菌群更容易"嵌入" 生态位空缺。
研究意义 / 边界:这一步把"实验室景观"和"真实土壤修复"实证地连了起来,是本文能上 Nature Microbiology 而非纯方法学期刊的关键。但边界仍然清晰:① 只测了两种土壤、两个浓度、10 个菌群;② 未涉及长期稳定性、原生菌种间竞争、多污染共存、pH / 湿度 / 有机质异质性等真实场地变量;③ 依赖菌株可培养 + 基因组测序验证,对不可培养菌群构成的"暗物质"部分仍无法处理。
图源:Yousef et al. 2026, Fig. 5,Open Access · CC BY 4.0;本报告图像来自 PDF 第 7 页页面渲染并按 caption 裁剪。

10 · 方法要点(Methods)

样品与富集

  • 5 处疑似 BPA 污染场地采集表层土 ~2 kg,4 ℃ 保存约 1 个月。
  • 30 ppm BPA · M9 最小培养基 + 环己酰亚胺(400 μg/mL)+ 制霉菌素(40 μg/mL)抑制真菌。
  • 250 mL 锥形瓶 3 g 土 + 60 mL BPA 培养基,30 ℃、220 rpm 好氧。
  • 每次降解至 < 50% 起始浓度时按 1:16→1:32→1:64 阶梯稀释,共 3 轮,选出真正的降解 / 共存菌。

分离株鉴定

  • 富集液系列稀释后 R2A 平板划线纯化,甘油冻存 −80 ℃。
  • Plasmidsaurus + Oxford Nanopore 全基因组测序,16S 段用 NCBI BLAST 归属,EMBL-EBI Muscle 建树,iTOL 可视化。
  • 10 株可单独降解 30 ppm BPA(降解菌),6 株不能但与降解菌共存(非降解伴生菌)。

群落装配与 BPA 测定

  • 70 个菌群随机组装,丰富度 6 ± 3(sd),含"16 株全菌""10 降解菌""6 非降解菌"3 个基准组。
  • 每株固定初始 OD 0.02,不固定总生物量——避免高丰富度稀释各菌浓度,从而不混淆 βi 估计。
  • BPA 显色法(4-AAP + 铁氰化钾,pH 碱性,506 nm 吸光度,每板独立标准曲线),可高通量在 96 孔板测。
  • 72 h 采样若干时间点,得 BPA 浓度时间曲线,AUC 表征群落功能。

模型:二阶岭回归 + SoftImpute

  • 模型形式 f(x)=Σβixi+Σγi,jxixj,xi∈(0, 1)表示菌株存在。
  • 超参数(岭回归 λ)用交叉验证选,留一(leave-one-out)验证预测能力。
  • 三阶项经检验不改善拟合,故只保留二阶。
  • SoftImpute(矩阵秩 2)用于跨浓度补矩阵,避开逐格测遍所有组合。
  • 作者另开发了"跨浓度联合景观"的正则化优化过程,用低维假设一次拟合所有浓度(Supplementary Fig. 4)。

土壤修复实验

  • 两种土壤 + 2 档 BPA(100 / 125 ppm)配成泥浆,接种模型设计的 10 个菌群。
  • 未接种泥浆作原生菌群对照。
  • 时间序列采样测 BPA,注意 BPA 从土壤中的萃取效率有限,土壤 / 液体 AUC 不做 1:1 比较。

CO₂ 产生与好氧代谢

  • Microresp 系统(pH 敏感染料 + 琼脂糖凝胶封板)读 96 深孔板中 3 天 CO₂ 呼吸,验证 10 株降解菌通过好氧呼吸代谢 BPA。

11 · 对合成生态学与生物修复的意义

方法学层面
  • 把"景观 + 上位"从遗传学正式引入合成菌群工程,并首次证明环境毒性梯度可作为改写景观结构的外部旋钮。
  • 用极稀疏抽样(70/~65 000)+ 二阶岭回归 + SoftImpute 就能训练出可外推的功能模型,大幅降低"穷举组合"的实验成本。
  • 建立了"液体培养景观 → 真实土壤修复"的可迁移证据链——即使 in vitro / in soil AUC 不是 1:1,仍能保留正相关,具备指导意义。
生态学层面
  • 提供了明确的"非降解菌不是旁观者"证据——在中等毒性带,它们的成对上位项显著为负,是维系群落功能的关键。
  • NL109 的"单菌无功能、群落有功能"现象是协作 emergent 功能的强证据,可能来自解毒中间产物、氧化还原缓冲、群体感应、公共物品供给等机制。
  • "高毒 → 上位增强"这一现象暗示:环境压力大的场景下,冗余度和交互多样性可能才是选择目标,而不是"最强代谢者"数量。
工程/落地层面:面向 BPA 污染场地、塑料废弃物堆放区、内分泌干扰物废水处理等场景,可优先按浓度分档挑设计策略——低浓度(<80 ppm)以降解菌为核心;高浓度(≥125 ppm)必须把伴生菌视作核心资源,并把设计目标放在最大化上位互作项而非最大化单菌降解速率。

12 · 局限、适用与不适用边界

作者自陈的局限
  • 70 个群落 vs. 潜在 ~65 000 组合,高浓度区上位项主导,稀疏采样导致模型难以拟合极端情形。
  • 3D 景观图对平滑参数敏感——只能定性看崎岖度趋势,不宜做定量比较。
  • 合成菌群面对真实土壤仍是简化:真实微生物组高度多样、可能竞争资源或干扰代谢通路。
  • abiotic 异质性(pH、湿度、营养、有机质)显著影响接种嵌入与功能表达,本工作未系统覆盖。
  • 污染场地常多种污染物共存(如 PAH + 重金属),会通过化学 / 代谢通路相互干扰,需专门实验和建模覆盖。
不适用 / 需谨慎迁移的场景
  • 不可培养菌群主导的极端环境(深海、极地、厌氧填埋深层),本方法目前依赖可培养 + 基因组鉴定
  • 需要长期稳定性的场地治理(数月—数年),本文最长实验时间在 72 h 数量级。
  • 面向 < 1 ppm 的环境背景值场景——本文全部数据集中在 60–150 ppm 的"污染源附近"高浓度区间,低浓度情形(如饮用水源二级处理后回用)需另行建景观。
  • 直接借用 β / γ 系数迁移到别的污染物(PFAS、PAH、卤代烃、重金属)——同一套建模框架成立,但每种污染物需要重新做富集–装配–拟合的完整流程。

13 · 数据 / 代码 / 经费声明

开放获取
© 2026 The Authors. Springer Nature Limited. Open Access(CC BY 4.0)
数据可用性
论文正文与 Supplementary Information 中提供实验记录与建模数据;具体索取路径以官网附件为准。
代码可用性
二阶岭回归、SoftImpute 与景观可视化脚本以论文补充材料 / 作者存档形式提供。
经费
论文致谢部分明确列出资助信息(芝加哥大学系列中心及 NITMB 等,具体号项以原文 Acknowledgements 为准)。
利益冲突
原文声明作者无利益冲突。
来源链接
建议引用
Yousef, M., Lee, K. K., Tang, J., Mullen, P., Charisopoulos, V., Willett, R., & Kuehn, S. (2026). Epistatic interactions inform rational design of synthetic microbial communities for bioremediation. Nature Microbiology, 11, 1995–2007. https://doi.org/10.1038/s41564-026-02386-4