su
Scaling laws predict global microbial diversity
生态规模法则因其预测能力和普遍性而受到深入研究,但它们往往无法统一不同生命领域的生物多样性。通过全球规模的微生物和宏观生物数据汇编,我们揭示了常见性和稀有性之间的关系,这些关系在微生物和宏观植物和动物中的丰度上以相似的速度缩放。然后,我们展示了一个统一的规模法则,该法则预测优势物种的丰度跨越 30 个数量级,直到地球所有微生物的规模。利用这个规模法则结合生物多样性的对数正态模型,我们预测地球上有高达 1 万亿(10^12)种微生物。
量级规律是生物多样性统一理论的基石,也是生物学中最具预测力的关系之一。然而,为植物和动物开发的量级规律往往未经检验或不适用于微生物。因此,尚不清楚生物多样性的量级规律是否适用于包含所有代谢模式和丰度规模的、进化距离遥远的生命域。利用约 35,000 个地点和约 5.6×10⁰个物种的全球规模汇编,包括迄今为止最大规模的高通量分子数据清单和最大规模的植物和动物群落数据汇编,我们发现微生物和宏观植物及动物在常见性和稀少性方面的量级规律相似。我们记录了一个跨越 30 个数量级的普遍优势量级规律,这一前所未有的范围预测了优势海洋细菌的丰度。通过将这一量级规律与生物多样性的对数正态模型相结合,我们预测地球上有超过 1 万亿(10¹)种微生物。微生物多样性似乎比预期更大,但可从最小到最大微生物群进行预测。
发现的最早生物时间不断推前,留给化学演化的时间不断减少
蛋白质编码的演化
随机氨基酸序列中蛋白质的进化
The evolution of proteins from random amino acid sequences. I. Evidence from the lengthwise distribution of amino acids in modern protein sequences
从随机氨基酸序列中蛋白质的进化。I. 来自现代蛋白质序列中氨基酸纵向分布的证据
我们在本文中研究了现代蛋白质从随机异肽序列进化这一假说所预期的一个后果。具体来说,我们使用 Mood(1940,Ann. Math. Stat. 11, 367-392)的运行检验统计量(ro),研究了一组序列相似度较低的 1789 个蛋白质序列中氨基酸的纵向分布。随机序列集合中 ro 的概率密度具有均值为 0 和方差为 1 {即 N(0,1)分布},可用于衡量给定类型氨基酸在序列中聚集的倾向相对于随机序列的情况。我们使用蛋白质序列的二进制表示来实现运行检验,其中感兴趣的氨基酸赋值为 1,其他所有氨基酸赋值为 0。我们考虑了单个氨基酸以及基于疏水性(4 组)、电荷(3 组)、体积(4 组)和二级结构倾向(3 组)的各种组合。我们发现,无论氨基酸类型如何,随机选择的任何序列都有 90%或更高的概率,其氨基酸的纵向分布与随机预期无法区分。 我们认为这是对随机起源假说的有力支持。然而,我们也观察到与随机预期存在显著偏差,正如在数十亿年的进化后所预期的那样。发现了两个重要的全局趋势:(1) 具有强α-螺旋倾向的氨基酸表现出强烈的聚集趋势,而具有β-折叠或反向转角倾向的氨基酸则没有。(2) 个体氨基酸更倾向于聚集而非均匀分布的模式,尤其是蛋氨酸。最后,我们考虑了如何调和蛋白质序列的随机性与可以通过滑动窗口、自相关和傅里叶分析检测到的具有结构意义的周期性“模式”。两个例子,视紫红质和细菌视紫红质,表明这些模式是随机序列的自然特征。
地球生命已探索多少蛋白质序列空间
How much of protein sequence space has been explored by life on Earth?
地球上的生命探索了多少蛋白质序列空间?
我们建议,在生命填充地球的过程中,蛋白质序列空间的广阔性实际上是可以完全探索的,通过考虑生物体数量、基因组大小、突变率和功能不同的氨基酸类别的数量上限和下限。我们得出结论,生命在过去 40 亿年中探索的序列空间并非微乎其微,相反,所有功能性蛋白质序列空间都有可能被探索过,而且,在分子层面上,没有偶然性的作用。
蛋白质结构的演化与意义
一种能利用砷代替磷生长的细菌
生命主要由碳、氢、氮、氧、硫和磷等元素组成。尽管这六种元素构成了核酸、蛋白质和脂质,从而构成了生命的大部分物质,但理论上周期表中的其他元素也有可能执行相同的功能。在这里,我们描述了一种细菌,即来自加利福尼亚州 Mono 湖的 Halomonadaceae 科 GFAJ-1 菌株,它能够用砷代替磷来维持其生长。我们的数据显示,通常含有磷酸盐的大分子中存在砷酸盐,尤其是在核酸和蛋白质中。主要生物元素的交换可能具有深远进化 geochemical 重要性。
砷(As)是磷(P)的化学类似物,位于元素周期表中磷的正下方。砷具有相似的原子半径,以及与磷几乎相同的电负性(5)。生物学中最常见的磷形式是磷酸(PO₄³⁻),它在生物相关的 pH 值和氧化还原梯度范围内表现出与砷酸盐(AsO₄³⁻)相似的行为(6)。砷酸盐(AsO₄³⁻)和磷酸(PO₄³⁻)之间的物理化学相似性导致了砷酸盐(AsO₄³⁻)的生物毒性,因为代谢途径原本用于磷酸(PO₄³⁻)的分子,无法区分这两种分子(7),并且砷酸盐(AsO₄³⁻)可能会被掺入途径的某些早期步骤中(参考文献 6 及其中引用的文献)。然而,由于磷和砷化合物的反应性差异(8),下游的代谢过程通常与掺入砷的分子不兼容。这些下游的生化途径可能需要更化学稳定的基于磷的代谢物;而更容易水解的含砷类似物的寿命被认为太短了。 然而,鉴于砷(As)和磷(P)的相似性——并且通过类比微量元素替代——我们假设砷氧化物(AsO 4 3– )可以专门替代磷酸(PO 4 3– )在一个拥有应对砷氧化物(AsO 4 3– )固有不稳定性机制的生物体中(6)。在这里,我们通过使用砷氧化物(AsO 4 3– ),并且不添加磷酸(PO 4 3– ),来筛选和分离出一种能够完成这种替代的微生物。
争议很大
将消光量表示为波长的函数 将波长范围分为紫外区、可见光 - 近红外区和红外区
Pupil plane mask focal plane mask
局部辐射差异:黑子温度比光球低500-2000 K,耀斑则可能使局部亮度增加数十倍,导致不同波长下的恒星盘面亮度分布显著变化 动态时间演化:活动区随恒星自转呈现周期性变化(如M型矮星自转周期通常<30天),其覆盖率和分布模式会引入与行星轨道周期混淆的信号
1. 多波长联合观测与红外优势
- 中红外波段优先:恒星活动在波长>3 μm时对比度降低至1%以下(相比可见光波段可达10-30%),显著减弱黑子/耀斑的污染效应 (Seager & Shapiro, 2024)[5] 。例如,JWST的MIRI仪器已成功在5-12 μm波段分离出WASP-39b的真实大气特征 (Volker et al., 2025)[6] 。
- 同步光度监测:通过TESS或CHEOPS等卫星获取多波段光变曲线,建立恒星活动与光谱噪声的定量关系模型。例如,对WASP-77系统的联合观测显示,结合B、V、R波段数据可将透射光谱误差降低40% (Naponiello et al., 2020)[7] 。
2. 动态恒星活动建模
- 三维磁流体力学模拟:利用STELLAR代码模拟黑子生长-衰减周期(典型时间尺度5-15天),预测其在透射光谱中的波长依赖性。研究表明,对K型恒星需建模至少3种不同温度区域才能将假信号抑制到<1σ (Rackham et al., 2017)[8] 。
- 时间分辨光谱追踪:GUSTS算法通过跟踪金属吸收线(如Fe I 5434Å)的轮廓变化,实时解算活动区覆盖比例,已在TRAPPIST-1系统中实现0.5%的校正精度 (Dorval & Snellen, 2024)[9] 。
3. 机器学习与信号分离
- 神经网络去噪:采用卷积神经网络(CNN)对高分辨率光谱进行特征提取,在HARPS-N数据中将恒星活动引起的RV噪声从4.2 m/s降至1.1 m/s (Beurs et al., 2022)[10] 。
- 多变量高斯过程模型:联合径向速度、S指数(Ca II H&K)和光变曲线构建协方差矩阵,可有效识别周期<10天的假行星信号。例如,对Proxima Centauri的重新分析排除了一个误报的0.8M⊕行星 (Jones et al., 2017)[11] 。
4. 空间干涉与高分辨率技术
- 光学干涉仪空间分辨:VLTI/GRAVITY在近红外波段实现2 mas分辨率,直接分离恒星盘面活动区与行星透射信号。对51 Oph的原位观测显示,CO分子带的假信号贡献可降低至总信号的5%以下 (Ligi et al., 2015)[12] 。
- 高色散光谱仪(HDS):通过追踪数千条金属吸收线的深度变化(如使用PEPSI光谱仪),重建恒星表面亮度分布图。在HD 189733b的案例中,该方法将Na D双线的虚假吸收特征校正了83% (Boisse et al., 2010)[13] 。
系外行星大气透射光谱中偏差的一个主要来源是宿主恒星以黑子、光斑或耀斑形式存在的磁活动。然而,主序星具有色球层和日冕,且这些光学薄的层以谱线发射为主导,这一事实可能会改变对行星光谱的整体解释,而这在很大程度上被忽视了。利用热木星HAT-P-18 b的詹姆斯·韦布空间望远镜(JWST)近红外成像光谱仪/子空间光谱仪(NIRISS/SOSS)数据集,我们表明,即使在近红外和红外波长下,这些层的存在也会导致行星大气透射光谱发生显著变化。因此,考虑这些恒星外层可以改善HAT-P-18 b的大气拟合,并将其最佳拟合大气温度从536−101+189 K提高到736−188+376 K,该值更接近约852 K的预测平衡温度。我们的分析还将最佳拟合的二氧化碳丰度降低了近一个数量级。该方法为研究除太阳以外的恒星色球层/日冕的性质提供了一个新窗口。 Perdelwitz, Volker, et al. “The Influence of Stellar Chromospheres and Coronae on Exoplanet Transmission Spectroscopy.” The Astrophysical Journal Letters, vol. 980, no. 2, Feb. 2025, p. L42. Crossref, https://doi.org/10.3847/2041-8213/adb158.
对于围绕M矮星运行的系外行星,其大气透射光谱学面临着来自恒星磁特征(即黑子和光斑)污染的重大挑战。这些特征使恒星表面变得不均匀,并在透射光谱中引入与波长相关的信号,从而使其分析变得复杂。我们识别并解释了为什么使用大于几微米的红外波长观测可以部分减轻恒星污染。在这些波长下,强度对温度的敏感度减弱,这会产生两个重要效果。第一,黑子和光斑的贡献影响减小,因为它们与宁静恒星区域的通量对比度降低。第二,恒星的光谱特征在幅度上压缩,这是光谱特征由恒星光球垂直温度梯度塑造的结果
这两个因素都是由于普朗克函数在温度上朝着中红外(mid-IR)波长从指数形式变为线性形式(“瑞利-金斯尾”)。与恒星光谱不同,透射光谱特征的深度不会随波长发生根本变化,因为它主要由行星的大气标高决定。在中红外与近红外波长下,恒星污染的减少幅度为几倍到几倍不等,但这是否足以绕过恒星污染最终取决于黑子覆盖面积。尽管如此,红外波长下热发射光谱特征的扁平化是普遍存在的。 Seager, Sara, and Alexander I. Shapiro. “Why Observations at Mid-Infrared Wavelengths Partially Mitigate M Dwarf Star Host Stellar Activity Contamination in Exoplanet Transmission Spectroscopy.” The Astrophysical Journal, vol. 970, no. 2, July 2024, p. 155. Crossref, https://doi.org/10.3847/1538-4357/ad509a.
Jones, David E., et al. "Improving Exoplanet Detection Power: Multivariate Gaussian Process Models for Stellar Activity." arXiv:1711.01318v4 [astro-ph.IM], 25 Aug. 2020, https://arxiv.org/abs/1711.01318.