P1_RC_GGL : test strict de fermeture de la dynamique galactique et du lentillage faible (Rotation Curves + GGL)
Cadre de gravité moyenne d’EFT vs référence NFW minimale de matière noire froide (DM)
Consultez le rapport d’évaluation original :
1. ChatGPT : https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini : https://gemini.google.com/share/773ec96d75a0
3. Grok : https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen : https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek : https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
6. Doubao : https://www.doubao.com/thread/w166b207d7345e46a
0 Résumé exécutif (Executive Summary)
Ce rapport est l’édition complète de niveau publication archivée sur Zenodo (Archive edition). Il fournit une chaîne intégrée et auditable couvrant les données, le registre des modèles, la comparaison équitable, le test de fermeture et les matériaux de reproduction. L’annexe B (P1A), comme complément de robustesse, présente un test de pression « baseline DM plus standard + erreur systématique clé » destiné à vérifier la sensibilité des conclusions principales à une modélisation DM plus réaliste et au traitement des erreurs systématiques du lentillage.
Conclusions clés (quatre phrases directement citables ; voir §2.4) :
(1) Dans l’ajustement des courbes de rotation (RC), la famille EFT surpasse nettement DM_RAZOR pour toutes les combinaisons de noyau/prior ; l’amélioration typique est Δlog𝓛_RC ≈ 10^3 (voir tableau S1a).
(2) Dans le test de fermeture RC→GGL, EFT offre une transférabilité plus forte entre sondes : la force de fermeture Δlog𝓛_closure (True−Perm) est nettement supérieure à celle de DM_RAZOR, et l’écart est robuste aux scans de shrinkage de covariance, de R_min et de σ_int (voir fig. S3, tableau S1b).
(3) Dans l’ajustement conjoint (RC+GGL), EFT conserve un avantage stable, et cet avantage s’effondre dans le contrôle négatif (destruction de la cartographie partagée), ce qui indique que l’« effet de gravité moyenne » provient de la cartographie partagée plutôt que d’un hasard d’ajustement (voir fig. S4).
(4) L’annexe B (P1A) soumet le côté DM à un test de pression avec des modules de baseline DM plus standard et un nuisance clé d’erreur systématique de lentillage, sans augmenter significativement la dimension ; ces renforcements n’éliminent pas l’avantage de fermeture d’EFT (voir tableau B1, fig. B1).
Disponibilité des données et du code : rapport Concept DOI 10.5281/zenodo.18526334 ; paquet complet de reproduction Concept DOI 10.5281/zenodo.18526286. Les tags correspondant à l’annexe B (P1A) sont run_tag=20260213_151233, closure_tag=20260213_161731 et joint_tag=20260213_195428.
1 Résumé
Nous comparons de façon quantitative et reproductible deux cadres théoriques sous les mêmes données et le même protocole statistique : le modèle de « correction de gravité moyenne » proposé par la Théorie des filaments d’énergie (Energy Filament Theory, EFT ; à ne pas confondre avec l’abréviation courante Effective Field Theory), et le modèle de référence de halos NFW de matière noire froide (DM_RAZOR). DM_RAZOR est délibérément choisi comme « baseline DM minimale » : halo NFW + relation c–M fixe (sans dispersion halo-to-halo), afin de fournir un témoin auditable et vérifiable. Il faut également souligner que le présent article traite EFT comme une paramétrisation phénoménologique, de type MOND, de champ/réponse effective, testée dans un protocole statistique unifié, et non comme une dérivation microphysique de premiers principes dans cet article.
Les données comprennent : les courbes de rotation SPARC (RC), après prétraitement unifié et binning, soit 2 295 points de vitesse (104 galaxies, 20 RC-bin), ainsi que la densité de surface excédentaire ΔΣ(R) du lentillage faible galaxie-galaxie KiDS-1000 (GGL), organisée en 4 bins de masse stellaire × 15 points R par bin, soit 60 points au total, avec covariance complète.
Nous exécutons successivement l’inférence RC-only, le test de fermeture RC→GGL (closure), l’inférence GGL-only et l’inférence conjointe RC+GGL, puis nous utilisons un audit de cohérence pour garantir la traçabilité de toutes les valeurs citées. Sous des contraintes strictes de registre de paramètres et de cartographie partagée (DM : 20 log M200_bin ; EFT : 20 log V0_bin + 1 log ℓ global), la famille EFT surpasse nettement DM_RAZOR dans l’ajustement conjoint : ΔlogL_total = 1155–1337 (par rapport à DM_RAZOR). Plus important encore, le test de fermeture montre que le posterior RC possède une puissance prédictive non triviale pour GGL : la force de fermeture d’EFT, ΔlogL_closure = 172–281, dépasse celle de DM_RAZOR, égale à 127 ; lorsque les groupes RC-bin→GGL-bin sont mélangés aléatoirement, le signal de fermeture s’effondre à 6–23, ce qui vérifie que ce signal n’est ni un hasard statistique ni un biais d’implémentation. Dans les scans systématiques de σ_int, R_min et du shrinkage de covariance, l’avantage relatif d’EFT reste positif et d’un ordre de grandeur stable. Pour répondre aux objections courantes du type « baseline DM trop faible / erreur systématique prise pour de la physique », l’annexe B (P1A) fournit un test de pression DM plus standard mais toujours bas-dimensionnel et auditable, comprenant une hiérarchisation de la dispersion c–M + prior, un proxy core à un paramètre, un nuisance de lentillage m et le modèle combiné DM_STD ; sous le même protocole de fermeture, ces renforcements n’éliminent pas l’avantage de fermeture d’EFT (voir tableau B1/fig. B1).
Mots-clés : courbes de rotation ; lentillage faible galaxie-galaxie ; test de fermeture ; EFT ; matière noire froide ; inférence bayésienne
2 Introduction et aperçu des résultats
Les courbes de rotation (RC) et le lentillage faible galaxie-galaxie (GGL) sont deux sondes gravitationnelles complémentaires : les RC contraignent le potentiel dynamique dans le plan du disque et la relation d’accélération radiale (RAR), tandis que le GGL mesure la distribution de masse projetée et la réponse gravitationnelle à l’échelle des halos. Pour toute théorie candidate, l’enjeu n’est pas de pouvoir ajuster séparément les deux jeux de données, mais de parvenir à une explication cohérente sous une même cartographie inter-données et des contraintes partagées.
C’est pourquoi ce travail prend le « test de fermeture » (closure test) comme protocole statistique central : on utilise d’abord le posterior RC-only pour prédire GGL en avant, puis on le compare à un contrôle négatif dans lequel la cartographie RC-bin→GGL-bin est permutée (permutation / shuffle), afin d’évaluer la transférabilité prédictive entre jeux de données (predictive transferability) et d’écarter les faux signaux dus à un biais d’implémentation ou à un ajustement fortuit.
Positionnement théorique et portée : le présent article ne cherche pas à donner ici une dérivation microphysique de premiers principes d’EFT (la Théorie des filaments d’énergie), ni une forme relativiste complète. Au contraire, nous traitons EFT comme une paramétrisation effective de faible dimension, de type MOND, d’un champ ou d’une réponse effective (décrite par une fonction noyau f(x) et une échelle globale ℓ), puis nous testons sa cohérence inter-données et sa capacité de prédiction transférable au moyen du test de fermeture RC→GGL, sous un registre de paramètres strict.
Programme de recherche et déclaration de portée : cet article appartient à un programme continu de recherche observationnelle de série P. Dans les données actuelles à l’échelle des galaxies, nous cherchons deux types de contributions effectives possibles du fond : (i) un « socle gravitationnel » (mean gravity floor) décrivable par une réponse gravitationnelle moyenne après coarse-graining, et (ii) un « socle de bruit » (stochastic/noise floor) lié aux fluctuations de processus microscopiques. Dans le présent article (P1), nous nous concentrons uniquement sur le premier : sans introduire d’hypothèse sur un mécanisme microscopique de production, nous recherchons les signes observationnels du socle gravitationnel moyen au moyen du test de fermeture RC→GGL, et nous les comparons à une baseline DM auditable dans un protocole unifié. Comme image physique heuristique, si des degrés de liberté à courte durée de vie existent, leur décroissance/annihilation peut convertir une masse au repos en énergie-impulsion portée par d’autres degrés de liberté ; au niveau effectif, cela correspond naturellement à une décomposition « contribution moyenne + contribution fluctuante ». Toutefois, cet article ne modélise pas quantitativement cette image microscopique.
Afin d’éviter toute surinterprétation, les limites de portée du présent article sont les suivantes :
• Ce que fait l’article : mesurer la transférabilité prédictive inter-données au moyen d’un test de fermeture, sous contraintes strictes de registre de paramètres et de cartographie partagée, et comparer de façon reproductible la réponse de gravité moyenne d’EFT à une baseline DM.
• Ce que l’article ne fait pas : il ne discute aucun mécanisme microscopique de production, aucune abondance/durée de vie ni aucune contrainte cosmologique ; il ne modélise pas le terme stochastique correspondant au « socle de bruit ».
• Ce que l’article ne prétend pas : il n’a pas pour objectif de renverser la matière noire ; P1 ne rend pas de verdict final sur l’existence du « socle », mais rapporte des éléments de preuve intermédiaires — dans le domaine de mesure robuste choisi ici, les données préfèrent un modèle incluant une réponse de gravité moyenne.
En même temps, nous précisons que DM_RAZOR représente seulement une baseline NFW minimale et auditable (c–M fixé et sans scatter ; sans adiabatic contraction, feedback core, non-sphéricité ni termes environnementaux). La conclusion principale du corps de l’article est donc strictement limitée : sous cette baseline minimale et les contraintes strictes de registre de paramètres/cartographie, la cohérence inter-données d’EFT est plus forte. Pour répondre à une question fréquente — une baseline ΛCDM plus standard et une modélisation des erreurs systématiques clés de lentillage changeraient-elles significativement la conclusion ? — nous rassemblons dans l’annexe B (P1A : test de pression de standardisation de la baseline DM) des renforcements DM plus standard mais toujours bas-dimensionnels et auditables, ainsi qu’un nuisance côté lentillage, en conservant exactement le même protocole de cartographie partagée et de fermeture que dans le corps de l’article (voir tableau B1/fig. B1).
2.1 Tab S1a–S1b : résumé des indicateurs clés (Strict)
Le tableau S1a présente les indicateurs principaux de comparaison de l’ajustement conjoint (RC+GGL) : logL, ΔlogL, AICc et BIC. Le tableau S1b donne les indicateurs du test de fermeture et des scans de robustesse : closure, contrôle négatif shuffle, plages des scans σ_int / R_min / cov-shrink. Toutes les valeurs proviennent de la table stricte de synthèse Tab_Z1_master_summary et sont traçables élément par élément dans le paquet archivé de publication.
Tableau S1a|Indicateurs principaux de comparaison de l’ajustement conjoint (RC+GGL, Strict).
Modèle (workspace) | Noyau W | k | logL_total conjoint (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Tableau S1b|Indicateurs de fermeture et de robustesse (Strict).
Modèle (workspace) | ΔlogL de fermeture (true-perm) | ΔlogL après shuffle du contrôle négatif | Plage ΔlogL du scan σ_int | Plage ΔlogL du scan R_min | Plage ΔlogL du scan cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Fig S3 : force de fermeture (RC-only → prédiction de GGL)
La force de fermeture est définie par ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ : à partir des échantillons du posterior RC-only, on prédit GGL en avant, puis on compare avec le contrôle négatif obtenu par permutation de la cartographie RC-bin→GGL-bin.

Fig. S3|Force de fermeture (plus grand = meilleur) : avantage de vraisemblance logarithmique moyen de la prédiction RC-only → GGL.
2.3 Fig S4 : comparaison principale de l’ajustement conjoint (RC+GGL)
L’avantage d’ajustement conjoint est défini par ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Avec les mêmes données, la même cartographie et des dimensions de paramètres presque identiques, la famille EFT atteint une vraisemblance logarithmique conjointe nettement plus élevée.

Fig. S4|Avantage de l’ajustement conjoint (plus grand = meilleur) : best logL_total de RC+GGL par rapport à DM_RAZOR.
2.4 Quatre conclusions (directement citables)
(1) Dans l’analyse conjointe unifiée des courbes de rotation SPARC et du lentillage faible KiDS-1000, les modèles du cadre de gravité moyenne d’EFT surpassent systématiquement DM_RAZOR sous un protocole de contrôle strict : ΔlogL_total = 1155–1337 (par rapport à DM_RAZOR).
(2) Le test de fermeture RC→GGL montre une cohérence prédictive plus forte pour EFT : ΔlogL_closure = 172–281, contre 127 pour DM_RAZOR ; de plus, lorsque les groupes RC-bin→GGL-bin sont mélangés aléatoirement, le signal de fermeture s’effondre à 6–23, indiquant que le signal dépend de la bonne cartographie inter-données et non d’un ajustement fortuit.
(3) Les scans systématiques de σ_int, R_min et du shrinkage de covariance ne modifient ni le signe ni l’ordre de grandeur de l’avantage « EFT > DM_RAZOR », ce qui montre la robustesse de cette conclusion face aux perturbations systématiques courantes.
(4) Sous le même protocole de fermeture, l’annexe B (P1A) renforce la baseline DM de façon « standardisée et auditable » : elle conserve trois renforcements à un paramètre (SCAT/AC/FB), puis ajoute une hiérarchisation c–M scatter + prior, un proxy core à un paramètre et un calibrage de cisaillement côté lentillage m (ainsi que leur combinaison DM_STD). Les résultats montrent que seule la branche feedback/core apporte un petit gain net de force de fermeture (122.21→129.45, ΔΔlogL_closure≈+7.25) ; les autres renforcements ont une contribution non significative ou négative. La conclusion principale ne dépend donc pas d’une faiblesse excessive de DM_RAZOR.
3 Données et prétraitement
Cette étude utilise deux jeux de données publics et exécute, au sein de l’ingénierie du projet, le téléchargement, la vérification (sha256) et le prétraitement au moyen de scripts traçables. Pour garantir une comparaison équitable entre modèles, tous les workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) partagent exactement les mêmes produits de données et la même cartographie de binning.
3.1 Courbes de rotation (RC, SPARC)
Les données RC proviennent de Rotmod_LTG dans la base SPARC (175 fichiers rotmod). Après prétraitement, l’échantillon inclus dans la modélisation comprend 104 galaxies, soit 2 295 points de données (r, V_obs), répartis en 20 RC-bin selon la masse stellaire et d’autres règles. Chaque point contient le rayon r (kpc), la vitesse observée V_obs (km/s) et son erreur σ_obs, ainsi que les composantes de vitesse gaz/disque/bulbe (V_gas, V_disk, V_bul).
3.2 Lentillage faible (GGL, KiDS-1000 / Brouwer+2021)
Les données GGL utilisent la densité de surface excédentaire équivalente ΔΣ(R) fournie par Brouwer et al. (2021) pour la Fig. 3 de KiDS-1000 (4 bins de masse stellaire, 15 points R par bin), avec la covariance complète correspondante. Dans l’ingénierie du projet, la covariance brute au format long est reconstruite en matrice 15×15 pour chaque bin, puis l’audit Stage-B vérifie la dimension et la plausibilité numérique.
3.3 Cartographie RC-bin → GGL-bin et taille totale de l’échantillon
Les 4 bins de masse de GGL sont reliés aux 20 bins de RC par une cartographie fixe : chaque GGL-bin correspond à 5 RC-bin, et la contribution des RC-bin est moyennée avec des poids fondés sur le nombre de galaxies. Cette cartographie est inchangée dans tous les modèles et constitue la contrainte centrale de la comparaison équitable entre test de fermeture et ajustement conjoint. Le nombre total de points de données conjoints est n_total = 2355 (RC=2295, GGL=60).
4 Modèles et méthodes statistiques
4.1 Spécification mathématique minimale d’EFT et de DM (auditable/testable)
Cette section donne la spécification mathématique minimale directement correspondante à l’implémentation.
(a) Modèle de courbes de rotation (RC)
Pour chaque point de données RC (r, V_obs, σ_obs), nous utilisons une superposition de composantes : V_mod²(r) = V_bar²(r) + V_extra²(r). Ici, V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Dans les résultats principaux, nous adoptons Υ_d = Υ_b = 0.5, conformément aux recommandations empiriques de SPARC et afin de réduire les degrés de liberté non nécessaires.
(b) Correction de gravité moyenne d’EFT (EFT)
Le terme supplémentaire d’EFT est paramétré sous forme de « carré de vitesse moyenne » : V_extra²(r) = V0_bin² · f(r/ℓ). Ici, V0_bin est le paramètre d’amplitude de chaque RC-bin (20 paramètres), ℓ est l’échelle globale (1 paramètre) et f(x) est la fonction noyau sans dimension. Les formes de noyau comparées ici, qui n’introduisent aucune liberté continue supplémentaire, sont :
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (contrôle optionnel) gaussian: f(x)=erf(x/√2) (non inclus dans l’ensemble des conclusions principales)
Motivation physique (extension) : EFT interprète la réponse gravitationnelle supplémentaire à l’échelle des galaxies comme une réponse effective obtenue par coarse-graining / moyenne d’échelle d’effets plus microscopiques opérant à une échelle finie. Dans cet article, nous ne présupposons aucun mécanisme microscopique particulier ; nous utilisons une paramétrisation minimale et auditable pour effectuer une comparaison et un test contrôlés sous un protocole statistique unifié.
Pour une intuition directe, le terme supplémentaire peut s’écrire sous forme d’accélération : a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Lorsque r≫ℓ, f→1 et V_extra→V0_bin, ce qui produit une contribution de vitesse supplémentaire approximativement plate dans la région externe ; lorsque r≪ℓ et f(x)≈x, on peut introduire une échelle d’accélération caractéristique a0,bin≈V0_bin²/ℓ, à un facteur O(1) de la fonction noyau près, fournissant une intuition de transition interne-externe de type MOND.
La famille discrète de noyaux utilisée ici (none/exponential/yukawa/powerlaw_tail) peut être vue comme un proxy de faible dimension pour différentes « pentes initiales / vitesses de transition / queues à longue portée » — par exemple, un blindage de type Yukawa par rapport à une réponse à queue plus longue — destiné à des tests de robustesse plutôt qu’à l’exhaustion de l’espace des modèles. Pour le lentillage faible, nous construisons, à partir de V_avg(r), une masse et une densité d’enveloppe équivalentes, puis nous les projetons pour obtenir ΔΣ(R) ; cette densité équivalente doit être comprise comme une description effective du potentiel de lentillage sous hypothèse de symétrie sphérique et de mapping de champ faible (les détails complets sont déplacés en annexe A).
Les formes de noyau ci-dessus satisfont toutes f(x)→1 lorsque x→∞, c’est-à-dire V_extra²→V0² par saturation, tandis qu’à x≪1 elles donnent une croissance linéaire ou sous-linéaire : par exemple exponential: f≈x ; yukawa: f≈0.5x ; powerlaw_tail: f≈0.5x. Ainsi, les différentes formes de noyau produisent des différences observables dans la « pente initiale », la rapidité de transition et la queue externe aux petits rayons, différences que l’ajustement conjoint RC+GGL et le test de fermeture peuvent distinguer.
La prédiction EFT du lentillage faible ΔΣ(R) est déduite de V_avg(r) en reconstruisant la masse et la densité d’enveloppe, puis en les intégrant par projection : M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). L’implémentation numérique utilise une grille logarithmique et un raffinement adaptatif en cas d’anomalie, afin d’assurer la stabilité et la répétabilité.
(c) DM_RAZOR : baseline de halo NFW de matière noire froide
Nous précisons encore que DM_RAZOR représente uniquement une baseline NFW minimisée et auditable : c–M fixé, sans scatter, sans adiabatic contraction, feedback core, non-sphéricité ni termes environnementaux. Afin de réduire le risque de « strawman baseline », le présent article n’affirme pas que ces effets n’existent pas ; il les introduit au contraire de manière bas-dimensionnelle et auditable dans l’annexe B (P1A) comme tests de pression : traitement hiérarchique du scatter c–M, proxy core et nuisance de calibration du cisaillement côté lentillage, entre autres.
4.2 Registre des modèles et comparaison équitable (paramètres partagés = définition de la fermeture)
Le nombre de paramètres dans l’ensemble de comparaison principal est : DM_RAZOR k=20 ; famille EFT k=21, le paramètre supplémentaire étant le log ℓ global. Tous les modèles partagent les mêmes données RC, les mêmes données GGL et leur covariance, la même cartographie RC-bin→GGL-bin, les mêmes termes baryoniques et les mêmes conversions d’unités. De plus, les formes de noyau (none / exponential / yukawa / powerlaw_tail) sont des choix discrets et n’introduisent pas de paramètre continu supplémentaire, évitant ainsi tout avantage dû à « un degré de liberté de plus ».
4.3 Vraisemblances, a priori et échantillonneur
La vraisemblance RC est gaussienne diagonale : σ_eff² = σ_obs² + σ_int² ; les résultats principaux fixent σ_int=5 km/s, et Run-5 scanne σ_int. La vraisemblance GGL utilise une gaussienne à covariance complète pour chaque bin : logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). L’objectif conjoint est logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Les priors imposent principalement des frontières physiquement faisables (contraintes d’intervalle sur log ℓ, log V0 et log M200) ; lorsque Υ et σ_int sont libres, des priors faiblement informatifs sont employés (voir les détails dans l’implémentation et la configuration du release package).
L’échantillonneur utilise une marche aléatoire Metropolis par blocs adaptative : à chaque étape, seul un sous-bloc aléatoire de l’espace des paramètres est mis à jour pour améliorer l’acceptation en haute dimension, et le pas est légèrement adapté à partir du taux d’acceptation par fenêtre (taux cible d’environ 0,25). Les résultats principaux utilisent le mode quick (par exemple n_steps=800) ; chaque workspace exporte des traces, des résidus et des graphiques PPC pour l’audit manuel et scripté.
4.4 Test de fermeture et contrôle négatif (définition)
Le test de fermeture (Run-2) vérifie si le posterior RC-only peut prédire GGL sans réajuster GGL. Concrètement, à partir des échantillons posterior RC-only, on génère en avant ΔΣ(R) pour les 4 GGL-bin et on calcule logL_true avec la covariance complète ; puis on permute aléatoirement la cartographie de groupes RC-bin→GGL-bin pour obtenir logL_perm. La force de fermeture est définie par ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. En outre, Run-10 regroupe aléatoirement les 20 RC-bin en 4×5 (shuffle) et recalcule la fermeture, afin de tester la dépendance du signal de fermeture à la bonne cartographie.
5 Résultats principaux et interprétation
5.1 Résultats principaux de l’ajustement conjoint (RC+GGL)
Le best logL_total de l’ajustement conjoint et l’avantage relatif ΔlogL_total (par rapport à DM_RAZOR) sont présentés dans le tableau S1a et la fig. S4. Dans l’ensemble de comparaison principal, EFT_BIN obtient le plus grand avantage conjoint (ΔlogL_total=1337.210), tandis que les autres formes de noyau EFT conservent également des avantages significatifs (1154.827–1294.442). Selon les critères d’information (AICc/BIC), la famille EFT surpasse aussi nettement DM_RAZOR, ce qui indique que l’avantage ne provient pas d’un biais lié au nombre de paramètres.
Remarque : la principale contribution à ΔlogL_total≈1337 provient du terme RC (dans la décomposition jointe, ΔlogL_RC≈1065, soit environ 80 %) ; cela peut s’interpréter comme une amélioration modérée, Δχ²≈0.90 par point, sur N=2295 points RC, qui s’accumule naturellement en un avantage d’ordre 10^3 sous une vraisemblance gaussienne diagonale. En même temps, GGL et le test de fermeture fournissent des contraintes indépendantes entre jeux de données, et le classement reste stable sous les tests de pression σ_int, R_min et cov‑shrink (voir §6 et tableau S1b).
5.2 Résultats du test de fermeture (RC-only → GGL)
La quantité clé du test de fermeture, ΔlogL_closure, est présentée dans le tableau S1b et la fig. S3. La famille EFT atteint une force de fermeture de 171.977–280.513, supérieure à celle de DM_RAZOR (126.678). Cela signifie que, sans autoriser aucun degré de liberté inter-données supplémentaire, les échantillons posterior obtenus par EFT à partir des données RC possèdent une plus forte puissance de prédiction transférable vers les données GGL.
Le contrôle négatif renforce encore la pertinence physique du signal de fermeture : lorsque le regroupement RC-bin→GGL-bin est mélangé aléatoirement, la force de fermeture d’EFT tombe à 6–15 (avec de légères différences selon les noyaux), alors que la force de fermeture de référence atteint 172–281. Cet « effondrement du signal » exclut un avantage fictif dû à l’implémentation numérique, aux erreurs d’unités ou à un mauvais traitement de la covariance.

Fig. R1|Contrôle négatif : le signal de fermeture baisse fortement après le regroupement shuffle (tracé à partir des indicateurs Tab_Z1).
5.3 Signification et limites des résultats
La conclusion de cette étude est la suivante : « dans ce jeu de données et sous ce protocole, la correction de gravité moyenne d’EFT surpasse la baseline DM_RAZOR testée ». Il faut souligner que le côté DM n’utilise qu’une baseline NFW minimale avec relation c(M) fixe, sans core, non-sphéricité, termes environnementaux ni modèle de connexion galaxie–halo plus complexe. Le présent manuscrit ne prétend donc pas exclure toutes les familles de modèles DM ; il fournit plutôt une baseline de comparaison reproductible et centrée sur le test de fermeture, pour évaluer si RC et GGL peuvent être expliqués de manière cohérente par la même cartographie et les mêmes paramètres inter-données.
Pour répondre à cette question fréquente, nous avons achevé un projet d’extension indépendant, P1A (voir annexe B), qui renforce la baseline DM de façon « standardisée et auditable » sans modifier la cartographie partagée RC-bin→GGL-bin ni le cadre d’audit. Outre les trois renforcements à un paramètre (SCAT/AC/FB), P1A ajoute (i) une hiérarchisation c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) un proxy baryonic-feedback core à un paramètre (DM_CORE1P), et (iii) un nuisance m de calibration du cisaillement côté lentillage (DM_RAZOR_M), puis fournit le modèle combiné DM_STD ; EFT_BIN est conservé comme référence de comparaison.
• DM_RAZOR_SCAT (c–M scatter) — introduit le paramètre de dispersion de concentration halo-to-halo σ_logc pour tester si un c(M) fixé sous-estime systématiquement le pouvoir explicatif de DM ;
• DM_RAZOR_AC (Adiabatic Contraction) — utilise un paramètre unique α_AC pour interpoler continûment entre « absence de contraction » et « contraction standard », capturant à coût minimal la tendance de contraction interne due aux baryons ;
• DM_RAZOR_FB (Feedback / core) — utilise une échelle de core, par exemple log r_core, pour décrire l’effet de suppression de la formation de core dans la région interne sur les courbes de rotation, tout en conservant l’approximation NFW à l’échelle du lentillage faible.
Le scoreboard quantitatif de P1A est donné dans le tableau B1 / fig. B1 de l’annexe B (généré automatiquement à partir de Tab_S1_P1A_scoreboard). Pour l’indicateur de fermeture, DM_RAZOR_FB apporte un petit gain net (122.21→129.45, +7.25) ; les autres renforcements ont une contribution non significative ou négative à la force de fermeture. Côté ajustement conjoint, l’ajout du prior hiérarchique c–M scatter (DM_HIER_CMSCAT) ou du modèle combiné DM_STD peut améliorer fortement joint logL, mais sans augmenter la force de fermeture, ce qui suggère que l’amélioration principale provient de la flexibilité de l’ajustement conjoint plutôt que de la transférabilité entre sondes. La conclusion centrale du corps de l’article doit donc être comprise ainsi : sous des contraintes strictes de cartographie partagée et de test de fermeture, l’avantage de cohérence inter-données d’EFT ne provient pas du choix d’une « baseline trop faible » côté DM. Le paquet de publication P1A correspondant à l’annexe B (supplément de tables/figures et full_fit_runpack) sera intégré comme fichier additionnel sous le même Zenodo Concept DOI que le full_fit_runpack de cet article : .https://doi.org/10.5281/zenodo.18526286
6 Robustesse et expériences de contrôle
6.1 Scan de σ_int (Run-5)
Nous effectuons un scan systématique de la dispersion intrinsèque σ_int des RC, puis répétons l’inférence conjointe à chaque valeur de σ_int pour calculer ΔlogL_total par rapport à DM_RAZOR. Les valeurs minimale/maximale de ΔlogL_total pour chaque modèle sur la plage de scan sont données dans le tableau S1b.

Fig. R2|Plage de ΔlogL_total sous scan de σ_int (plus grand = meilleur).
6.2 Scan de R_min (Run-6)
Pour tester l’influence des erreurs systématiques des régions centrales — par exemple mouvements non circulaires, résolution et modélisation baryonique insuffisante — nous appliquons un seuil R_min aux données RC, puis répétons l’inférence conjointe. L’avantage de la famille EFT reste positif et d’un ordre de grandeur stable sous le scan R_min.

Fig. R3|Plage de ΔlogL_total sous scan de R_min (plus grand = meilleur).
6.3 Scan de cov-shrink (Run-7)
Pour tester l’incertitude de covariance de GGL, nous appliquons un shrinkage à la matrice de covariance de chaque bin de masse : C_α=(1−α)C+α·diag(C), puis nous scannons α. Les résultats montrent que l’avantage de la famille EFT est peu sensible à ce traitement.

Fig. R4|Plage de ΔlogL_total sous scan de cov-shrink (plus grand = meilleur).
6.4 Échelle d’ablation (Run-8)
Nous réalisons une ablation imbriquée à l’intérieur d’EFT_BIN : du modèle minimal sans paramètre libre, à des versions ne conservant que quelques degrés de liberté, puis au modèle complet avec 20 amplitudes de bin + une échelle globale. Les critères AICc/BIC montrent que l’EFT_BIN complet est nettement nécessaire pour expliquer les données.

Fig. R5|Échelle d’ablation d’EFT_BIN (AICc, plus petit = meilleur).
6.5 Prédiction par leave-one-bin-out (Run-9)
Nous exécutons en outre un test leave-one-bin-out (LOO) : parmi les 4 bins de masse de GGL, un bin est laissé de côté à chaque itération ; les autres bins, ainsi que l’ensemble des RC, sont utilisés pour réinférer, puis la vraisemblance logarithmique de test est évaluée sur le bin laissé de côté. Les indicateurs agrégés figurent dans la table supplémentaire Tab_R3_leave_one_bin_out (produit Run-9 ; le motif de chemin de fichier est donné dans la liste des produits clés au §8.2). La famille EFT reste nettement supérieure à DM_RAZOR même dans le pire cas de bin laissé de côté.

Fig. R6|LOO : distribution de vraisemblance logarithmique du bin laissé de côté (à partir des produits Run-9).
6.6 Contrôle négatif : shuffle des RC-bin (Run-10)
Run-10 regroupe aléatoirement les 20 RC-bin en 4×5, puis recalcule la fermeture tout en gardant inchangé le posterior RC-only. Les résultats montrent que, par rapport à la cartographie originale, le shuffle réduit nettement le mean logL_true de fermeture et ΔlogL_closure (voir tableau S1b et fig. R1), ce qui renforce l’interprétabilité du signal de fermeture.

Fig. R7|Contrôle négatif : la cartographie shuffle entraîne une baisse nette du mean logL_true de fermeture (produits Run-10).
7 Traçabilité et audit de cohérence (Provenance)
Toutes les valeurs citées dans cet article sont traçables élément par élément dans les tables strictes de synthèse et les enregistrements d’audit archivés. Pour fluidifier la lecture du corps de l’article, la chaîne complète de provenance (liste des tags, tables d’audit, liste des checksums et méthode de vérification) a été déplacée en annexe A.
8 Reproductibilité et archivage Zenodo (Reproducibility & Archive)
Déclaration de disponibilité des données et du code : les courbes de rotation SPARC et les données de lentillage faible KiDS-1000 utilisées dans cet article sont publiques. Le rapport de niveau publication a été archivé sur Zenodo (Concept DOI : ), et le paquet complet de reproduction a été archivé sur Zenodo (Concept DOI : ). Les étapes d’exécution détaillées, l’environnement de dépendances, la liste d’archive et les informations de vérification par hachage figurent en annexe A ; la conception, les tags d’exécution et les produits du test de pression de standardisation de la baseline DM (P1A) figurent en annexe B.https://doi.org/10.5281/zenodo.18526334https://doi.org/10.5281/zenodo.18526286
Sous le même Concept DOI du paquet complet de reproduction (), nous fournissons deux entrées reproductibles selon l’usage :
• P1 (corps) full_fit_runpack : reproduit RC-only / closure / joint et les scans de robustesse pour EFT vs DM_RAZOR, puis génère les actifs du corps de l’article, notamment les tableaux S1a/S1b et les figures S3/S4 ;
• P1A (annexe B) full_fit_runpack : reproduit le test de pression de standardisation de la baseline DM (SCAT/AC/FB + prior hiérarchique c–M scatter + core1p + lensing m + DM_STD ; avec EFT_BIN comme témoin), puis génère le tableau B1 et la figure B1 de l’annexe.
Les tables et figures supplémentaires de P1A ainsi que le full_fit_runpack seront intégrés comme fichiers additionnels sous le même Concept DOI afin de conserver un point d’archive unique.https://doi.org/10.5281/zenodo.18526286
9 Remerciements et déclarations
9.1 Remerciements
Nous remercions les équipes SPARC et KiDS-1000 pour les données et la documentation publiques ; nous remercions également les participants à la reconstruction et au processus d’audit du projet.
9.2 Contributions de l’auteur
Guanglin Tu est responsable de la conception du concept, du plan d’étude, de la mise en œuvre d’ingénierie, de l’organisation des données, de l’analyse formelle, de la mise en œuvre du flux de reproduction et de l’audit, ainsi que de la rédaction de l’article.
9.3 Sources de financement
Financement personnel de l’auteur Guanglin Tu (aucun financement externe / aucun numéro de subvention).
9.4 Intérêts concurrents
L’auteur Guanglin Tu est affilié au « Groupe de travail EFT, Shenzhen Energy Filament Science Research Co., Ltd. (Chine) » ; aucun autre intérêt concurrent n’est déclaré.
9.5 Assistance par IA
OpenAI GPT-5.2 Pro et Gemini 3 Pro ont été utilisés pour le polissage linguistique, l’édition structurale et la clarification du flux de reproduction ; ils n’ont pas été utilisés pour générer ou modifier les données, résultats, figures ou codes ; ils n’ont pas été utilisés pour générer des citations ; l’auteur assume l’entière responsabilité du contenu intégral et de l’exactitude des citations.
10 Références
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Théorie des filaments d’énergie. Zenodo (dépôt de science ouverte) DOI : https://doi.org/10.5281/zenodo.18517411
Annexe A : détails de traçabilité et de reproductibilité
Cette annexe rassemble les informations de traçabilité et de reproductibilité destinées à l’archivage long terme (tags d’exécution, résultats d’audit, liste d’archive et points de contrôle), afin de faciliter la vérification et la reproduction par les lecteurs selon leurs besoins.
A.1 Détails de traçabilité et d’audit
Pour garantir une traçabilité de long terme, le projet attribue un tag horodaté à chaque exécution et à chaque sortie, et conserve les produits historiques sans écrasement. Les valeurs clés citées dans ce manuscrit proviennent de la compilation stricte (compile_tag=20260205_035929) et ont passé les audits de cohérence suivants :
• Toutes les tables intermédiaires portent un run_tag et un tag d’étape ; le script de synthèse stricte sélectionne, dans report/tables, les sources de tables canonical « complètes et cohérentes ».
• Les valeurs de Tab_Z1_master_summary et de Tab_Z2_conclusion_highlights sont comparées élément par élément aux tables canonical sélectionnées.
• Lors de la génération du PDF, un audit des tags des tables/figures citées est effectué pour garantir l’absence de mélange avec d’anciens produits.
Tags clés (pour localiser tous les produits intermédiaires) : run_tag=20260204_122515 ; closure_tag=20260204_124721 ; joint_tag=20260204_152714 ; sigma_sweep_tag=20260204_161852 ; rmin_sweep_tag=20260204_195247 ; covshrink_tag=20260204_203219 ; ablation_tag=20260204_214642 ; LOO_tag=20260204_224827 ; negctrl_tag=20260204_234528 ; strict_compile_tag=20260205_035929 ; release_tag=20260205_112442.
Résultat de l’audit de cohérence : Tab_AUDIT_checks_strict affiche pass=9, fail=0, skip=0 (voir le release package).
A.2 Étapes de reproduction et liste d’archivage
Cette étude utilise un système de reproduction en trois volets : « rapport de niveau publication + supplément de tables/figures + runpack complet réexécutable ». Les lecteurs peuvent consulter directement le Tables & Figures Supplement pour vérifier tous les actifs de tables/figures cités dans l’article ; s’ils souhaitent reproduire les valeurs et la chaîne d’audit depuis zéro, ils peuvent utiliser le full_fit_runpack pour télécharger les données et relancer l’ensemble du flux (après exécution, le script interne de comparaison aux tables reference permet de vérifier la cohérence des valeurs de tables).
A.2.1 Quickstart de reproduction (RUN_FULL, Windows PowerShell)
Cette section donne un chemin de reproduction plus court (Windows PowerShell). Pour une vérification rapide, il est recommandé de consulter directement le Tables & Figures Supplement afin de comparer élément par élément les tables et figures citées dans l’article. Pour une reproduction de bout en bout avec génération de toutes les tables/figures et produits d’audit, utilisez le full_fit_runpack : exécutez verify_checksums.ps1 et RUN_FULL.ps1 selon le README/ONE_PAGE_REPRO_CHECKLIST inclus dans le paquet (Mode=full recommandé).
Entrée d’archive Zenodo (Concept DOI) : .
Tags de la chaîne principale de cet article : run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag : 20260205_112442.https://doi.org/10.5281/zenodo.18526286
A.2.2 Matériaux archivés et points de contrôle clés (Packages & checks)
L’archive Zenodo fournit trois types de matériaux complémentaires : (1) le rapport de niveau publication (le présent article, v1.1 ; avec annexe B : test de pression de standardisation de la baseline DM P1A) ; (2) le Tables & Figures Supplement (supplément de tables et figures couvrant tous les actifs cités dans l’article, avec correspondance P1 et P1A) ; (3) le full_fit_runpack (paquet complet de reproduction : téléchargement des données depuis zéro et relance complète du flux, avec correspondance P1 et P1A). Les éléments (1)–(2) permettent une lecture rapide et une vérification indépendante ; l’élément (3) fournit une capacité de reproduction complète de bout en bout.
Catégorie de matériau | Nom de fichier (exemple) | Usage et positionnement (ordre d’utilisation conseillé) |
Rapport de niveau publication (chinois et anglais) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Rapport complet archivé sur Zenodo ; le corps donne les conclusions principales et l’audit de robustesse, tandis que l’annexe B présente P1A (test de pression de standardisation de la baseline DM). |
Tables & Figures Supplement(P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Toutes les tables (CSV) et figures (PNG) citées dans le corps de l’article, avec scripts de génération et fichiers de tags. |
Tables & Figures Supplement(P1A) | P1A_supplement_figs_tables_v1.zip | Toutes les tables et figures citées dans l’annexe B (P1A), y compris Tab_S1_P1A_scoreboard et Fig_S1_P1A_scoreboard. |
full_fit_runpack(P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Reproduction complète de bout en bout : télécharger les données depuis zéro et relancer RC-only/closure/joint ainsi que les scans de robustesse. |
full_fit_runpack(P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Reproduction complète de bout en bout (annexe B) : relancer DM 7+1 + DM_STD (avec témoin EFT_BIN) et générer les actifs de l’annexe ; le paquet inclut un script de comparaison aux tables reference pour vérifier la cohérence des valeurs. |
Conseil de citation : lorsque vous citez cet article ou ses matériaux de reproduction associés, veuillez indiquer le Zenodo Concept DOI ().https://doi.org/10.5281/zenodo.18526334
Après reproduction, les produits clés attendus et vérifiables comprennent :
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (synthèse de fermeture)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (synthèse d’ajustement conjoint)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (scan σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (scan R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (scan cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (contrôle négatif)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (table principale Strict ; correspond aux tableaux S1a/S1b et aux valeurs du corps de l’article)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF de synthèse de niveau publication ; utilisable pour consultation rapide et citation)
Annexe B : P1A — test de pression de standardisation de la baseline DM (DM 7+1 + DM_STD ; avec témoin EFT)
Cette annexe documente un projet d’extension (P1A) de « test de pression de standardisation de la baseline DM » cohérent avec le protocole de fermeture du corps de l’article. Son positionnement est le suivant : sans introduire de nombreux degrés de liberté, ni modifier la cartographie partagée RC-bin→GGL-bin et le cadre d’audit, elle élève le DM_RAZOR minimal utilisé dans le corps de l’article (NFW + c–M fixe, sans scatter / sans contraction / sans core) vers un ensemble de baselines DM plus proche de la pratique astrophysique et plus résistant aux objections courantes. P1A couvre et dépasse le précédent test de pression à trois branches : en conservant SCAT/AC/FB, il ajoute une hiérarchisation c–M scatter + prior, un proxy core à un paramètre et un nuisance m de calibration du cisaillement côté lentillage, puis fournit le modèle combiné DM_STD ; EFT_BIN reste conservé comme référence de comparaison.
Note complémentaire : les valeurs telles que la force de fermeture dans l’annexe B (P1A) utilisent un budget Monte Carlo plus élevé (par exemple ndraw=400, nperm=24), différent du budget quick employé dans le corps de l’article pour couvrir toute la famille de noyaux EFT (par exemple ndraw=60, nperm=12). Les valeurs absolues peuvent donc présenter une dérive d’échantillonnage d’ordre O(10) ; néanmoins, les comparaisons entre modèles sous le même budget et dans une même table sont équitables, et le signe comme l’ordre de grandeur de l’avantage restent stables sous différents budgets.
B.1 Objectif et positionnement (Why P1A, and why as an Appendix)
P1A ne cherche pas à épuiser toutes les possibilités de modélisation de halos ΛCDM, par exemple non-sphéricité, dépendance environnementale, connexion galaxie–halo complexe ou physique baryonique de haute dimension. Au contraire, P1A adopte le principe « faible dimension, auditable, reproductible » : chaque module de renforcement n’introduit qu’un paramètre effectif clé ≤1 et reste soumis aux trois contraintes du présent article :
(i) registre de paramètres : tout nouveau paramètre doit être explicitement comptabilisé et rapporté avec les critères d’information (AICc/BIC) ;
(ii) cartographie partagée : la même cartographie de groupes RC-bin→GGL-bin est conservée ; il n’est pas permis d’« ajuster la cartographie » séparément pour un seul jeu de données ;
(iii) test de fermeture : tout renforcement doit produire un gain réel dans la prédiction transférable RC→GGL, et pas seulement une amélioration du fit RC-only.
B.2 DM 7+1 + DM_STD : définition des modules, paramètres et mode d’entrée dans le posterior conjoint
P1A fournit, comme runpack indépendant, 8 workspaces DM (DM 7+1) et 1 témoin EFT : en partant de DM_RAZOR comme baseline, il construit trois renforcements legacy à un paramètre (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), ajoute trois modules défensifs plus standard (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), puis fournit le modèle combiné DM_STD. L’objectif commun de ces modules est de couvrir, avec aussi peu de dimensions supplémentaires que possible, les trois objections les plus courantes : (a) comment la dispersion de la relation c–M et son prior entrent dans un modèle hiérarchique ; (b) si l’effet principal du baryonic feedback peut être représenté par un proxy core à un paramètre ; (c) si une erreur systématique clé côté lentillage pourrait être prise à tort pour un signal physique.
Workspace | dm_model | Nouveau(x) paramètre(s) (≤1) | Motivation physique (noyau) | Principe de mise en œuvre (audit-friendly) |
|---|---|---|---|---|
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Baseline de halo ΛCDM minimale et auditable ; utilisée comme contrôle strict face à EFT | Cartographie partagée fixe ; registre de paramètres strict ; baseline utilisée seulement pour la comparaison relative |
DM_RAZOR_SCAT | NFW + c–M scatter(legacy) | σ_logc | La relation c–M présente une dispersion ; approximation par un scatter log-normal à un paramètre | ≤1 nouveau paramètre ; cartographie partagée conservée ; le gain de fermeture sert de critère d’acceptation |
DM_RAZOR_AC | NFW + Adiabatic Contraction(legacy) | α_AC | L’infall baryonique peut induire une contraction adiabatique du halo ; approximation par une intensité à un paramètre | ≤1 nouveau paramètre ; cartographie inchangée ; rapport des variations AICc/BIC et du gain de fermeture |
DM_RAZOR_FB | NFW + feedback core(legacy) | log r_core | Le feedback peut former un core interne ; approximation par une échelle de core à un paramètre | ≤1 nouveau paramètre ; même protocole pour fermeture/contrôle négatif ; l’amélioration RC-only n’est pas l’unique objectif |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc(hier) | Hiérarchisation plus standard c_i∼logN(c(M_i),σ_logc) ; affecte simultanément le posterior conjoint RC et GGL | Prior explicite ; marginalisation des c_i latents ; faible dimension et auditabilité conservées |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | Proxy core à un paramètre pour l’effet principal du baryonic feedback, évitant les détails de formation stellaire de haute dimension | Références standard citées ; ≤1 nouveau paramètre ; lié au test de fermeture |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear(GGL) | Absorbe l’erreur systématique clé côté lentillage faible sous forme de paramètre effectif, afin de réduire le risque de « prendre une systématique pour de la physique » | Nuisance explicitement comptabilisé ; aucun effet inverse autorisé sur RC ; la robustesse de fermeture prime |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Intègre simultanément les trois objections courantes dans une baseline standard encore bas-dimensionnelle | Registre de paramètres et critères d’information rapportés ensemble ; fermeture comme indicateur principal ; contrôle défensif DM le plus fort |
Remarque : la dénomination des paramètres ci-dessus suit l’implémentation d’ingénierie (par exemple σ_logc, α_AC, log r_core, m_shear). Le point de conception de P1A est de « renforcer un peu la baseline DM tout en la gardant auditable », et non de transformer le côté DM en ajusteur de haute dimension incontrôlable. En particulier, DM_HIER_CMSCAT introduit le c–M scatter de manière hiérarchique : pour chaque halo, la concentration c_i est définie par une dispersion log-normal autour de c(M_i), puis contrainte par le σ_logc global et le prior c(M). Cette structure hiérarchique influence simultanément le posterior conjoint RC et GGL.
B.3 Protocole statistique et format des produits cohérents avec le corps de l’article
P1A réutilise tous les produits de données, la cartographie partagée et le cadre d’audit du corps de l’article, avec la même séquence d’exécution et le même format de produits :
(1) Run‑1 : inférence RC-only (sorties posterior_samples.npz et metrics.json) ;
(2) Run‑2 : test de fermeture RC→GGL (sorties closure_summary.json et permuted baseline) ;
(3) Run‑3 : ajustement conjoint RC+GGL (sortie joint_summary.json).
Tous les nombres cités proviennent de la table de synthèse automatique (Tab_S1_P1A_scoreboard) et peuvent être vérifiés après relance complète du P1A full_fit_runpack au moyen du script intégré de comparaison à la table reference.
B.4 Résultats principaux, entrée tables/figures et plan d’archivage (même DOI)
Cette section donne les conclusions quantitatives centrales de P1A. Le tableau B1 synthétise les indicateurs clés de RC-only, de la fermeture RC→GGL et de l’ajustement conjoint RC+GGL (les parenthèses indiquent la différence par rapport à la baseline DM_RAZOR) ; la force de fermeture est définie par ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (plus grand = meilleur). La figure B1 visualise le même scoreboard. Les points clés sont les suivants :
• parmi les trois branches legacy, seul DM_RAZOR_FB (feedback/core) apporte un petit gain net de force de fermeture : 122.21→129.45 (+7.25) ; SCAT et AC n’apportent aucun gain net ;
• les nouveaux DM_HIER_CMSCAT et DM_RAZOR_M ont un effet très faible (~0) sur la force de fermeture, et DM_CORE1P ne montre pas non plus de gain net significatif ;
• le modèle combiné DM_STD peut améliorer fortement joint logL (plus proche de l’optimum de l’ajustement conjoint), mais la force de fermeture diminue au contraire, ce qui suggère que le gain provient surtout de la flexibilité de l’ajustement conjoint et non de la transférabilité entre sondes ;
• EFT_BIN, comme témoin, conserve un avantage net en force de fermeture comme en ajustement conjoint ; la conclusion principale du corps de l’article est donc robuste à l’introduction d’une « baseline DM plus forte + nuisance de lentillage ».
Pour faciliter la comparaison directe avec la comparaison principale du corps de l’article, les tableaux S1a–S1b du corps synthétisent les résultats stricts d’EFT et de DM_RAZOR : les modèles EFT améliorent ΔlogL_total≈1155–1337 par rapport à DM_RAZOR dans l’ajustement conjoint, et atteignent ΔlogL_closure=172–281 dans le test de fermeture. P1A fournit seulement une « comparaison plus difficile » côté DM ; son rôle est de réduire les objections de type « strawman baseline / systematics-as-physics », non de remplacer la comparaison principale du corps de l’article.
Tableau B1|P1A scoreboard (plus grand = meilleur ; les parenthèses indiquent la différence par rapport à la baseline DM_RAZOR).
Branche de modèle (workspace) | Δk | RC-only best logL_RC (Δ) | Force de fermeture ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Fig. B1|P1A scoreboard : ΔlogL de fermeture et d’ajustement conjoint par rapport à la baseline (plus grand = meilleur).

Les tags d’exemple correspondant aux exécutions terminées de cette annexe sont les suivants (pour localiser les produits intermédiaires, tables et figures de P1A) :
P1A run_tag = 20260213_151233 ; P1A closure_tag = 20260213_161731 ; P1A joint_tag = 20260213_195428.
B.5 Mode de citation conseillé (Appendix citation note)
Lorsque les lecteurs souhaitent citer le « test de pression de standardisation de la baseline DM » en plus de la conclusion principale du corps de l’article, il est recommandé d’indiquer en même temps que la conclusion principale : ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’