← Expérience

Version de vulgarisation fondée sur « P1_RC_GGL : test strict de fermeture entre dynamique galactique et lentillage faible (v1.1) »

Rapport original : Guanglin Tu | Base de version : P1 v1.1 | Statut du texte : note explicative publique / article non évalué par les pairs
Archives liées : rapport DOI 10.5281/zenodo.18526334 | paquet de reproduction DOI 10.5281/zenodo.18526286

Note de lecture

Ce texte est une version de décryptage, non un second rapport académique. Il s’appuie sur le rapport P1 original, conserve les figures et tableaux clés, et ajoute à chaque étape importante une explication accessible de ce que cela signifie.

Le présent texte n’interprète que les conclusions obtenues par P1 dans ses jeux de données, son registre de paramètres et son protocole statistique : dans le test conjoint des courbes de rotation galactiques (RC) et du lentillage faible galaxie-galaxie (GGL), le modèle de réponse gravitationnelle moyenne de l’EFT devance nettement la base minimale DM_RAZOR testée ici.

Ce texte ne lit pas P1 comme une conclusion selon laquelle « la matière noire serait renversée ». P1 n’est que la première étape des expériences de la série P ; il teste un seul niveau observable de l’EFT, le « socle gravitationnel moyen », et non l’ensemble de la théorie EFT.

0 | Comprendre P1 en cinq minutes : que teste-t-on exactement ?

On peut voir P1 comme une expérience de vérification croisée entre sondes. Il ne demande pas seulement si un modèle peut ajuster un jeu de données : il place deux lectures gravitationnelles très différentes sur le même cadre d’audit commun. Les courbes de rotation (RC) lisent la dynamique au sein des disques galactiques ; le lentillage faible galaxie-galaxie (GGL) lit la réponse gravitationnelle projetée à plus grande échelle.

La phrase centrale de P1

P1 élève le seuil de comparaison : il ne demande plus seulement « l’ajustement est-il bon séparément ? », mais « le modèle se ferme-t-il entre sondes ? ». Un bon résultat sous la correspondance correcte, suivi d’un effondrement du signal lorsque cette correspondance est mélangée, indique plus fortement que le modèle a capté une structure gravitationnelle partagée entre RC et GGL.

Tableau 0 | Les chiffres clés de P1 et leur lecture pour le grand public

Indicateur

Lecture dans P1 / P1A

Comment un lecteur général peut le comprendre

Ajustement conjoint ΔlogL_total

Dans la comparaison principale, EFT dépasse DM_RAZOR de 1155–1337.

Écart de score total sur les deux jeux de données ; plus il est grand, meilleure est l’explication globale.

Intensité de fermeture ΔlogL_closure

Dans la comparaison principale, EFT vaut 172–281, contre 127 pour DM_RAZOR.

Capacité à prédire le GGL après une inférence fondée uniquement sur les RC ; plus la valeur est grande, plus l’auto-cohérence inter-sondes est forte.

Contrôle négatif par shuffle

Après mélange des RC-bin→GGL-bin, le signal de fermeture de l’EFT tombe à 6–23.

Si la bonne correspondance est rompue, l’avantage doit disparaître ; plus cette disparition est nette, mieux elle écarte un faux signal.

Test de pression P1A multi-DM

DM 7+1 + DM_STD, avec EFT_BIN conservé comme comparateur.

P1A ne se limite pas au DM_RAZOR minimal ; il place plusieurs branches d’amélioration DM de faible dimension et auditables dans le même protocole de fermeture.


1 | Pourquoi mener P1 : où la cosmologie à l’échelle des galaxies bloque-t-elle ?

Le problème aux échelles galactiques reste difficile parce que le besoin d’une « gravité ou masse supplémentaire » ne se limite pas aux courbes de rotation. De nombreuses observations montrent un lien serré entre la matière baryonique visible des galaxies et les lectures dynamiques ou de lentillage. Pour la voie de la matière noire, cela signifie que halos sombres, rétroaction baryonique, histoire de formation des galaxies et erreurs systématiques d’observation doivent être coordonnés avec une grande finesse. Pour les approches gravitationnelles sans matière noire, cela signifie qu’un modèle ne peut pas seulement paraître bon sur les RC : il doit aussi rester valable en lentillage faible, dans les lois d’échelle de population et dans les contrôles négatifs.

C’est précisément la motivation de P1. Le rapport ne part ni de « la matière noire est fausse », ni de « EFT a nécessairement raison ». Il met au banc d’essai une proposition testable : la réponse gravitationnelle moyenne de l’EFT laisse-t-elle, dans la fermeture inter-sondes RC→GGL, un signal reproductible et transférable ?

Contexte bibliographique externe : pourquoi la fenêtre RC+GGL est-elle importante ?

La relation d’accélération radiale (RAR) proposée en 2016 par McGaugh, Lelli et Schombert montre une corrélation serrée, avec très faible dispersion, entre l’accélération observée tracée par les courbes de rotation et l’accélération prédite par la matière baryonique. Le couplage baryons–réponse gravitationnelle devient ainsi incontournable pour toute théorie aux échelles galactiques.

Brouwer et al. (2021) ont utilisé le lentillage faible KiDS-1000 pour étendre la RAR à des accélérations plus faibles et à des rayons plus grands, en comparant MOND, la gravité émergente de Verlinde et des modèles LambdaCDM. Ils soulignent aussi que les différences entre galaxies de type précoce et tardif, les halos gazeux et les connexions galaxie–halo restent des enjeux explicatifs majeurs.

Mistele et al. (2024) ont ensuite utilisé le lentillage faible pour inférer les courbes de vitesse circulaire de galaxies isolées ; ils rapportent l’absence de déclin net sur plusieurs centaines de kpc, voire jusqu’à environ 1 Mpc, en accord avec la BTFR. Cela montre que le lentillage faible devient une lecture externe importante pour tester la réponse gravitationnelle à l’échelle des galaxies.

La valeur de P1 ne tient donc pas au fait d’être « le premier à discuter RC et GGL ensemble ». Elle tient au fait de les placer dans un protocole auditable : correspondance fixe, registre des paramètres, fermeture RC-only→GGL, contrôle négatif par shuffle et test de pression P1A avec plusieurs modèles DM.


2 | Que signifie EFT dans P1 ? Il ne s’agit pas de la théorie effective des champs

Ici, EFT désigne la Théorie des filaments d’énergie (Energy Filament Theory), et non la théorie effective des champs (Effective Field Theory) courante en physique. Dans le rapport technique P1, l’usage de l’EFT reste très sobre : la théorie n’entre pas comme théorie finale complète, mais sous la forme réduite d’une paramétrisation observable, ajustable et réfutable de la « réponse gravitationnelle moyenne ».

En termes simples, P1 ne commence pas par discuter toute l’origine microscopique d’une gravité supplémentaire, et ne cherche pas non plus à prouver l’ensemble de l’EFT d’un seul coup. Il pose une question plus étroite et plus dure : si une réponse gravitationnelle supplémentaire moyenne existe aux échelles galactiques, peut-elle d’abord expliquer les RC, puis être transférée pour prédire le GGL ?

Quelle partie de l’EFT P1 saisit-il ?

P1 saisit le « socle gravitationnel moyen » (mean gravity floor) : une contribution moyenne statistiquement stable et transférable entre échantillons.

P1 ne traite pas encore le « socle de bruit » (stochastic / noise floor) : les termes aléatoires, différences individuelles ou dispersions supplémentaires que des processus de fluctuation plus microscopiques pourraient produire.

P1 ne discute pas non plus le mécanisme microscopique complet, les abondances, les durées de vie ni les contraintes cosmologiques globales. C’est la première étape des expériences de la série P, non un verdict final.


3 | Le programme de la série P : pourquoi commencer par le « socle moyen » ?

La série P peut être comprise comme le programme de récupération observationnelle de l’EFT. Elle ne déploie pas toutes les propositions en une seule fois ; elle isole d’abord la partie la plus facilement testable avec des données publiques. La stratégie de P1 consiste à tester d’abord le terme moyen : si la réponse gravitationnelle moyenne ne parvient même pas à se fermer de RC vers GGL, la discussion de termes de bruit ou de mécanismes microscopiques plus complexes manque de point d’entrée solide.

Tableau 1 | Positionnement par niveaux de la série P

Niveau

Question posée

Place dans P1

P1

La réponse gravitationnelle moyenne peut-elle se fermer de RC vers GGL ?

Question principale du rapport actuel

P1A

Si l’on renforce le côté DM, la conclusion reste-t-elle stable ?

Annexe B : test de pression DM 7+1 + DM_STD

Suite de la série P

Le protocole peut-il s’étendre à plus de données, plus de sondes et des erreurs systématiques plus complexes ?

Direction des travaux futurs

Question plus profonde

Comment le terme moyen, les termes de bruit et les mécanismes microscopiques se connectent-ils ?

Hors du périmètre des conclusions de P1


4 | Quelles sont les données ? Que nous disent respectivement RC et GGL ?


4.1 Courbes de rotation (RC) : le « compteur de vitesse » des disques galactiques

Les courbes de rotation enregistrent la vitesse à laquelle gaz et étoiles orbitent autour du centre galactique à différents rayons. Plus la vitesse est élevée, plus la force centripète requise à ce rayon est forte, donc plus la gravité effective doit l’être. P1 utilise la base SPARC ; après prétraitement, elle comprend 104 galaxies, 2 295 points de vitesse, répartis en 20 bins RC.


4.2 Lentillage faible (GGL) : une « balance gravitationnelle » à plus grande échelle

Le lentillage faible galaxie-galaxie mesure la façon dont les galaxies d’avant-plan courbent légèrement la lumière des galaxies d’arrière-plan. Il correspond à une réponse gravitationnelle projetée à plus grande échelle, celle des halos, et ne dépend pas des détails de la dynamique du gaz dans les disques. P1 utilise les données GGL publiques de KiDS-1000 / Brouwer et al. (2021) : 4 bins de masse stellaire, 15 rayons par bin, soit 60 points au total, avec la covariance complète.


4.3 Correspondance fixe : pourquoi le passage de 20 bins RC à 4 bins GGL est-il crucial ?

P1 relie les 20 bins RC aux 4 bins GGL par une règle fixe : chaque bin GGL correspond à 5 bins RC, moyennés avec des poids fondés sur le nombre de galaxies. Cette correspondance est maintenue identique pour tous les modèles ; elle constitue une contrainte dure pour le test de fermeture et la comparaison équitable.

Pourquoi ne pas ajuster la correspondance après coup ?

Si l’on autorisait le choix après coup de « quels bins RC correspondent à quels bins GGL », un modèle pourrait fabriquer une fermeture en réarrangeant les correspondances. P1 verrouille donc à l’avance la correspondance 20→4 et la brise volontairement par un contrôle négatif shuffle, afin de vérifier si le signal de fermeture dépend réellement d’une correspondance physiquement raisonnable.


5 | Modèles et méthode : que compare réellement P1 ?


5.1 Côté EFT : une réponse gravitationnelle moyenne de faible dimension

Côté EFT, un terme de vitesse supplémentaire de faible dimension décrit la réponse gravitationnelle moyenne. Sa forme est contrôlée par une fonction noyau sans dimension f(r/ℓ), où ℓ est une échelle globale ; son amplitude est donnée par bin RC. Les différents noyaux représentent différentes pentes initiales, vitesses de transition et queues de longue portée, afin de servir de tests de robustesse.


5.2 Côté DM : il faut distinguer la comparaison principale et l’annexe P1A

Dans la comparaison principale, DM_RAZOR est une ligne de base NFW minimale et auditable : relation c–M fixée, sans dispersion halo-to-halo, contraction adiabatique, cœur de rétroaction, non-sphéricité ni terme environnemental. Son avantage est de contrôler les degrés de liberté et de faciliter la reproduction ; sa limite est de ne pas représenter tous les modèles LambdaCDM ni tous les modèles de halos de matière noire.

Dans l’annexe B (P1A), le côté DM devient donc un ensemble de tests de pression standardisés. Sans modifier la correspondance partagée ni le protocole de fermeture, on ajoute progressivement des branches d’amélioration de faible dimension : SCAT, AC, FB, HIER_CMSCAT, CORE1P, le nuisance de lentillage m et la base combinée DM_STD, tout en conservant EFT_BIN comme comparateur. On peut lire P1A ainsi : il ne s’agit pas de comparer uniquement à une base DM minimale, mais de mesurer un ensemble de mécanismes DM courants et auditables selon le même critère de fermeture.

Formulation précise de la conclusion utilisée ici

Texte principal : la famille EFT surpasse nettement le DM_RAZOR minimal dans la comparaison principale.

Annexe B / P1A : dans plusieurs branches d’amélioration DM de faible dimension et auditables, ainsi que dans le test DM_STD, certains ajustements conjoints DM s’améliorent ; toutefois l’intensité de fermeture n’efface pas l’avantage de l’EFT_BIN.

La formulation la plus prudente est donc la suivante : dans le cadre des données, de la correspondance, du registre de paramètres et du protocole de fermeture de P1/P1A, la réponse gravitationnelle moyenne de l’EFT montre une cohérence inter-données plus forte ; cela ne revient pas à exclure tous les modèles de matière noire.


5.3 Test de fermeture : la logique expérimentale la plus importante de P1

1. Ajuster uniquement les RC et obtenir un ensemble d’échantillons postérieurs RC-only.

2. Interdire tout réajustement avec le GGL et utiliser directement le postérieur RC pour prédire le GGL.

3. Calculer, avec la covariance complète, le score de prédiction GGL logL_true sous la correspondance correcte.

4. Permuter aléatoirement la correspondance RC-bin→GGL-bin et calculer le contrôle négatif logL_perm.

5. Soustraire les deux pour obtenir l’intensité de fermeture : ΔlogL_closure = <logL_true> − <logL_perm>.

Analogie simple

Le test de fermeture ressemble à un examen passé dans deux salles : le modèle apprend d’abord une règle dans la salle RC, puis doit répondre dans la salle GGL. S’il a vraiment appris une règle partagée, et non une astuce locale, il doit encore bien répondre dans la seconde salle ; si l’on mélange volontairement la correspondance entre les salles, l’avantage doit disparaître.


5.4 Avant les tableaux techniques : quatre points d’entrée à retenir

Tableau 5.4 | Itinéraire de lecture des prochains tableaux techniques en format paysage

Point d’entrée

Ce qu’il faut regarder

Pourquoi c’est important

Tableau S1a

Score total de l’ajustement conjoint RC+GGL

Répond à : « qui explique le mieux les deux jeux de données ensemble ? »

Tableau S1b

Intensité de fermeture, shuffle et balayages de robustesse

Répond à : « ce qui est appris sur RC peut-il se transférer vers GGL ? »

Tableau B0

Définition des multiples branches d’amélioration DM dans P1A

Évite de réduire P1 à « une comparaison avec le seul DM_RAZOR minimal ».

Tableau B1

Scoreboard de fermeture et d’ajustement conjoint dans P1A

Vérifie si le renforcement du côté DM élimine l’avantage de fermeture.

Note de mise en page

Les pages suivantes passent en orientation paysage afin de conserver les grands tableaux du rapport original sans supprimer de colonnes ni les compresser jusqu’à les rendre illisibles. Le corps du texte fournit déjà une lecture pour le grand public ; les tableaux techniques en paysage sont destinés aux lecteurs qui veulent vérifier les chiffres et les branches de modèles.

Figure 0.1 | Comprendre en une image le flux du test de fermeture de P1

Note : la chaîne supérieure correspond au « test de fermeture » (ajustement avec les RC seulement → prédiction du GGL au moyen du postérieur RC). La chaîne inférieure correspond à l’« ajustement conjoint » (RC+GGL évalués ensemble). À droite, la correspondance réelle est comparée à la correspondance mélangée pour obtenir l’intensité de fermeture ΔlogL.


6 | Tableaux techniques clés : tableaux principaux du rapport original et tableaux P1A

Tableau S1a | Indicateurs principaux de l’ajustement conjoint (RC+GGL, Strict ; conservé depuis le rapport original)

Modèle (workspace)

Noyau W

k

logL_total conjoint (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tableau S1b | Indicateurs de fermeture et de robustesse (Strict ; conservés depuis le rapport original)

Modèle (workspace)

ΔlogL de fermeture (true-perm)

ΔlogL après shuffle de contrôle négatif

Plage de ΔlogL — balayage σ_int

Plage de ΔlogL — balayage R_min

Plage de ΔlogL — balayage cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Tableau B0 | Définition des branches d’amélioration DM dans P1A (conservée depuis l’annexe B du rapport original)

Workspace

dm_model

Nouveaux paramètres (≤1)

Motivation physique (cœur)

Principe de mise en œuvre (audit-friendly)

DM_RAZOR

NFW (fixed c–M, no scatter)

Base de halo LambdaCDM minimale et auditable ; utilisée comme comparateur strict face à EFT

Correspondance partagée fixée ; registre de paramètres strict ; baseline utilisée seulement pour la comparaison relative

DM_RAZOR_SCAT

NFW + dispersion c–M (legacy)

σ_logc

La relation c–M présente une dispersion ; elle est approchée par une dispersion log-normale à un paramètre

≤1 nouveau paramètre ; correspondance partagée conservée ; gain de fermeture utilisé comme critère d’acceptation

DM_RAZOR_AC

NFW + contraction adiabatique (legacy)

α_AC

L’infall baryonique peut provoquer une contraction adiabatique du halo ; approchée par une intensité à un paramètre

≤1 nouveau paramètre ; correspondance inchangée ; variations AICc/BIC et gain de fermeture rapportés

DM_RAZOR_FB

NFW + cœur de rétroaction (legacy)

log r_core

La rétroaction peut former un cœur dans la région interne ; approximée par une échelle de cœur à un paramètre

≤1 nouveau paramètre ; même protocole fermeture/contrôle négatif ; l’amélioration RC-only n’est pas l’unique objectif

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Forme hiérarchique plus standard c_i∼logN(c(M_i),σ_logc) ; affecte simultanément le postérieur conjoint RC et GGL

Prior explicite ; c_i latents marginalisés ; faible dimension et auditabilité conservées

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

Utilise un proxy de cœur à un paramètre pour l’effet principal de la rétroaction baryonique, afin d’éviter les détails de formation stellaire de haute dimension

Références standard ; ≤1 nouveau paramètre ; lié au test de fermeture

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear (GGL)

Absorbe une systématique clé du côté lentillage faible par un paramètre effectif, afin de réduire le risque de prendre une systématique pour de la physique

Nuisance explicitement comptabilisé ; aucune influence inverse sur RC ; priorité à la robustesse de fermeture

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Intègre simultanément les trois objections courantes les plus fréquentes dans une baseline standard qui reste de faible dimension

Registre de paramètres et critères d’information rapportés ensemble ; la fermeture reste l’indicateur principal ; comparateur DM défensif le plus fort

Tableau B1 | Scoreboard P1A (plus grand = meilleur ; conservé depuis l’annexe B du rapport original)

Branche de modèle (workspace)

Δk

RC-only best logL_RC (Δ)

Intensité de fermeture ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Comment lire le tableau B1 (scoreboard P1A)

• Δk : nouveaux degrés de liberté (plus grand signifie un modèle plus complexe ; plus complexe ne veut pas dire meilleur).

• Lire surtout deux colonnes : l’intensité de fermeture ΔlogL_closure(Δ) (plus grand = meilleure cohérence de transfert) et Joint best logL_total(Δ) (score total de l’ajustement conjoint).

• Le (Δ) entre parenthèses indique l’écart par rapport à DM_RAZOR, pour faciliter la comparaison directe.

• La question principale du tableau est : quand la baseline DM est « raisonnablement renforcée », l’avantage de fermeture disparaît-il ?

• Indice de lecture : le score conjoint de DM_STD augmente nettement, mais son intensité de fermeture baisse ; EFT_BIN conserve une intensité de fermeture plus élevée.

En une phrase : dans cette famille d’améliorations DM de faible dimension et auditables, améliorer l’ajustement conjoint ne produit pas automatiquement une fermeture plus forte ; la fermeture, c’est-à-dire la transférabilité, reste le critère clé.


7 | Comment lire les principaux résultats ?

7.1 Ajustement conjoint : sur les deux jeux de données, EFT obtient un meilleur score dans la comparaison principale

Le tableau S1a et la figure S4 montrent qu’avec les mêmes données, la même correspondance partagée et une taille de paramétrisation comparable, la famille EFT obtient un ΔlogL_total conjoint de 1155–1337 par rapport à DM_RAZOR. Pour le lecteur général, cela signifie que, selon la même règle de score appliquée aux deux jeux de données RC et GGL, les modèles EFT de la comparaison principale obtiennent un score total plus élevé.


7.2 Test de fermeture : ce que P1 veut surtout souligner, c’est la transférabilité

Une forte intensité de fermeture signifie que le modèle peut mieux prédire le GGL à partir des seuls paramètres inférés depuis les RC, sans revoir le GGL. Dans le rapport P1, ΔlogL_closure vaut 172–281 pour EFT et 127 pour DM_RAZOR. Ce résultat est plus important que le simple fait que « chacun ajuste bien ses données », car il limite la liberté du modèle sur le second jeu de données.


7.3 Contrôle négatif : pourquoi l’effondrement du signal est-il une bonne nouvelle ?

Lorsque P1 mélange aléatoirement la correspondance entre groupes RC-bin→GGL-bin, le signal de fermeture de l’EFT tombe à l’ordre de 6–23. Pour le grand public, cette étape agit comme un anti-triche : si l’avantage de fermeture venait seulement du code, des unités, de la covariance ou d’un hasard d’ajustement, il pourrait rester présent après mélange. Or l’avantage s’effondre, ce qui indique qu’il dépend de la bonne correspondance.

Figure S3 | Intensité de fermeture (plus grand = meilleur) : avantage moyen en log-vraisemblance de la prédiction RC-only → GGL.

Comment lire cette figure

Cette figure est au cœur de P1. Plus la barre est haute, mieux l’information apprise à partir des RC se transfère vers le GGL.

La famille EFT est globalement au-dessus de DM_RAZOR : dans l’expérience « apprendre d’abord sur RC, puis prédire GGL », la fermeture inter-sondes de l’EFT est plus forte.

Figure S4 | Avantage d’ajustement conjoint (plus grand = meilleur) : best logL_total de RC+GGL par rapport à DM_RAZOR.

Comment lire cette figure

Cette figure regarde le score total après ajustement conjoint RC et GGL.

Toute la famille EFT est nettement au-dessus de 0, ce qui indique que l’avantage de l’EFT dans la comparaison principale n’est pas un phénomène local isolé, mais la performance globale de l’analyse conjointe.

Figure R1 | Contrôle négatif : le signal de fermeture diminue fortement après mélange des groupes.

Comment lire cette figure

Cette figure montre que, dès que la bonne relation de binning RC↔GGL est mélangée, le signal de fermeture chute nettement.

Cela rend le résultat de P1 plus proche d’une cohérence réelle dans la correspondance entre jeux de données que d’une coïncidence numérique obtenue avec n’importe quelle correspondance.


8 | Robustesse et contrôles : comment P1 évite-t-il le simple « bel ajustement » ?

La critique la plus naturelle d’un rapport technique est la suivante : l’avantage vient-il d’un choix de bruit, d’une portion centrale des données, d’un traitement particulier de la covariance ou d’un surajustement ? P1 répond à cette question par plusieurs familles de tests de pression.

Tableau 2 | Comment lire les tests de robustesse et les contrôles négatifs de P1

Test

Question qu’il cherche à écarter

Lecture

Balayage σ_int

Si les RC contiennent une dispersion inconnue supplémentaire, la conclusion reste-t-elle stable ?

Après élargissement des erreurs RC, le classement de l’EFT et l’ordre de grandeur de son avantage restent stables.

Balayage R_min

Si l’on ne fait pas entièrement confiance à la région centrale des galaxies, la conclusion reste-t-elle stable ?

Après découpe de la région centrale, EFT conserve un avantage positif.

Balayage cov-shrink

Si l’estimation de la covariance GGL est incertaine, la conclusion reste-t-elle stable ?

Lorsque la covariance est contractée vers une matrice diagonale, l’avantage reste peu sensible.

Échelle d’ablation

EFT ajuste-t-elle par complexité inutile ?

EFT_BIN complet est justifié par les critères d’information.

Prédiction leave-one-out (LOO)

Le modèle ne sait-il expliquer que les données déjà vues ?

Après retrait d’un bin GGL, il montre encore une bonne capacité de généralisation.

RC-bin shuffle

La fermeture vient-elle d’une correspondance réelle ?

La fermeture baisse après mélange des groupes, ce qui soutient la dépendance à la correspondance.

Figure R2 | Plage de ΔlogL_total lors du balayage de σ_int (plus grand = meilleur).

Comment lire cette figure

Teste si l’avance de l’EFT subsiste lorsque le réglage de dispersion intrinsèque des RC varie.

Figure R3 | Plage de ΔlogL_total lors du balayage de R_min (plus grand = meilleur).

Comment lire cette figure

Teste si l’avantage de l’EFT reste stable après découpe des régions centrales complexes.

Figure R4 | Plage de ΔlogL_total lors du balayage cov-shrink (plus grand = meilleur).

Comment lire cette figure

Teste si le classement est sensible à la façon de traiter la covariance du lentillage faible.

Figure R5 | Échelle d’ablation de l’EFT_BIN (AICc, plus petit = meilleur).

Comment lire cette figure

Teste si EFT_BIN complet est nécessaire pour expliquer les données, plutôt qu’un simple ajout gratuit de paramètres.

Figure R6 | LOO : distribution de log-vraisemblance des bins laissés de côté.

Comment lire cette figure

Teste si le modèle garde une capacité prédictive sur des bins GGL non vus.

Figure R7 | Contrôle négatif : le mélange de la correspondance fait nettement baisser le mean logL_true de fermeture.

Comment lire cette figure

Montre en outre, du point de vue de mean logL_true, que la fermeture dépend de la bonne correspondance entre données.

9 | P1A : pourquoi la présence de plusieurs modèles DM en annexe est-elle une correction clé ?


Cette section ne répond pas à « EFT n’a-t-il gagné que contre un DM_RAZOR minimal ? ». Elle demande plutôt si les conclusions du test de fermeture et de l’ajustement conjoint changent lorsque l’on renforce la base DM dans un cadre de faible dimension, reproductible et doté d’un registre de paramètres clair (P1A). Autrement dit, P1A vise à réduire l’objection « vous avez seulement choisi une base DM trop faible » et à déplacer la discussion vers : « sous une série d’améliorations DM auditables, les performances de fermeture restent-elles différentes ? »

La conception de P1A ne prétend pas épuiser toutes les possibilités de modélisation des halos LambdaCDM, ni transformer le côté DM en ajusteur de haute dimension non auditable. Elle retient des améliorations de faible dimension, reproductibles et explicitement comptabilisées : dispersion de concentration, contraction adiabatique, cœur de rétroaction, prior hiérarchique de dispersion c–M, proxy de cœur à un paramètre, nuisance de calibration du cisaillement en lentillage faible, ainsi que la combinaison DM_STD.

Lecture principale de P1A

Parmi les trois branches legacy, seule feedback/core apporte un faible gain net d’intensité de fermeture ; SCAT et AC n’apportent pas de gain net de fermeture.

DM_HIER_CMSCAT, DM_RAZOR_M et DM_CORE1P ont peu d’effet sur l’intensité de fermeture ou ne montrent pas de gain net significatif.

DM_STD peut améliorer fortement le joint logL, mais son intensité de fermeture baisse ; cela suggère qu’il augmente surtout la flexibilité de l’ajustement conjoint, et non la puissance de prédiction transférée RC→GGL.

Dans le tableau B1 de P1A, EFT_BIN conserve une intensité de fermeture plus élevée et un avantage en ajustement conjoint ; la proposition centrale de P1 ne doit donc pas être réduite à « il n’a gagné que contre le DM_RAZOR minimal ».

Figure B1 | Scoreboard P1A : ΔlogL de fermeture et conjoint par rapport à la baseline (plus grand = meilleur).

Comment lire cette figure

Cette figure montre les performances de plusieurs branches d’amélioration DM par rapport à la baseline.

Sa signification n’est pas « exclure toute DM », mais montrer que, dans l’ensemble des améliorations DM de faible dimension et auditables choisies par P1A, le renforcement de DM n’élimine pas l’avantage de fermeture de l’EFT_BIN.


10 | La signification de l’expérience P1 : pourquoi cela vaut-il la peine ?

10.1 Signification méthodologique : placer la fermeture inter-sondes au-dessus de l’ajustement mono-sonde

Les débats aux échelles galactiques se réduisent trop facilement à cette question : un modèle peut-il ajuster un ensemble de courbes de rotation ? P1 élève la question d’un niveau : les paramètres appris à partir des RC peuvent-ils prédire le lentillage faible sans réajuster le GGL ? P1 passe ainsi d’un « concours d’ajustement » à un « test de prédiction transférée ».

10.2 Signification pour la transparence : faire de la chaîne vérifiable une partie du résultat

Une contribution importante de P1 est de publier ensemble les données, tableaux, figures, étiquettes d’exécution, contrôles négatifs, paquet de reproduction et chaîne d’audit. C’est crucial pour les partisans comme pour les critiques : la discussion peut revenir aux mêmes données publiques, à la même correspondance, aux mêmes scripts et aux mêmes indicateurs, au lieu de comparer seulement des slogans.

10.3 Signification physique : un test de pression fort pour les gravités sans matière noire

Dans la direction des gravités sans matière noire, beaucoup de modèles peuvent expliquer une partie des courbes de rotation ou de la RAR. Le plus difficile est de passer en même temps par la lecture du lentillage faible et de montrer, sous contrôle négatif, que le signal dépend de la correspondance correcte. L’intérêt de P1 est de placer la réponse gravitationnelle moyenne de l’EFT dans un protocole comparable à un « examen externe » : les RC sont le terrain d’entraînement, le GGL est le terrain de transfert, et le shuffle est le terrain anti-triche.


10.4 Est-ce une expérience importante pour le domaine des gravités sans matière noire ?

Avec prudence : si le traitement des données, le paquet de reproduction et le protocole de fermeture de P1 résistent à une revue externe, alors P1 peut être considéré comme une expérience RC+GGL de fermeture qui mérite une attention sérieuse dans les approches de gravité modifiée ou sans matière noire. Son importance ne réside pas dans une phrase du type « renverser la matière noire », mais dans un critère inter-sondes reproductible, contestable et extensible.

Existe-t-il déjà un cadre de prédiction RC+GGL avec un niveau de fermeture aussi élevé ?

Il existe déjà des cadres et traditions observationnelles pertinents : MOND/RAR organise très bien de nombreux phénomènes de courbes de rotation ; les travaux RAR avec le lentillage faible KiDS-1000 ont aussi comparé MOND, la gravité émergente de Verlinde et LambdaCDM ; LambdaCDM peut également expliquer une partie des phénomènes de lentillage faible ou de dynamique par la connexion galaxie–halo, les halos gazeux et la modélisation de la rétroaction.

Mais la revendication précise de P1 n’est pas « aucun autre cadre au monde ne peut expliquer RC+GGL ». Elle est plutôt : sous le protocole public propre à P1 — correspondance fixe, fermeture RC-only→GGL, contrôle négatif shuffle, registre de paramètres et test de pression P1A multi-DM — EFT rapporte une performance de fermeture plus forte.

Autrement dit, ce que P1 soumet le plus utilement à l’examen externe est un protocole comparatif concret et reproductible. La prochaine étape importante serait de voir si MOND/RAR, LambdaCDM/HOD, des simulations hydrodynamiques ou d’autres cadres de gravité modifiée atteignent, sous le même protocole, un score de fermeture égal ou supérieur.


11 | Ce que P1 permet de conclure — et ce qu’il ne permet pas de conclure

Tableau 3 | Les limites des conclusions de P1

Ce que l’on peut conclure

Dans les données RC+GGL, la correspondance fixe et le protocole principal de P1, la famille EFT présente un ajustement conjoint et une intensité de fermeture plus élevés que le DM_RAZOR minimal.

Ce que l’on peut conclure

Dans l’ensemble des améliorations DM de faible dimension et auditables de P1A, plusieurs renforcements DM n’éliminent pas l’avantage de fermeture de l’EFT_BIN.

Ce que l’on peut conclure

Le contrôle négatif par shuffle montre que le signal de fermeture dépend de la bonne correspondance entre données, et non d’une correspondance arbitraire.

Ce que l’on ne peut pas conclure

On ne peut pas dire que P1 a renversé tous les modèles de matière noire. P1A n’épuise toujours pas les possibilités de non-sphéricité, dépendance à l’environnement, connexion galaxie–halo complexe, rétroaction de haute dimension ou simulation cosmologique complète.

Ce que l’on ne peut pas conclure

On ne peut pas dire que la théorie complète EFT a été prouvée par premiers principes. P1 ne teste que la couche phénoménologique de la réponse gravitationnelle moyenne.

Ce que l’on ne peut pas conclure

On ne peut pas dire que toutes les erreurs systématiques ont été exclues. P1 fournit seulement des preuves de robustesse dans le périmètre des tests de pression et audits listés.


12 | Questions fréquentes : ce que les lecteurs demandent le plus souvent

Q1 : Cela signifie-t-il que « la matière noire n’existe pas » ?

Non. Les conclusions de P1 doivent rester limitées aux données, au protocole et aux modèles de comparaison utilisés ici. P1A va plus loin que le DM_RAZOR minimal, mais ne représente toujours pas tous les modèles possibles de matière noire.

Q2 : Cela signifie-t-il que « EFT est déjà prouvée » ?

Non plus. P1 teste EFT comme une paramétrisation de la réponse gravitationnelle moyenne et montre une performance plus forte dans la fermeture RC→GGL ; le mécanisme microscopique et la théorie complète ne font pas partie de ses conclusions.

Q3 : Pourquoi ne pas parler directement d’une significativité en σ ?

P1 utilise un score de vraisemblance unifié, des critères d’information et des écarts de fermeture. ΔlogL mesure un avantage relatif sous une même règle de score ; ce n’est pas l’équivalent d’une valeur σ unique.

Q4 : Pourquoi mélanger les RC-bin→GGL-bin ?

C’est un contrôle négatif. Un vrai signal inter-sondes doit dépendre de la bonne correspondance ; s’il restait aussi fort après mélange, cela suggérerait au contraire un biais d’implémentation ou un faux signal statistique.

Q5 : Quelle devrait être la prochaine étape la plus importante pour P1 ?

Étendre le même protocole à davantage de données, davantage de comparateurs DM, des erreurs systématiques plus complexes et d’autres cadres de gravité modifiée ; surtout, permettre à des équipes externes de refaire le test avec le même indicateur de fermeture.


13 | Petit glossaire

Tableau 4 | Petit glossaire

Terme

Explication en une phrase

Courbes de rotation (RC)

Relation rayon–vitesse dans un disque galactique, utilisée pour inférer la gravité effective dans le disque.

Lentillage faible (GGL)

Mesure la distribution moyenne de gravité ou de masse autour des galaxies d’avant-plan à partir des distorsions statistiques des formes de galaxies d’arrière-plan.

Test de fermeture

Prédire le GGL au moyen du postérieur RC et comparer avec un contrôle négatif à correspondance mélangée.

Contrôle négatif

Détruire volontairement une structure clé pour voir si le signal disparaît ; sert à écarter les faux signaux.

Halo NFW

Profil de densité de halo de matière noire couramment utilisé dans les modèles de matière noire froide.

Relation c–M

Relation entre la concentration c d’un halo de matière noire et sa masse M ; autoriser ou non la dispersion affecte la flexibilité du modèle.

DM_STD

Branche de test de pression DM standardisée dans P1A, combinant plusieurs améliorations DM de faible dimension et un nuisance de lentillage.

ΔlogL

Écart de log-vraisemblance entre deux modèles sous la même règle de score ; une valeur positive indique que le premier est meilleur.

Covariance

Description matricielle des corrélations entre points de données ; les données de lentillage faible exigent généralement la covariance complète.


14 | Parcours de lecture conseillé et points d’entrée pour citer

1. Lire d’abord les sections 0–2 pour comprendre la question posée par P1 et le positionnement prudent de l’EFT dans P1.

2. Examiner ensuite les figures S3 et S4 ainsi que les tableaux S1a/S1b pour comprendre l’intensité de fermeture, l’ajustement conjoint et le contrôle négatif.

3. Pour savoir si « la base DM est trop faible », aller directement à la section 9 et au tableau B1 / à la figure B1.

4. Pour une vérification technique, revenir au rapport technique P1 v1.1, au Tables & Figures Supplement et au full_fit_runpack.

Principaux points d’entrée archivés

Rapport technique P1 (niveau publication, Concept DOI) : 10.5281/zenodo.18526334

Paquet complet de reproduction P1 (Concept DOI) : 10.5281/zenodo.18526286

Base de connaissances structurée EFT (facultative, Concept DOI) : 10.5281/zenodo.18853200

Note de licence : le rapport technique est sous CC BY-NC-ND 4.0 ; le paquet complet de reproduction est sous CC BY 4.0 (selon le rapport technique et les archives Zenodo).


15 | Références et contexte externe

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.