8.12 Ensembles de réserve, Mise en aveugle, Contrôles nuls et Réplication entre chaînes d’analyse : comment empêcher l’EFT de n’être qu’une « théorie qui sait raconter des histoires » | Théorie des filaments d’énergie

I. Conclusion de la section

Cette section n’ajoute plus de nouvelle ligne de verdict au niveau des objets ; elle apporte un ensemble de règles d’examen plus froides, plus dures et moins complaisantes. Si EFT veut encore inscrire comme « soutien » les résidus de décalage vers le rouge, la fermeture de la Carte de base partagée, la stratification structurelle, les fines structures du voisinage de l’horizon, les seuils des Dispositifs de frontière et les garde-fous quantiques abordés de 8.4 à 8.11, elle doit d’abord accepter quatre garde-fous communs : les Ensembles de réserve ne doivent pas servir à réajuster le protocole après coup ; la Mise en aveugle ne doit pas permettre de regarder la réponse en secret ; les Contrôles nuls ne doivent pas devenir aussi significatifs que le résultat principal ; la Réplication entre chaînes d’analyse ne doit pas laisser une seule voie monopoliser la vérité. Sans ces quatre portes, le volume 8, aussi convaincant soit-il, risque encore de n’être qu’un récit à forte puissance explicative ; une fois ces portes franchies, il commence seulement à ressembler à une théorie candidate prête à être examinée.

II. Après le niveau des objets, il faut encore ajouter le verrou méthodologique général

Les sections 8.4 à 8.11 ont déjà posé sur la table les terrains du niveau des objets qu’EFT souhaite le plus remporter et où elle peut aussi se blesser le plus vite : le Terme commun sans dispersion entre sondes, l’axe TPR et les résidus PER, la Carte de base partagée rotation–lentilles–fusions, la genèse structurelle, le cliché de fond et la tomographie environnementale, les Signatures distinctives du voisinage de l’horizon et des frontières, les Dispositifs de frontière, le Vide en champ fort, ainsi que la propagation quantique et le garde-fou de non-communication. Mais écrire seulement « ce qu’il faut mesurer », « ce qui compterait comme soutien » et « ce qui causerait un dommage structurel » ne suffit pas. La langue d’EFT possède une forte puissance explicative ; or les théories très explicatives ne craignent pas d’abord le manque de cas, mais la tentation, lorsque les cas deviennent nombreux, de pouvoir tout raconter après coup.

Il manque donc au parcours précédent un verrou général : tout résultat qui prétend être comptabilisé doit d’abord demander s’il a été obtenu sous les mêmes garde-fous méthodologiques. Ce n’est qu’après avoir posé ce verrou que le bilan final peut légitimement distinguer « soutien direct », « resserrement » et « dommage structurel ». Sinon, il risque de devenir un simple registre de mérites sélectionnés après coup.

III. Cette section n’ajoute pas de famille expérimentale ; elle ajoute une discipline d’examen

Cette section ne doit pas devenir un manuel de statistique. Ce serait refroidir brutalement le volume 8 et manquer ce qu’il doit réellement faire. La section 8.12 n’est pas là pour enseigner ce que sont un ensemble d’entraînement, un ensemble de test, une significativité, un facteur de Bayes ou une moyenne de modèles ; elle fait quelque chose de plus inconfortable : empêcher EFT de se tromper elle-même.

Les quatre règles de 8.12 ne sont donc pas des gestes techniques isolés. Elles relèvent d’une même discipline : figer le protocole avant les résultats ; après les résultats, tenir les comptes, sans changer de discours. La façon de choisir les échantillons, les objets admis dans l’échantillon principal, les bandes de fréquence ou les tranches de décalage vers le rouge réservées, les indicateurs environnementaux inclus dans l’analyse principale, les clauses d’exclusion valides et les règles de score doivent être écrits avant d’observer le résultat principal. Sans cela, les Ensembles de réserve sont mangés en douce, la Mise en aveugle devient une mise en scène, les Contrôles nuls sont choisis parmi les plus faibles, et la Réplication entre chaînes d’analyse se réduit à faire tourner deux fois le même biais.

Il est tout aussi essentiel de séparer les rôles. Beaucoup d’expériences et d’observations du volume 8 se prêtent naturellement à une architecture commune : un groupe amont ne publie des fiches de prédiction qu’à partir de l’environnement, de la géométrie et de variables proxy déjà figées ; un groupe de mesure extrait les lectures sans connaître le contenu de ces fiches ; un groupe d’arbitrage aligne seulement à la fin prédictions et résultats selon une grille de score préenregistrée. Toutes les lignes n’ont pas à copier mécaniquement ces trois groupes, mais cette ossature rappelle le point le plus important de la section : la prédiction doit précéder les belles figures, et la règle doit précéder le récit séduisant.

IV. Premier garde-fou : les Ensembles de réserve — ne pas réajuster le protocole à partir du résultat

Dans 8.12, les Ensembles de réserve ne sont pas un simple contrôle de généralisation. Ils sont un couteau destiné à bloquer le réajustement a posteriori. L’erreur la plus facile pour EFT n’est pas de ne voir aucun signal ; c’est de voir une faible direction, puis de retoucher l’échantillon, les strates d’environnement, les seuils, le fond de référence ou la famille d’ajustement, jusqu’à ce que cette direction devienne une belle figure. Les Ensembles de réserve existent pour fermer cette issue : on peut déterminer le protocole sur la partie d’entraînement, mais on ne peut pas ramener la partie tenue en réserve pour réparer ce que l’on avait déjà annoncé.

Dans le domaine cosmologique, un Ensemble de réserve peut être une fenêtre de décalage vers le rouge, une classe de sources, une région du ciel, une version de relevé, voire une chaîne de distances entièrement indépendante. Dans l’univers extrême, il peut s’agir d’objets, d’époques, de secteurs annulaires, de fusions d’amas ou de niveaux environnementaux tenus à part. Dans les expériences de laboratoire et les lignes quantiques, il peut prendre la forme d’une fenêtre de paramètres, d’une classe de matériaux, d’un instrument, ou d’un ensemble de positions de balayage proches du seuil mais dont l’étiquette n’est pas rendue publique. Les formes diffèrent ; la discipline reste unique : la réserve vérifie, elle ne réajuste pas.

Le résultat de réserve qui ajoute réellement du crédit à EFT n’est pas une tendance déjà vue dans l’entraînement et qui resterait « un peu ressemblante ». Il doit conserver le sens, l’ordre et le protocole. Si le Terme commun sans dispersion de 8.4 est bien un fond commun, alors, dans une bande, une fenêtre d’événements ou une station tenue en réserve, il doit au minimum préserver le même sens et la même fenêtre. Si l’axe TPR de 8.5 peut réellement absorber le fond principal, alors, dans une classe de sources ou une région du ciel réservée, l’α commun ne doit pas changer aussitôt de discours. Si la Carte de base partagée de 8.6 n’est pas un collage de cas particuliers, alors une carte figée appliquée à des objets tenus en réserve ne doit pas exiger immédiatement une nouvelle couche de rustines. À l’inverse, si la tendance se retourne, se désordonne ou exige une nouvelle sélection dès qu’elle entre dans la réserve, elle cesse d’être une conclusion principale et redevient un indice.

Il faut ajouter ceci : on ne doit pas réserver seulement la partie la plus facile à réussir. Si la théorie garde pour la fin les échantillons les plus propres, les plus familiers et les plus dociles, tout en utilisant dès l’entraînement les régions du ciel à haut risque, les bandes difficiles à calibrer, les objets complexes et les fenêtres de paramètres proches du seuil pour multiplier les essais, alors la réserve est déjà contaminée. Un véritable Ensemble de réserve doit inclure de façon active les unités les plus susceptibles de contredire la théorie, car le but du volume 8 n’est pas d’augmenter le taux de réussite affiché, mais de durcir les conditions de victoire et de défaite.

V. Deuxième garde-fou : la Mise en aveugle — laisser parler la prédiction avant la belle image

La valeur de la Mise en aveugle n’est pas d’être formellement « plus scientifique » ; elle est de forcer la théorie à dire à l’avance ce qui comporte un risque réel. EFT contient trop de lieux où il serait facile, après avoir vu une figure, d’ajouter une phrase explicative : le terme commun ressemble à un renforcement environnemental, donc on dit qu’on l’attendait ; un biais semble plus fort dans les environnements de nœuds, donc on dit que le squelette devait le produire ; une plateforme présente un plateau après le seuil, donc on dit que cela ressemble bien à une discrétisation par seuil. Si ces phrases n’ont pas été écrites avant le résultat, ce ne sont pas des prédictions ; ce sont des formulations rétrospectives.

La Mise en aveugle exigée par 8.12 ne consiste donc pas seulement à masquer des noms de fichiers ou à mélanger les étiquettes des échantillons. Pour EFT, le point décisif est une Mise en aveugle structurée en trois temps : amont, mesure, arbitrage. En amont, la théorie ne peut utiliser que des indicateurs environnementaux, des informations géométriques, des paramètres de matériau ou des comptes historiques déjà figés pour écrire une fiche de prédiction : telle strate devrait être plus forte, telle autre plus faible ; le sens attendu est-il le même ou opposé ; le résultat doit-il rester sans dispersion ; doit-il apparaître dans la même fenêtre ? À l’étape de mesure, les personnes qui extraient le signal ne connaissent pas cette fiche. À l’étape d’arbitrage, un tiers compte enfin les réussites, les erreurs de sens et les tirs à vide selon les règles gelées. C’est seulement ainsi qu’EFT place réellement sa propre théorie en jeu.

La forme concrète de la Mise en aveugle peut varier selon les blocs. En 8.4 et 8.5, on peut masquer les strates environnementales et les classes de sources. De 8.6 à 8.9, on peut masquer le champ directionnel du squelette, la phase de fusion, la hiérarchie de la tache froide, le gabarit d’orientation au voisinage de l’horizon ou le classement des objets. En 8.10 et 8.11, il est plus pertinent de masquer les lots de matériaux, les niveaux de seuil, l’ordre de pilotage, les niveaux de propreté des liaisons, voire l’appartenance à une fenêtre de paramètres tenue en réserve. L’uniformité de forme n’est pas l’enjeu ; l’uniformité de discipline l’est : dire d’abord ce qui doit arriver, puis vérifier si cela arrive, au lieu de regarder d’abord ce qui apparaît et d’expliquer ensuite qu’on l’avait toujours su.

La Mise en aveugle possède aussi une valeur souvent négligée : elle oblige EFT à distinguer ce qui peut être prédit en amont de ce qui peut être expliqué après coup. Sur le papier, les deux peuvent ressembler à « avoir eu raison », mais leur statut scientifique n’est pas le même. Le premier prend un risque avant le résultat ; le second cherche, après le résultat, la syntaxe capable de l’accueillir. Ce que protège 8.12, c’est précisément le premier, car lui seul peut véritablement modifier la probabilité de succès d’une théorie.

VI. Troisième garde-fou : les Contrôles nuls — ne pas prendre un artefact pour de la physique nouvelle

Beaucoup de lignes de verdict d’EFT cherchent des structures « faibles mais disciplinées » : Terme commun sans dispersion, monotonie environnementale, mise à l’échelle coïncidente, plateau après seuil, prédiction amont réussie, Carte de base partagée entre sondes. Justement parce que ces signaux ne sont pas toujours des grandeurs massives écrasant tout le reste, mais plutôt des ordres, des signes, des fenêtres communes, des résidus et des strates, ils peuvent être fabriqués en silence par les effets systématiques, les fonctions de sélection, les dérives de calibration, les biais de gabarit ou les habitudes d’une chaîne d’analyse. Les Contrôles nuls servent à construire un tribunal pour ces artefacts.

Des Contrôles nuls vraiment solides doivent au moins couvrir deux familles.

Contrôles par destruction de structure : permutation des étiquettes, inversion temporelle, permutation des bandes, permutation des stations, rotation du ciel, randomisation des directions du squelette, mélange des identités d’objets, réordonnancement des niveaux de seuil. Ils demandent ceci : si l’on détruit les relations structurelles dont dépend EFT, le résultat principal revient-il vers le hasard ?
Contrôles par contamination de chaîne : perturbation de bande passante, décalage d’échelle temporelle, injection de gabarits, masques aléatoires, fausses fenêtres de contrôle, matériaux substituts, balayages de faux seuils, polarité inversée, géométrie hors axe. Ils demandent ceci : existe-t-il un facteur non physique connu capable de reproduire, dans le flux de traitement, une significativité du même ordre que le résultat principal ?

Les Contrôles nuls ne sont pas des figurants et ne doivent pas être relégués à une annexe décorative. Pour 8.4, si l’inversion temporelle, la permutation des bandes et le contrôle dispersif produisent eux aussi un « terme commun à retard nul », le résultat principal ne tient pas. Pour 8.6 et 8.7, si une rotation aléatoire du squelette ou une perturbation de la carte de base préserve malgré tout l’alignement et la Carte de base partagée, le résultat ressemble davantage à un biais algorithmique. Pour 8.9, si les fines structures du voisinage de l’horizon deviennent tout aussi significatives dès qu’on change l’ouverture d’image ou l’orientation du gabarit, la Signature distinctive est en train de manger la chaîne de traitement. Pour 8.10 et 8.11, si des configurations substituts, de fausses charges, des cavités vides, des comptabilités classiques déconnectées ou des contrôles de faux seuils produisent eux aussi un « signal nouveau », la prétendue physique nouvelle tourne dans l’instrument. Un résultat principal qui ne conserve pas sa spécificité face aux Contrôles nuls n’a pas le droit d’être élevé au rang de soutien.

Il faut en outre des contrôles positifs. Autrement dit, la chaîne doit savoir échouer correctement quand « la structure EFT » est absente, mais aussi réussir correctement quand une structure connue est injectée ou quand une physique connue doit apparaître. Si une chaîne ne parvient ni à briser les artefacts ni à récupérer les signaux connus, son résultat principal n’a aucun droit de compter. Les Contrôles nuls du volume 8 ne sont donc pas un simple travail de démolition ; ils verrouillent en même temps cette exigence : réussir quand il faut réussir, échouer quand il faut échouer.

VII. Quatrième garde-fou : la Réplication entre chaînes d’analyse — ne pas laisser une seule voie monopoliser la vérité

La victoire la plus dangereuse du volume 8 est celle qui disparaît dès que l’on change de voie de traitement. Beaucoup de grandeurs qui intéressent EFT dépendent en effet de chaînes d’extraction complexes : comment soustrait-on le fond, comment extrait-on le squelette, comment inverse-t-on la lentille, comment reconstruit-on l’image annulaire, comment reconnaît-on un seuil, comment synchronise-t-on les flux bruts, comment sépare-t-on le bruit du post-sélectionné ? Si l’une de ces étapes dépend fortement des habitudes par défaut d’une équipe, un beau résultat dans une seule chaîne ne peut jamais devenir automatiquement une conclusion physique.

La Réplication entre chaînes d’analyse exigée par 8.12 ne consiste donc pas à relancer le même code avec une autre graine aléatoire. Elle exige une indépendance réelle : chaîne de prétraitement indépendante, modèle de fond indépendant, méthode indépendante d’extraction du squelette ou de reconstruction d’image, famille d’ajustement indépendante, route de calibration indépendante, et, idéalement, équipe, institution et version matérielle indépendantes. Pour les données astronomiques, cela signifie que différents produits de relevé, différentes chaînes d’imagerie ou d’inversion et différents ensembles de macromodèles doivent conserver la même direction de conclusion. Pour les données de laboratoire, cela signifie que l’instrument, le logiciel de contrôle, l’acquisition et le traitement après coup ne doivent pas pouvoir retourner arbitrairement le résultat.

EFT n’a pas besoin ici que toutes les chaînes donnent des valeurs numériques identiques. Elle a besoin de quelque chose de plus simple, et aussi de plus difficile à contrefaire : le même signe principal, le même ordre principal, la même structure principale. Si un signal ne tient que sous une soustraction de fond particulière, une régularisation de reconstruction particulière, une base de gabarits particulière ou une fenêtre de post-sélection particulière, et s’effondre dès qu’une autre chaîne raisonnable entre en scène, le volume 8 doit écrire honnêtement non pas « résultat controversé mais très prometteur », mais « indice actuellement lié à une chaîne de traitement ».

La réplication entre chaînes doit finalement déboucher sur des comptes ouverts et recalculables. Tous les groupes n’ont pas forcément à publier sans réserve l’ensemble de leurs fichiers intermédiaires, mais les vérificateurs externes doivent au moins voir les décisions critiques : quels échantillons ont été exclus, quels paramètres ont été figés, quelles unités de réserve n’ont pas été touchées, quels Contrôles nuls ont échoué, quelles chaînes indépendantes ne sont pas d’accord. Si ces comptes restent entre les mains de l’équipe initiale, le monde extérieur aura du mal à distinguer une « réalité complexe » d’un « processus complexe ».

VIII. Pourquoi les quatre garde-fous doivent fonctionner en parallèle, et non comme des formalités séparées

Faire seulement des Ensembles de réserve sans Mise en aveugle permet de regarder d’abord une tendance, puis de choisir avec soin une réserve « raisonnable ». Faire seulement de la Mise en aveugle sans Contrôles nuls empêche peut-être de voir la réponse, mais n’empêche pas de confondre un artefact systématique avec une découverte. Faire seulement des Contrôles nuls sans Réplication entre chaînes d’analyse laisse une même voie analytique porter le même biais dans le résultat principal comme dans les contrôles. Faire seulement de la Réplication entre chaînes sans réserve permet à plusieurs équipes de surajuster ensemble l’ensemble d’entraînement jusqu’à une quasi-oracle. Ces quatre garde-fous ne sont pas quatre ornements ; ils forment une chaîne.

8.12 doit donc refuser explicitement une logique de compensation très fréquente : « nous n’avons pas de réserve, mais nous avons fait de la Mise en aveugle ; les Contrôles nuls sont moyens, mais les chaînes sont assez cohérentes ; la réplication indépendante manque encore, mais l’entraînement est superbe ». Ce type de score fonctionne peut-être dans la communication ; il est interdit en audit. Le volume 8 ne cherche pas une note globale d’impression ; il cherche à savoir si le résultat tient sous les règles les moins favorables. Aucune porte critique manquée ne peut être compensée par la belle performance d’une autre.

IX. Comment ces quatre garde-fous descendent dans les sections 8.4 à 8.11

Dans 8.4 et 8.5, leur tâche centrale est d’empêcher que le « terme commun » et le partage TPR/PER soient cousus après coup. Les Ensembles de réserve devraient idéalement réserver des classes de sources, des régions du ciel, des bandes de fréquence et des fenêtres d’événements. La Mise en aveugle doit figer d’abord les fiches de prédiction environnementale et les règles de partage grandeur principale–résidus. Les Contrôles nuls doivent donner priorité aux substituts de loi dispersive, aux inversions temporelles, aux permutations d’étiquettes et aux permutations de stations. La Réplication entre chaînes d’analyse doit au moins couvrir la chaîne de traitement du décalage vers le rouge, la chaîne des retards, une chaîne de distances indépendante et la chaîne de modélisation des lentilles. Sans ces garde-fous réunis, 8.4 et 8.5 retomberaient facilement dans le vieux réflexe : cette figure aussi ressemble à quelque chose, celle-là aussi peut se raconter.

Dans 8.6 à 8.9, les quatre garde-fous empêchent la Carte de base partagée, les directions de squelette, les fines structures du voisinage de l’horizon et les Signatures distinctives de frontière de devenir une simple herméneutique d’images. Ici, les réserves devraient davantage porter sur les objets, les époques, les tranches de décalage vers le rouge, les phases de fusion et les unités de ligne de visée. La Mise en aveugle peut se placer sur le champ directionnel du squelette, le niveau environnemental, le gabarit d’orientation, le classement des objets et les fiches de prédiction de Signatures distinctives. Les Contrôles nuls doivent insister sur la rotation de gabarits, les squelettes aléatoires, les masques aléatoires, les contrôles hors axe, les faux points chauds ou froids, les translations et le rééchantillonnage. La Réplication entre chaînes d’analyse exige que différents algorithmes de squelette, différentes reconstructions de masse, différentes chaînes d’imagerie et différentes extractions de retards conservent en même temps la même direction.

Dans 8.10 et 8.11, ces garde-fous doivent être encore plus stricts. Le bloc laboratoire est le plus exposé aux pseudo-victoires du type : « le signal est très beau, mais il n’existe que dans cet instrument et ce script de traitement ». Ici, la réserve peut être une fenêtre entière de paramètres, une classe entière de matériaux, un instrument entier ou un lot complet de puces. La Mise en aveugle peut porter sur les niveaux de seuil, les étiquettes de matériaux, l’ordre de pilotage et le classement de propreté des liaisons. Les Contrôles nuls doivent inclure configurations substituts, cavités vides, fausses charges, polarité inversée, contrôles de chaîne coupée, désynchronisation temporelle et injection–récupération. La Réplication entre chaînes d’analyse devrait idéalement atteindre le niveau interinstitutionnel, intermatériel et interlogiciel, avec une double ouverture des comptes bruts et des comptes de post-sélection. C’est seulement ainsi que le volume 8 évite d’inscrire un hasard d’ingénierie comme une nouvelle qualification d’EFT.

X. Quel résultat méthodologique soutiendrait réellement EFT

Du point de vue de 8.12, ce qui soutient réellement EFT n’est pas qu’une classe d’objets « ressemble davantage à EFT ». C’est qu’EFT accepte les règles les moins favorables et réussisse malgré tout des prédictions structurelles sur plusieurs lignes de verdict. Concrètement, plusieurs choses doivent au moins apparaître ensemble :

dans les Ensembles de réserve, le sens, l’ordre et la structure principale restent alignés avec la partie d’entraînement, sans survivre par réajustement du protocole ;
le taux de réussite des fiches de prédiction en aveugle reste durablement supérieur au hasard et aux contrôles par permutation, au lieu de ne paraître « évident depuis toujours » qu’après levée de l’aveugle ;
le résultat principal bat clairement les Contrôles nuls par destruction de structure et par contamination de chaîne ;
au moins deux chaînes et deux équipes réellement indépendantes donnent une conclusion de même sens sans réinventer de nouvelles règles.

Si ces conditions ne sont pas remplies sur une seule ligne isolée, mais simultanément dans plusieurs familles de 8.4 à 8.11, l’EFT échappe pour la première fois au jugement le plus dangereux : celui d’une « théorie qui sait raconter des histoires ». Cela signifie qu’elle ne se contente pas d’expliquer des objets ; elle accepte que son autorité explicative soit comprimée par la méthode. Plus important encore : une fois comprimée, il lui reste encore quelque chose.

Un autre point doit être écrit fermement : le soutien méthodologique possède lui aussi des degrés. Le niveau le plus faible est simplement qu’un résultat ne s’effondre pas devant les garde-fous ; le niveau plus fort est qu’il ne s’effondre pas et montre en plus une fermeture à quatre volets : réussite amont, robustesse en réserve, séparation par Contrôles nuls et même direction entre équipes. Le volume 8 a besoin du second niveau, non du premier. Le premier dit seulement qu’EFT n’a pas encore été prise en faute procédurale ; le second indique qu’elle commence à gagner une crédibilité procédurale.

XI. Quels résultats ne feraient que resserrer EFT, sans la faire sortir immédiatement

Toutes les difficultés méthodologiques ne renvoient pas EFT directement à la zone de réécriture. Certaines relèvent davantage du resserrement que de la mise au rebut.

Premier resserrement : les Ensembles de réserve ne réussissent que dans certaines fenêtres. Autrement dit, une proposition passe les quatre garde-fous dans certaines classes de sources, certains environnements, certaines plateformes ou certaines fenêtres de paramètres, mais s’affaiblit dès qu’elle en sort. Ce résultat peut signifier qu’EFT a saisi quelque chose de réel, mais que son domaine d’application doit être réduit.
Deuxième resserrement : la réussite en aveugle existe, mais elle ne donne que le sens, pas l’amplitude ; la stratification, pas une échelle unifiée. EFT conserve alors une part de prévisibilité, mais non une syntaxe universelle trop forte. Troisième resserrement : les Contrôles nuls sont globalement franchis, mais certains sous-espaces à haut risque demeurent fragiles, par exemple une région du ciel particulière, un bord de bande passante, une configuration d’imagerie ou un lot de matériaux. Quatrième resserrement : plusieurs chaînes gardent le même sens, mais ne convergent qu’avec une bande d’erreur systématique plus large. Rien de cela ne doit être maquillé en soutien complet ; rien de cela ne signifie non plus une sortie immédiate. Ces résultats obligent seulement EFT à écrire son ambition plus petit et ses phrases plus dur.

XII. Quels résultats causeraient un dommage structurel

La première catégorie de résultats qui blesserait l’ossature méthodologique d’EFT serait un retournement systématique des Ensembles de réserve. Si le sens, l’ordre et la fermeture qui paraissaient stables dans l’entraînement disparaissent, se retournent ou ne survivent qu’après nouvelle sélection dès l’entrée dans la réserve, il ne s’agit pas d’une « généralisation un peu faible » : c’est le signe que la conclusion principale dépend probablement d’un réajustement.
La deuxième catégorie serait une Mise en aveugle qui échoue durablement, alors que de belles explications apparaissent toujours après levée de l’aveugle. Si les fiches de prédiction, sous protocole figé, réussissent à un niveau proche du hasard, présentent un taux élevé de sens contraire, ou exigent de réécrire sans cesse les seuils, les strates et les variables proxy après observation des figures, EFT ne peut plus présenter ces explications comme une syntaxe prédictive.
La troisième catégorie serait une significativité commune des Contrôles nuls et du résultat principal. Si les permutations d’étiquettes, inversions temporelles, rotations de gabarits, matériaux substituts, fausses fenêtres de contrôle, perturbations de bande passante ou squelettes aléatoires produisent eux aussi des « signaux de soutien » d’intensité comparable, le volume 8 doit reconnaître non pas que « le résultat est complexe », mais que « le processus fabrique le signal ».
La quatrième catégorie serait qu’une seule chaîne ou une seule équipe voie EFT. Si le résultat principal se disperse dès qu’on change de modèle de fond, de méthode d’inversion, de route d’imagerie, de chaîne de calibration ou de version matérielle, ou si les recalculs entre institutions ne produisent durablement aucune conclusion de même sens, EFT perd son droit de demander aux autres de la reconnaître. La cinquième catégorie, la plus sévère, serait que les quatre garde-fous se contredisent : la réserve passe, mais l’aveugle ne réussit pas ; le résultat principal est significatif, mais les Contrôles nuls le sont aussi ; une équipe obtient une stabilité, mais plusieurs équipes ne reproduisent pas. Si cette division persiste dans plusieurs familles de verdict, 8.12 ne doit plus être écrit comme un bonus méthodologique, mais comme une blessure dure portée à la crédibilité de tout le volume.

Il existe encore une forme de dommage structurel méthodologique souvent sous-estimée : les règles montent en grade après la sortie des résultats. Aujourd’hui on dit regarder le même sens ; demain on dit regarder l’ordre ; après-demain on ne regarde plus que le sous-échantillon d’environnement fort. Aujourd’hui deux chaînes suffisent ; demain, parce qu’elles divergent, on déclare n’en croire qu’une. Aujourd’hui on réserve une région du ciel ; demain, parce qu’elle se retourne, on réserve une bande de fréquence. Si ce phénomène de « règles qui courent après les résultats » persiste, 8.12 doit le juger comme une blessure grave : cela signifie qu’EFT n’a pas encore appris à se remettre à des règles fixes.

XIII. Quand ne peut-on pas encore juger aujourd’hui ?

Cette section conserve bien sûr la catégorie « non encore jugé », mais ses limites doivent être très étroites. La première situation raisonnable est celle où les comptes bruts et les métadonnées critiques ne sont pas encore assez ouverts. Si la chaîne temporelle, la chaîne de bande passante, la chaîne de calibration, la définition des unités de réserve ou les variables proxy d’environnement restent opaques, forcer un verdict ne ferait que déplacer la controverse vers un niveau de bruit plus élevé.
La deuxième situation est celle où la couverture de l’échantillon ne suffit pas encore à construire une véritable structure de réserve. Pour certaines Signatures distinctives, les objets sont encore trop peu nombreux : en tenir un à part revient presque à ne plus avoir d’échantillon. Pour certaines plateformes extrêmes, les conditions interinstitutionnelles n’existent pas encore. Dans ces cas, le non encore jugé relève de la retenue.
La troisième situation est celle où les quatre garde-fous n’ont pas encore de protocole commun. Si les équipes ne s’accordent pas encore sur ce qu’est une chaîne indépendante, un Contrôle nul valable, une réussite en aveugle ou une unité de réserve, il peut en effet être prématuré de prononcer un verdict lourd. Mais ce type de non encore jugé ne doit pas devenir une survie indéfinie. Dès que les comptes bruts sont ouverts, que le protocole est figé, que la réserve et les Contrôles nuls sont réalisés, et que les chaînes indépendantes sont en place, un résultat qui reste opposé ne relève plus du « pas encore jugeable ». Il affaiblit EFT ; il n’attend pas une meilleure excuse.

Il existe aussi une forme raisonnable mais dangereuse de non encore jugé : l’objet est trop rare, la plateforme trop coûteuse, le cycle de reproduction trop long. Certaines fines structures du voisinage de l’horizon, certaines fusions extrêmes ou certains liens quantiques de coût élevé ne peuvent effectivement pas recevoir rapidement une réplication multi-institutionnelle comme une expérience ordinaire. Dans ces cas, 8.12 peut provisoirement admettre une « densité de preuve insuffisante », mais ne doit jamais la transformer en « soutien comptabilisé ». Dans la Grammaire du jugement du volume 8, le coût et la rareté ne peuvent que ralentir le verdict ; ils ne peuvent pas augmenter la probabilité de victoire.

XIV. Ne pas confondre « pouvoir expliquer » avec « résister à l’examen » : le tournant décisif de cette section

Ce que cette section ajoute n’est pas une liste de contraintes techniques supplémentaires ; c’est un changement de posture pour tout le volume : passer de l’herméneutique à l’examen. L’herméneutique excelle à trouver, pour chaque nouvel objet, une phrase qui lui donne une place. L’examen fait l’inverse : il commence par se lier les mains, puis demande ce qu’il reste. Pour une théorie comme EFT, qui tente de réécrire la carte de base, ce tournant est particulièrement important. Plus elle sait parler, plus elle doit apprendre à se taire d’abord ; plus elle sait rendre les choses cohérentes, plus elle doit accepter d’abord les règles les moins favorables.

C’est aussi le sens le plus important à retenir ici : ce qui rend la falsification véritablement redoutable, ce n’est pas la force de l’adversaire, mais la volonté de se soumettre soi-même au règlement le plus défavorable. Si EFT refuse de le faire, même si personne ne parvient à la réfuter immédiatement, elle restera une théorie qui sait raconter des histoires. À l’inverse, si elle ne gagne qu’une partie des fenêtres sous ces règles défavorables, cette victoire partielle pèsera davantage qu’un volume entier de belles explications sans garde-fous.

XV. Résumé de la section

La solidité du volume 8 ne dépend pas seulement de ce qu’il croit voir ; elle dépend aussi de la volonté d’EFT de se désavantager elle-même devant les quatre portes que sont les Ensembles de réserve, la Mise en aveugle, les Contrôles nuls et la Réplication entre chaînes d’analyse. Ce n’est qu’après avoir accepté ces règles inconfortables que tout soutien obtenu par EFT cessera d’être le simple écho de sa propre narration.