P1_RC_GGL: Mahigpit na Pagsubok sa Closure ng Dinamika ng Galaksiya at Mahinang Lensing (Mga Kurba ng Rotasyon + GGL)

Balangkas ng Mean-Gravity ng EFT kumpara sa Minimal na NFW Baseline para sa Malamig na Dark Matter (DM)

May-akda: Guanglin Tu
Email: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Kaugnayan: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Bersyon: v1.1 | Petsa: 2026-02-14

Preprint (hindi pa peer reviewed) | Ang bersyong ito ay inilaan para sa pampublikong pagpapalaganap at reproduksibilidad, at hindi kumakatawan sa pinal na bersyong nailathala sa journal.

Lisensya: Ulat (CC BY-NC-ND 4.0); buong reproduction package (CC BY 4.0).

Ulat na may kalidad-panglathala (Concept DOI): https://doi.org/10.5281/zenodo.18526334 Buong reproduction package (Concept DOI): https://doi.org/10.5281/zenodo.18526286

Tingnan ang orihinal na ulat ng pagtatasa:

1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc

2. Gemini: https://gemini.google.com/share/773ec96d75a0

3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04

4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46

5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm

6. Doubao: https://www.doubao.com/thread/w166b207d7345e46a

0 Ehekutibong Buod

Ang ulat na ito ay isang archive edition na may kalidad-panglathala at idineposito sa Zenodo. Nagbibigay ito ng pinagsanib at naa-audit na kadena na sumasaklaw sa datos, talaan ng modelo, patas na paghahambing, closure testing, at mga materyal para sa reproduksibilidad. Ang Appendix B (P1A) ay nagsisilbing suplemento sa robustness. Nakatuon ito sa mga stress test na may “mas karaniwang DM baseline + isang mahalagang lensing systematic,” upang masukat ang sensitibidad ng mga pangunahing kongklusyon sa mas realistiko at masusing pagmomodelo ng DM at paghawak sa lensing systematics.

Pangunahing kongklusyon (apat na pahayag na maaaring tuwirang sipiin; tingnan ang Seksyon 2.4):

(1) Sa pag-fit ng rotation curve (RC), malinaw na nahihigitan ng pamilya ng EFT ang DM_RAZOR sa lahat ng kombinasyon ng kernel/prior; ang tipikal na pagbuti ay Δlog𝓛_RC ≈ 10^3 (tingnan ang Talahanayan S1a).
(2) Sa RC→GGL closure test, nagpapakita ang EFT ng mas malakas na transferability sa pagitan ng mga probe: ang closure strength Δlog𝓛_closure (True−Perm) ay makabuluhang mas mataas kaysa sa DM_RAZOR, at matatag ang pagkakaiba sa covariance shrinkage, R_min, at σ_int scans (tingnan ang Fig. S3 at Talahanayan S1b).
(3) Sa joint fit (RC+GGL), nananatiling matatag ang bentahe ng EFT; sa negative control na sumisira sa shared mapping, bumabagsak ang bentaheng ito, na sumusuporta sa interpretasyong ang “mean-gravity effect” ay nagmumula sa shared mapping at hindi sa aksidenteng fit (tingnan ang Fig. S4).
(4) Nang hindi lubos na dinaragdagan ang dimensionality, sinusuri ng Appendix B (P1A) ang panig ng DM gamit ang mas karaniwang mga DM-baseline module at isang mahalagang lensing-systematics nuisance. Hindi inaalis ng mga pagpapahusay na ito ang closure advantage ng EFT (tingnan ang Talahanayan B1 at Fig. B1).

Kakayahang makuha ang datos at code: report Concept DOI 10.5281/zenodo.18526334; full reproduction package Concept DOI 10.5281/zenodo.18526286. Ang mga tag na tumutugma sa Appendix B (P1A) ay run_tag=20260213_151233, closure_tag=20260213_161731, at joint_tag=20260213_195428.

1 Abstrak

Isinasagawa namin ang isang reproduksibleng kuantitatibong paghahambing ng dalawang teoretikal na balangkas sa ilalim ng parehong datos at parehong estadistikal na protokol: ang modelong “mean-gravity correction” na iminungkahi ng Teorya ng Hibla ng Enerhiya (EFT; naiiba sa karaniwang daglat para sa effective field theory), at ang baseline na NFW halo model ng malamig na dark matter (DM_RAZOR). Sadyang pinili ang DM_RAZOR bilang “minimal DM baseline”: isang NFW halo na may nakapirming c–M relation (walang halo-to-halo scatter), upang magsilbing naa-audit at reproduksibleng kontrol. Dapat ding idiin na tinatrato ng papel na ito ang EFT bilang phenomenological, MOND-like effective-field/effective-response parameterization para sa pagsusuri sa ilalim ng pinag-isang estadistikal na protokol, sa halip na hanguin ang mikroskopikong first principles nito sa loob ng gawaing ito.

Binubuo ang datos ng 2,295 velocity data points mula sa SPARC rotation curves (RC), na pare-parehong na-preprocess at na-bin (104 na galaksiya, 20 RC bins), kasama ang KiDS-1000 galaxy–galaxy weak-lensing (GGL) excess surface density ΔΣ(R) (4 stellar-mass bins × 15 R points bawat bin, kabuuang 60 points, gamit ang full covariance).

Sunod-sunod naming isinagawa ang RC-only inference, RC→GGL closure test, GGL-only inference, at joint RC+GGL inference, gamit ang consistency audits upang matiyak na nasusundan ang bawat siniping numerikal na halaga. Sa ilalim ng mahigpit na parameter ledger at shared-mapping constraints (DM: 20 log M200_bin parameters; EFT: 20 log V0_bin parameters + 1 global log ℓ), malinaw na nahihigitan ng pamilya ng EFT ang DM_RAZOR sa joint fit: ΔlogL_total = 1155–1337 relative to DM_RAZOR. Mas mahalaga, ipinapakita ng closure test na may di-trivial na predictive power ang RC posterior para sa GGL: ang closure strength ng EFT ay ΔlogL_closure = 172–281, mas mataas kaysa sa 127 ng DM_RAZOR. Kapag random na na-shuffle ang RC-bin→GGL-bin grouping, bumabagsak ang closure signal sa 6–23, na nagpapatunay na hindi ito estadistikal na aksidente o implementation artifact. Sa kabuuan ng systematic scans ng σ_int, R_min, at covariance shrinkage, nananatiling positibo at matatag ang relatif na bentahe ng EFT. Upang sagutin ang karaniwang pangambang “masyadong mahina ang DM baseline” o “napagkakamalang pisika ang systematics,” nagbibigay ang Appendix B (P1A) ng mas karaniwan ngunit low-dimensional at naa-audit pa ring DM-baseline stress test, kabilang ang hierarchical c–M scatter + prior, one-parameter core proxy, lensing m, at ang pinagsamang DM_STD model. Sa ilalim ng parehong closure protocol, hindi inaalis ng mga pagpapahusay na ito ang closure advantage ng EFT (tingnan ang Talahanayan B1/Fig. B1).

Mga keyword: rotation curves; galaxy–galaxy weak lensing; closure test; EFT; malamig na dark matter; Bayesian inference

2 Panimula at Pangkalahatang-tingin sa mga Resulta

Ang rotation curves (RC) at galaxy–galaxy weak lensing (GGL) ay dalawang komplementaryong probe ng grabidad: nililimitahan ng RC ang dynamical potential at radial acceleration relation (RAR) sa disk plane, samantalang sinusukat ng GGL ang projected mass distribution at ang halo-scale gravitational response. Para sa anumang kandidatang teorya, ang mahalagang tanong ay hindi kung kaya nitong i-fit ang dalawang dataset nang magkahiwalay, kundi kung kaya nitong ipaliwanag ang mga ito nang konsistent sa ilalim ng parehong cross-data mapping at shared constraints.

Alinsunod dito, ginagawa ng papel na ito ang “closure test” bilang pangunahing estadistikal na protokol: una, gamitin ang RC-only posterior upang mag-forward-predict ng GGL; pagkatapos, ihambing ito sa isang negative control kung saan ang RC-bin→GGL-bin mapping ay na-permute/na-shuffle. Sinusukat nito ang cross-data predictive transferability at inaalis ang mga maling signal na dulot ng implementation bias o aksidenteng fitting.

Teoretikal na pagpoposisyon at saklaw: hindi sinusubukan ng papel na ito na maglahad ng mikroskopikong first-principles derivation ng EFT (Teorya ng Hibla ng Enerhiya) o ng relativistically complete formulation. Sa halip, tinatrato namin ang EFT bilang low-dimensional, MOND-like effective-field/effective-response parameterization (inilalarawan ng kernel f(x) at global scale ℓ), at sinusubok ang cross-data consistency at transfer predictive power nito sa pamamagitan ng RC→GGL closure test sa ilalim ng mahigpit na parameter ledger.

Pahayag ng programang pananaliksik at saklaw: ang papel na ito ay bahagi ng nagpapatuloy na P-series observational retrieval program. Sa kasalukuyang datos sa sukat ng galaksiya, hinahanap namin ang dalawang posibleng effective background contributions: (i) isang “mean gravity floor” na mailalarawan ng coarse-grained mean gravitational response, at (ii) isang “stochastic/noise floor” na kaugnay ng mga fluctuation sa mikroskopikong proseso. Sa papel na ito (P1), nakatuon lamang kami sa una: nang hindi nagpapasok ng anumang hipotesis tungkol sa mikroskopikong production mechanisms, ginagamit namin ang RC→GGL closure test upang makuha ang observational indications ng mean gravity floor at ihambing ito sa isang naa-audit na DM baseline sa ilalim ng pinag-isang control protocol. Bilang heuristic na pisikal na larawan, kung umiiral ang short-lived degrees of freedom, maaaring i-convert ng kanilang decay/annihilation ang rest mass sa energy-momentum na dala ng ibang degrees of freedom, na natural na tumutugma sa effective level sa decomposition na “mean contribution + fluctuation contribution”; gayunman, hindi kuantitatibong minomodelo ng papel na ito ang mikroskopikong larawang iyon.

Upang maiwasan ang labis na interpretasyon, ganito ang mga hangganan ng saklaw ng papel na ito:
• Ang ginagawa ng papel na ito: sa ilalim ng mahigpit na parameter-ledger at shared-mapping constraints, ginagamit nito ang closure testing upang sukatin ang cross-data predictive transferability at magsagawa ng reproduksibleng paghahambing sa pagitan ng EFT mean-gravity response at isang DM baseline.
• Ang hindi ginagawa ng papel na ito: hindi nito tinatalakay ang mikroskopikong production mechanisms, abundances/lifetimes, o cosmological constraints; hindi nito minomodelo ang stochastic term na tumutugma sa “noise floor.”
• Ang hindi inaangkin ng papel na ito: hindi nito nilalayong ibagsak ang dark matter; ang P1 ay hindi nagbibigay ng huling hatol kung umiiral ang isang “floor,” kundi nag-uulat ng stage-level evidence—na sa loob ng robust measurement domain na pinili rito, mas pinapaboran ng datos ang mga modelong may kasamang mean gravitational response.

Kasabay nito, nililinaw namin na ang DM_RAZOR ay kumakatawan lamang sa minimal at naa-audit na NFW baseline (fixed c–M at walang scatter; walang adiabatic contraction, feedback core, nonsphericity, o environmental terms). Kaya mahigpit na limitado ang pangunahing kongklusyon ng katawan ng teksto sa pahayag na ito: sa ilalim ng minimal baseline at mahigpit na parameter-ledger/mapping constraints, nagpapakita ang EFT ng mas malakas na cross-data consistency. Upang sagutin ang karaniwang tanong kung malaki bang mababago ang kongklusyon ng mas standard na ΛCDM baseline at key lensing-systematics modeling, pinagsama namin sa Appendix B (P1A: DM-baseline standardization stress test) ang mas standard ngunit low-dimensional at naa-audit pa ring DM enhancements at isang lensing-side nuisance, habang pinananatiling eksaktong pareho ang shared mapping at closure-test protocol gaya ng nasa pangunahing teksto (tingnan ang Talahanayan B1/Fig. B1).

2.1 Tab S1a–S1b: Buod ng Mahahalagang Metric (Mahigpit)

Iniuulat ng Talahanayan S1a ang mga pangunahing comparison metric para sa joint fit (RC+GGL): logL, ΔlogL, AICc, at BIC. Iniuulat naman ng Talahanayan S1b ang closure-test at robustness-scan metrics: closure, shuffle negative control, at ang σ_int / R_min / cov-shrink scan ranges. Lahat ng halaga ay nagmumula sa mahigpit na master summary table na Tab_Z1_master_summary at maaaring sundan item by item sa release archive package.

Talahanayan S1a | Pangunahing joint-fit comparison metrics (RC+GGL, Mahigpit).

Modelo (workspace)	W kernel	k	Pinakamahusay na joint logL_total	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	wala	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	wala	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Talahanayan S1b | Closure at robustness metrics (Mahigpit).

Modelo (workspace)	Closure ΔlogL (true-perm)	Negative-control ΔlogL pagkatapos ng shuffle	σ_int scan ΔlogL range	R_min scan ΔlogL range	cov-shrink scan ΔlogL range
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

2.2 Fig. S3: Closure Strength (RC-only → Predicted GGL)

Ang closure strength ay tinutukoy bilang ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: sa RC-only posterior samples, forward-predicted ang GGL at inihahambing sa negative control kung saan na-permute ang RC-bin→GGL-bin mapping.

Fig. S3 | Closure strength (mas mataas ay mas mabuti): mean log-likelihood advantage ng RC-only → GGL prediction.

2.3 Fig. S4: Pangunahing Joint-Fit Comparison (RC+GGL)

Ang joint-fit advantage ay tinutukoy bilang ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Sa ilalim ng parehong datos, parehong mapping, at halos parehong sukat ng parameter, nakakamit ng pamilya ng EFT ang mas mataas na joint log-likelihood.

Fig. S4 | Joint-fit advantage (mas mataas ay mas mabuti): pinakamahusay na logL_total para sa RC+GGL relative to DM_RAZOR.

2.4 Apat na Kongklusyon (Maaaring Tuwirang Sipiin)

(1) Sa pinag-isang joint analysis ng SPARC rotation curves at KiDS-1000 weak lensing, sistematikong nahihigitan ng EFT mean-gravity framework model ang DM_RAZOR sa ilalim ng mahigpit na control protocol: ΔlogL_total = 1155–1337 relative to DM_RAZOR.

(2) Ipinapakita ng RC→GGL closure test ang mas malakas na predictive consistency para sa EFT: ΔlogL_closure = 172–281, kumpara sa 127 para sa DM_RAZOR. Kapag random na na-shuffle ang RC-bin→GGL-bin grouping, bumabagsak ang closure signal sa 6–23, na nagpapakitang nakasalalay ang signal sa tamang cross-data mapping at hindi sa aksidenteng fitting.

(3) Hindi binabago ng systematic scans ng σ_int, R_min, at covariance shrinkage ang tanda o sukat ng “mas mahusay ang EFT kaysa DM_RAZOR,” na nagpapakitang matatag ang kongklusyon laban sa karaniwang systematic perturbations.

(4) Sa ilalim ng parehong closure protocol, pinapalakas ng Appendix B (P1A) ang DM baseline sa isang “standardized and auditable” na paraan: pinananatili nito ang tatlong one-parameter enhancements (SCAT/AC/FB) at idinadagdag ang hierarchical c–M scatter + prior, one-parameter core proxy, at lensing-side shear-calibration m (kasama ang pinagsamang DM_STD model). Ipinapakita ng mga resulta na ang feedback/core branch lamang ang nagbibigay ng maliit na net improvement sa closure strength (122.21→129.45, ΔΔlogL_closure≈+7.25); ang ibang enhancements ay nagbibigay ng di-makabuluhan o negatibong ambag sa closure strength. Kaya hindi nakadepende ang pangunahing kongklusyon sa pagiging labis na mahinang baseline ng DM_RAZOR.

3 Datos at Preprocessing

Gumagamit ang pag-aaral na ito ng dalawang pampublikong dataset. Sa loob ng engineering workflow, ang pag-download, checksum verification (sha256), at preprocessing ay natatapos gamit ang mga traceable script. Upang matiyak ang patas na cross-model comparison, lahat ng workspace (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) ay gumagamit ng eksaktong parehong data products at bin mappings.

3.1 Rotation Curves (RC, SPARC)

Ang RC data ay nagmumula sa Rotmod_LTG files ng SPARC database (175 rotmod files). Pagkatapos ng preprocessing, ang modeling sample ay may 104 na galaksiya at 2,295 (r, V_obs) data points, hinati sa 20 RC bins ayon sa stellar mass at kaugnay na pamantayan. Bawat data point ay naglalaman ng radius r (kpc), observed velocity V_obs (km/s), observational error σ_obs, at component velocities ng gas/disk/bulge (V_gas, V_disk, V_bul).

3.2 Weak Lensing (GGL, KiDS-1000 / Brouwer+2021)

Ginagamit ng GGL data ang excess surface density ΔΣ(R) mula sa Fig. 3 ng Brouwer et al. (2021) batay sa KiDS-1000 (4 stellar-mass bins, 15 R points bawat bin), kasama ang ibinigay na full covariance. Sa engineering workflow, nire-reconstruct ang orihinal na long-form covariance bilang 15×15 matrix para sa bawat bin, at pinatutunayan ng Stage-B audits ang dimensional at numerikal na pagiging makatwiran.

3.3 RC-bin → GGL-bin Mapping at Kabuuang Sample Size

Iniuugnay ang 4 GGL mass bins at 20 RC bins sa pamamagitan ng isang fixed mapping: bawat GGL bin ay tumutugma sa 5 RC bins, at ang ambag ng RC bins ay tinitimbang ayon sa bilang ng mga galaksiya. Pinananatiling fixed ang mapping na ito sa lahat ng modelo at ito ang core constraint para sa patas na paghahambing sa closure testing at joint fitting. Ang final joint dataset ay naglalaman ng n_total = 2355 points (RC=2295, GGL=60).

4 Mga Modelo at Estadistikal na Paraan

4.1 Minimal na Matematikal na Espesipikasyon para sa EFT at DM (Naa-audit/Nasusubok)

Ibinibigay ng seksyong ito ang minimal na matematikal na espesipikasyon na direktang tumutugma sa implementation.

(a) Modelo ng rotation curve (RC)

Para sa bawat RC data point (r, V_obs, σ_obs), ginagamit namin ang component superposition: V_mod²(r) = V_bar²(r) + V_extra²(r). Dito, V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Ang pangunahing resulta sa papel na ito ay gumagamit ng Υ_d = Υ_b = 0.5, alinsunod sa SPARC empirical recommendations at kapaki-pakinabang para bawasan ang hindi kailangang degrees of freedom.

(b) EFT mean-gravity correction (EFT)

Ang extra term ng EFT ay naka-parameterize sa anyong “mean velocity squared”: V_extra²(r) = V0_bin² · f(r/ℓ). Dito, ang V0_bin ang amplitude parameter para sa bawat RC bin (20 parameters), ang ℓ ay global scale (1 parameter), at ang f(x) ay dimensionless kernel shape function. Ang kernel shapes na inihahambing sa papel na ito (wala sa mga ito ang nagpapasok ng dagdag na continuous degrees of freedom) ay:

none: f(x)=x/(1+x)
exponential: f(x)=1−exp(−x)
yukawa: f(x)=1−exp(−x)·(1+0.5x)
powerlaw_tail: f(x)=1−(1+x)^(−1/2)
(opsyonal na kontrol) gaussian: f(x)=erf(x/√2) (hindi kasama sa pangunahing set ng kongklusyon)

Pisikal na motibasyon (pinalawak): binibigyang-kahulugan ng EFT ang dagdag na gravitational response sa sukat ng galaksiya bilang effective response na nakukuha sa pamamagitan ng coarse-graining/scale-averaging ng mas mikroskopikong aksyon sa may-hanggang sukat. Sa papel na ito, hindi kami nagpapalagay ng partikular na mikroskopikong mekanismo; sa halip, gumagamit kami ng minimal at naa-audit na parameterization para sa kontroladong paghahambing at pagsusuri sa ilalim ng pinag-isang estadistikal na protokol.

Bilang intuision, maaaring isulat ang extra term sa anyong acceleration: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Kapag r≫ℓ, f→1 at V_extra→V0_bin, na lumilikha ng halos flat na extra velocity contribution sa outer region. Kapag r≪ℓ at f(x)≈x, maaaring ipakilala ang characteristic acceleration scale a0,bin≈V0_bin²/ℓ (hanggang sa O(1) kernel-function factor), na nagbibigay ng MOND-like intuition para sa inner-to-outer transition scale.

Ang discrete kernel family na ginamit dito (none/exponential/yukawa/powerlaw_tail) ay maaaring tingnan bilang low-dimensional proxies para sa magkakaibang “initial slopes / transition speeds / long-range tails” (halimbawa, Yukawa-like screening kumpara sa mas mahabang-tailed na response). Ginagamit ang mga ito para sa robustness stress testing at hindi upang ubusin ang model space. Sa weak-lensing component, bumubuo kami ng effective envelope mass at density mula sa V_avg(r), pagkatapos ay ipinro-project ang mga ito upang makuha ang ΔΣ(R). Ang effective density na ito ay dapat unawain bilang effective description ng lensing potential sa ilalim ng mga palagay ng spherical symmetry at weak-field mapping (inilipat sa Appendix A ang buong detalye).

Lahat ng kernel shapes sa itaas ay tumutupad sa f(x)→1 habang x→∞ (ibig sabihin, saturation V_extra²→V0²), habang nagbibigay ng linear o sublinear growth para sa x≪1: halimbawa, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Kaya may observable differences ang iba’t ibang kernel shapes sa small-radius “initial slope,” transition speed, at outer tail, at maaaring pag-ibahin ng joint RC+GGL at closure tests.

Nakukuha ang EFT prediction para sa weak-lensing ΔΣ(R) sa pamamagitan ng pag-infer ng envelope mass at density mula sa V_avg(r), kasunod ang projection integrals: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, at ΔΣ(R)=Σ̄(<R)−Σ(R). Gumagamit ang numerical implementation ng logarithmic grid at adaptive na pinapapino ito sa mga exceptional case upang matiyak ang stability at reproducibility.

(c) DM_RAZOR: NFW cold-dark-matter halo baseline

Kasabay nito, nililinaw namin na ang DM_RAZOR ay kumakatawan lamang sa minimal, naa-audit na NFW baseline (fixed c–M at walang scatter; walang adiabatic contraction, feedback core, nonsphericity, o environmental terms). Upang bawasan ang panganib ng “strawman baseline,” hindi inaangkin ng papel na ito na wala ang mga ganitong epekto. Sa halip, isinasama ang mga ito sa Appendix B (P1A) bilang low-dimensional at naa-audit na stress tests, kabilang ang hierarchical treatment ng c–M scatter, isang core proxy, at lensing-side shear-calibration nuisance.

4.2 Talaan ng Modelo at Patas na Paghahambing (Shared Parameters = Depinisyon ng Closure)

Ang bilang ng parameters sa pangunahing comparison set ay: DM_RAZOR k=20; pamilya ng EFT k=21 (ang dagdag na parameter ay global log ℓ). Lahat ng modelo ay gumagamit ng parehong RC data, parehong GGL data at covariance, parehong RC-bin→GGL-bin mapping, parehong baryonic terms, at parehong unit conversions. Bukod dito, ang kernel shape (none / exponential / yukawa / powerlaw_tail) ay discrete choice at hindi nagpapasok ng karagdagang continuous parameter, upang maiwasan ang bentaheng galing sa “isang dagdag na degree of freedom.”

4.3 Likelihood, Priors, at Sampler

Ang RC likelihood ay diagonal Gaussian: σ_eff² = σ_obs² + σ_int². Inaayos ng pangunahing resulta ang σ_int=5 km/s, at ini-scan ng Run-5 ang σ_int. Gumagamit ang GGL likelihood ng full-covariance Gaussian para sa bawat bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Ang joint objective ay logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Pangunahin na kinokodigo ng priors ang mga physically feasible boundaries (interval constraints sa log ℓ, log V0, at log M200); kapag naka-enable ang free Υ at σ_int, ginagamit ang weakly informative priors (tingnan ang implementation at release-package configuration para sa detalye).

Gumagamit ang sampler ng adaptive block Metropolis random walk: sa bawat hakbang, random sub-block lamang ng parameter space ang ina-update upang mapabuti ang acceptance rate sa mataas na dimensyon, at bahagyang ina-adapt ang step size batay sa windowed acceptance rate (target acceptance rate na humigit-kumulang 0.25). Ginagamit ng pangunahing resulta ang quick mode (mga setting gaya ng n_steps=800), at bawat workspace ay naglalabas ng traces, residuals, at PPC plots para sa manual at scripted audits.

4.4 Closure Test at Negative Control (Depinisyon)

Sinusubok ng closure test (Run-2) kung kayang hulaan ng RC-only posterior ang GGL nang hindi nire-refit ang GGL. Partikular, forward-generates ito ng ΔΣ(R) para sa 4 GGL bins mula sa RC-only posterior samples at kinukuwenta ang logL_true gamit ang full covariance; pagkatapos ay random nitong pine-permute ang RC-bin→GGL-bin group mapping upang makuha ang logL_perm. Ang closure strength ay tinutukoy bilang ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Dagdag pa, random na nire-regroup ng Run-10 ang 20 RC bins sa 4×5 (shuffle) at nire-recompute ang closure, upang subukin kung gaano kalakas na nakadepende ang closure signal sa tamang mapping.

5 Pangunahing Resulta at Interpretasyon

5.1 Pangunahing Joint-Fit Results (RC+GGL)

Ipinapakita sa Talahanayan S1a at Fig. S4 ang pinakamahusay na logL_total mula sa joint fit at ang relative advantage ΔlogL_total (relative to DM_RAZOR). Sa pangunahing comparison set, ang EFT_BIN ang may pinakamalaking joint advantage (ΔlogL_total=1337.210), habang nananatili ring malaki ang bentahe ng iba pang EFT kernel shapes (1154.827–1294.442). Sa ilalim ng information criteria (AICc/BIC), malinaw ding nahihigitan ng pamilya ng EFT ang DM_RAZOR, na nagpapakitang hindi nagmumula ang bentahe sa bias mula sa bilang ng parameters.

Tala: ang pangunahing ambag sa ΔlogL_total≈1337 ay nagmumula sa RC term (ΔlogL_RC≈1065 sa joint decomposition, humigit-kumulang 80%). Maaari itong unawain bilang katamtamang pagbuti na mga Δχ²≈0.90 bawat punto sa N=2295 RC data points, na natural na naiipon sa bentaheng nasa order 10^3 sa ilalim ng diagonal Gaussian likelihood. Kasabay nito, nagbibigay ang GGL at closure test ng independent cross-dataset constraints, at nananatiling matatag ang ranking sa ilalim ng σ_int, R_min, at cov-shrink stress tests (tingnan ang Seksyon 6 at Talahanayan S1b).

5.2 Mga Resulta ng Closure Test (RC-only → GGL)

Iniuulat sa Talahanayan S1b at Fig. S3 ang pangunahing closure-test quantity na ΔlogL_closure. Ang pamilya ng EFT ay may closure strengths na 171.977–280.513, mas mataas kaysa sa 126.678 ng DM_RAZOR. Ibig sabihin, nang walang pinapayagang dagdag na cross-data degrees of freedom, ang posterior samples na nakuha ng EFT mula sa RC data ay may mas malakas na transferable predictive power para sa GGL data.

Mas lalo pang sinusuportahan ng negative control ang pisikal na kaugnayan ng closure signal: kapag random na na-shuffle ang RC-bin→GGL-bin grouping, bumababa ang closure strength ng EFT sa 6–15 (may maliliit na pagkakaiba sa pagitan ng kernels), samantalang ang baseline closure strength ay kasing-taas ng 172–281. Ang “signal collapse” na ito ay nag-aalis sa maling bentahe na maaaring dulot ng numerical implementation, unit errors, o maling covariance handling.

Fig. R1 | Negative control: pagkatapos ng shuffle grouping, makabuluhang bumababa ang closure signal (ginuhit mula sa Tab_Z1 metrics).

5.3 Kahulugan at mga Limitasyon ng Resulta

Ang kongklusyon ng pag-aaral na ito ay: “sa ilalim ng dataset at protocol na ito, nahihigitan ng EFT mean-gravity correction ang nasubok na DM_RAZOR baseline.” Dapat idiin na ang panig ng DM ay gumagamit lamang ng minimal na NFW baseline na may fixed c(M) relation, walang core formation, nonsphericity, environmental terms, o mas komplikadong galaxy–halo connection models. Kaya hindi inaangkin ng manuskrito na ito na na-eexclude ang lahat ng pamilya ng DM models. Sa halip, nagbibigay ito ng reproduksibleng control baseline na nakasentro sa closure test para suriin kung maipapaliwanag nang konsistent ang RC at GGL sa pamamagitan ng parehong cross-data parameters at mapping.

Upang tugunan ang karaniwang alalahaning ito, nagtapos kami ng independent extension project, P1A (tingnan ang Appendix B). Nang hindi binabago ang RC-bin→GGL-bin shared mapping o audit framework, pinapalakas nito ang DM baseline sa isang “standardized and auditable” na paraan: bukod sa tatlong one-parameter enhancements (SCAT/AC/FB), idinadagdag pa nito ang (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) one-parameter baryonic-feedback core proxy (DM_CORE1P), at (iii) weak-lensing-side shear-calibration nuisance m (DM_RAZOR_M), at iniuulat ang pinagsamang modelong DM_STD; pinananatili ang EFT_BIN bilang control reference.

• DM_RAZOR_SCAT (c–M scatter) — ipinapasok ang halo-to-halo concentration-scatter parameter σ_logc upang subukin kung sistematikong minamaliit ng fixed c(M) ang explanatory power ng DM;
• DM_RAZOR_AC (Adiabatic Contraction) — gumagamit ng single parameter α_AC upang tuloy-tuloy na mag-interpolate sa pagitan ng “no contraction” at “standard contraction,” na kinukuha ang tendensiya ng baryons na i-contract ang inner halo sa minimal cost;
• DM_RAZOR_FB (Feedback/core) — gumagamit ng core scale (halimbawa, log r_core) upang ilarawan kung paano pinipigil ng inner-core formation ang rotation curves, habang pinananatili ang NFW approximation sa weak-lensing scales.

Ibinibigay ang quantitative P1A scoreboard sa Appendix B, Talahanayan B1 / Fig. B1 (awtomatikong generated mula sa Tab_S1_P1A_scoreboard). Sa closure metric, ang DM_RAZOR_FB ay nagbibigay ng maliit na net improvement (122.21→129.45, +7.25), samantalang ang iba pang enhancements ay nagbibigay ng di-makabuluhan o negatibong ambag sa closure strength. Sa joint-fit side, ang pagdagdag ng hierarchical c–M scatter prior (DM_HIER_CMSCAT) o pinagsamang modelo (DM_STD) ay maaaring lubos na magpabuti sa joint logL, ngunit hindi nito pinapabuti ang closure strength, na nagpapahiwatig na pangunahing nagdadagdag ito ng joint-fit flexibility kaysa cross-probe transferability. Kaya dapat basahin ang core conclusion ng pangunahing teksto nang ganito: sa ilalim ng mahigpit na shared-mapping at closure-test constraints, ang cross-data consistency advantage ng EFT ay hindi nagmumula sa pagpili ng “labis na mahinang baseline” sa panig ng DM. Ang P1A release package na tumutugma sa Appendix B (supplementary tables/figures at full_fit_runpack) ay isasama bilang karagdagang files sa ilalim ng parehong Zenodo Concept DOI ng full_fit_runpack para sa papel na ito: https://doi.org/10.5281/zenodo.18526286.

6 Robustness at Control Experiments

6.1 σ_int Scan (Run-5)

Sistematikong ini-scan namin ang intrinsic RC scatter σ_int at inuulit ang joint inference sa bawat σ_int, kinukuwenta ang ΔlogL_total relative to DM_RAZOR. Iniuulat sa Talahanayan S1b ang minimum/maximum ΔlogL_total values para sa bawat modelo sa buong scan range.

Fig. R2 | Range ng ΔlogL_total sa ilalim ng σ_int scan (mas mataas ay mas mabuti).

6.2 R_min Scan (Run-6)

Upang subukin ang epekto ng systematics sa central-region data (gaya ng noncircular motion, resolution, at kulang na baryonic modeling), inilalapat namin ang R_min threshold cuts sa RC at inuulit ang joint inference. Nananatiling positibo at matatag ang sukat ng bentahe ng pamilya ng EFT sa ilalim ng R_min scan.

Fig. R3 | Range ng ΔlogL_total sa ilalim ng R_min scan (mas mataas ay mas mabuti).

6.3 cov-shrink Scan (Run-7)

Upang subukin ang uncertainty sa GGL covariance, inilalapat namin ang shrinkage sa covariance matrix ng bawat mass bin: C_α=(1−α)C+α·diag(C), at ini-scan ang α. Ipinapakita ng mga resulta na hindi sensitibo ang bentahe ng pamilya ng EFT sa treatment na ito.

Fig. R4 | Range ng ΔlogL_total sa ilalim ng cov-shrink scan (mas mataas ay mas mabuti).

6.4 Ablation Ladder (Run-8)

Sa loob ng EFT_BIN, nagsasagawa kami ng nested ablations: mula sa minimal model (walang free parameters), patungo sa mga bersyong may iilang degrees of freedom lamang, at sa huli ay sa kumpletong 20-bin amplitude + global scale model. Ipinapakita ng AICc/BIC na malakas na kinakailangan ng datos ang kumpletong EFT_BIN model.

Fig. R5 | EFT_BIN ablation ladder (AICc; mas mababa ay mas mabuti).

6.5 Holdout Prediction (Run-9)

Nagpapatakbo pa kami ng leave-one-bin-out (LOO) test: sa 4 GGL mass bins, isang bin ang iniiwan sa bawat pagkakataon; inuulit ang inference gamit ang natitirang bins (at lahat ng RC), at pagkatapos ay sinusuri ang test log-likelihood sa held-out bin. Ibinibigay ang summary metrics sa supplementary table na Tab_R3_leave_one_bin_out (isang Run-9 product; nakalista ang file path patterns sa key-product list sa Seksyon 8.2). Nananatiling malinaw na mas mahusay ang pamilya ng EFT kaysa DM_RAZOR kahit sa pinakamasamang held-out case.

Fig. R6 | LOO: log-likelihood distribution para sa held-out bin (mula sa Run-9 products).

6.6 Negative Control: RC-bin Shuffle (Run-10)

Random na nire-regroup ng Run-10 ang 20 RC bins sa 4×5 at nire-recompute ang closure habang hindi binabago ang RC-only posterior. Ipinapakita ng mga resulta na, kumpara sa orihinal na mapping, makabuluhang pinabababa ng shuffling ang parehong closure mean logL_true at ΔlogL_closure (tingnan ang Talahanayan S1b at Fig. R1), na higit pang sumusuporta sa interpretability ng closure signal.

Fig. R7 | Negative control: nagdudulot ang shuffle mapping ng malinaw na pagbaba sa closure mean logL_true (mula sa Run-10 products).

7 Traceability at Consistency Audit (Provenance)

Lahat ng numerikal na halagang sinipi sa papel na ito ay maaaring sundan item by item sa mahigpit na summary tables at audit records ng release archive. Upang maging mas madaling basahin ang pangunahing teksto, inilipat sa Appendix A ang buong provenance chain (tag list, audit tables, checksum list, at verification method).

8 Reproducibility at Zenodo Archive

Pahayag sa kakayahang makuha ang datos at code: ang SPARC rotation-curve data at KiDS-1000 weak-lensing data na ginamit sa papel na ito ay mga pampublikong dataset. Ang publication-grade report ay naka-archive sa Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), at ang full reproduction package ay naka-archive sa Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Ibinibigay sa Appendix A ang detalyadong execution steps, dependency environment, archive inventory, at hash-verification information; ibinibigay naman sa Appendix B ang design, run tags, at outputs ng DM-baseline standardization stress test (P1A).

Sa ilalim ng parehong full-reproduction-package Concept DOI (https://doi.org/10.5281/zenodo.18526286), nagbibigay kami ng dalawang reproducible entry point ayon sa use case: • P1 (pangunahing teksto) full_fit_runpack: nire-reproduce ang RC-only / closure / joint analyses at robustness scans para sa EFT vs DM_RAZOR, at gumagawa ng main-text assets kabilang ang Talahanayan S1a/S1b at Figs. S3/S4; • P1A (Appendix B) full_fit_runpack: nire-reproduce ang DM-baseline standardization stress test (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD, kabilang ang EFT_BIN control), at gumagawa ng Appendix Table B1 at Fig. B1. Isasama ang supplementary tables/figures at full_fit_runpack ng P1A bilang karagdagang files sa ilalim ng parehong Concept DOI upang mapanatili ang iisang archive entry point.

9 Pasasalamat at mga Deklarasyon

9.1 Pasasalamat

Nagpapasalamat kami sa mga koponan ng SPARC at KiDS-1000 para sa pagbibigay ng pampublikong datos at dokumentasyon, at sa mga kalahok sa reconstruction at audit workflow ng proyektong ito.

9.2 Ambag ng May-akda

Si Guanglin Tu ang responsable sa conceptual proposal, study design, engineering implementation, data curation, formal analysis, implementation at audit ng reproducibility workflow, at pagsulat ng manuskrito.

9.3 Pagpopondo

Sariling pondo ng may-akda, Guanglin Tu (walang panlabas na pondo / walang grant number).

9.4 Competing Interests

Ang may-akda, Guanglin Tu, ay kaugnay ng “EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)”; walang ibang competing interests na idineklara.

9.5 Tulong ng AI

Ginamit ang OpenAI GPT-5.2 Pro at Gemini 3 Pro para sa language polishing, structural editing, at pag-oorganisa ng reproducibility workflow. Hindi ginamit ang mga ito upang bumuo o magbago ng datos, resulta, figure, talahanayan, o code, ni upang gumawa ng citations. Buong pananagutan ng may-akda ang nilalaman at katumpakan ng citations sa buong manuskrito.

10 Mga Sanggunian

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
Energy Filament Theory. Zenodo (open science repository) DOI: https://doi.org/10.5281/zenodo.18517411

Appendix A: Mga Detalye ng Traceability at Reproducibility

Binubuod ng appendix na ito ang long-term archive information para sa traceability at reproducibility, kabilang ang run tags, audit results, archive inventories, at key verification points, upang masuri at ma-reproduce ng mga mambabasa ang gawain kung kinakailangan.

A.1 Mga Detalye ng Traceability at Audit

Upang matiyak ang long-term traceability, gumagamit ang proyektong ito ng timestamped tags para sa bawat run at output, at pinananatili ang historical products nang hindi ino-overwrite ang mga ito. Ang core values na sinipi sa manuskritong ito ay nagmumula sa strict compilation (compile_tag=20260205_035929) at nakapasa sa sumusunod na consistency audits:

• Lahat ng stage-level tables ay may run_tag at stage tags; pinipili ng strict compilation script ang “complete and consistent” canonical table sources mula sa report/tables.

• Ang mga halaga sa Tab_Z1_master_summary at Tab_Z2_conclusion_highlights ay inihahambing item by item laban sa mga napiling canonical tables.

• Sa panahon ng PDF generation, isinasagawa ang tag audit sa “referenced table/figure tags” upang matiyak na hindi nahahalo ang outdated products.

Mahahalagang tag (para mahanap ang lahat ng intermediate products): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Resulta ng consistency audit: ang Tab_AUDIT_checks_strict ay nag-uulat ng pass=9, fail=0, skip=0 (tingnan ang release package para sa detalye).

A.2 Reproducibility Execution Steps at Archive Inventory

Ginagamit ng pag-aaral na ito ang reproducibility system na binubuo ng “publication-grade report + tables/figures supplement + fully rerunnable run package.” Maaaring direktang konsultahin ng mga mambabasa ang Tables & Figures Supplement upang i-verify ang lahat ng table/figure assets na sinipi sa papel; upang i-reproduce ang numerical values at audit chain mula sa simula, maaari nilang gamitin ang full_fit_runpack upang i-download ang datos at patakbuhin muli ang kumpletong workflow. Pagkatapos makumpleto, maaaring gamitin ang built-in reference-table comparison script ng package upang i-verify ang table-value consistency.

A.2.1 Reproduction Quickstart (RUN_FULL, Windows PowerShell)

Nagbibigay ang seksyong ito ng mas maikling reproduction path (Windows PowerShell). Para sa quick checks, inirerekomenda sa mga mambabasa na direktang konsultahin ang Tables & Figures Supplement at i-verify item by item ang siniping mga talahanayan at figures. Para sa end-to-end reproduction at generation ng lahat ng tables, figures, at audit products, gamitin ang full_fit_runpack: sundin ang package README/ONE_PAGE_REPRO_CHECKLIST upang patakbuhin ang verify_checksums.ps1 at RUN_FULL.ps1 (inirerekomenda ang Mode=full).

Zenodo archive entry (Concept DOI): https://doi.org/10.5281/zenodo.18526286. Main-chain tags para sa papel na ito: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.

A.2.2 Archive Materials at Key Verification Points (Packages & checks)

Nagbibigay ang Zenodo archive ng tatlong komplementaryong kategorya ng materyal: (1) publication-grade report (ang papel na ito, v1.1; kabilang ang Appendix B: P1A DM-baseline standardization stress test); (2) Tables & Figures Supplement (supplementary tables at figures na sumasaklaw sa lahat ng table/figure assets na sinipi sa papel na ito, hiwalay na tumutugma sa P1 at P1A); at (3) full_fit_runpack (full reproduction package: nagda-download ng datos mula sa simula at nagpapatakbo muli ng kumpletong workflow, hiwalay na tumutugma sa P1 at P1A). Sinusuportahan ng items (1)–(2) ang mabilis na pagbasa at independent verification; nagbibigay ang item (3) ng end-to-end full reproducibility.

Kategorya ng materyal	Pangalan ng file (halimbawa)	Layunin at pagpoposisyon (inirerekomendang ayos ng paggamit)
Publication-grade report (Chinese at English)	P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf	Kumpletong ulat na naka-archive sa Zenodo; ibinibigay ng pangunahing teksto ang core conclusions at robustness audits, at ibinibigay ng Appendix B ang P1A (DM-baseline standardization stress test).
Tables & Figures Supplement (P1)	P1_RC_GGL_supplement_figs_tables_V1_1.zip	Lahat ng talahanayan (CSV) at figures (PNG) na sinipi sa pangunahing teksto, kabilang ang generation scripts at tag files.
Tables & Figures Supplement (P1A)	P1A_supplement_figs_tables_v1.zip	Lahat ng talahanayan at figures na sinipi sa Appendix B (P1A), kabilang ang Tab_S1_P1A_scoreboard at Fig_S1_P1A_scoreboard.
full_fit_runpack (P1)	P1_RC_GGL_full_fit_runpack_v1_1.zip	End-to-end full reproduction: i-download ang datos mula sa simula at patakbuhing muli ang RC-only/closure/joint at robustness scans.
full_fit_runpack (P1A)	P1A_RC_GGL_full_fit_runpack_v1.zip	End-to-end full reproduction (Appendix B): rerun DM 7+1 + DM_STD (including the EFT_BIN control) and generate appendix assets; the package includes a reference-table comparison script for verifying table-value consistency.

Rekomendasyon sa citation: kapag sinisipi ang papel na ito o ang kasamang reproducibility materials, pakisipi ang Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Mahahalagang produktong dapat lumitaw at maihambing pagkatapos ng reproduction ay kinabibilangan ng:

report/tables/Tab_D_closure_summary__20260204_122515__*.csv (closure summary)
report/tables/Tab_F_joint_summary__20260204_122515__*.csv (joint-fit summary)
report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (σ_int scan)
report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (R_min scan)
report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (cov-shrink scan)
report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (negative control)
report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (Strict master table; tumutugma sa Talahanayan S1a/S1b at mga halaga sa pangunahing teksto)
report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (publication-grade PDF bundle; maaaring gamitin para sa mabilis na pag-browse at citation)

Appendix B: P1A—DM-Baseline Standardization Stress Test (DM 7+1 + DM_STD; may EFT Control)

Idinodokumento ng appendix na ito ang extension project (P1A) para sa “DM-baseline standardization stress testing” na konsistent sa closure protocol ng pangunahing teksto. Ang papel nito ay i-upgrade ang minimal DM_RAZOR baseline na ginamit sa pangunahing teksto (NFW + fixed c–M, walang scatter / walang contraction / walang core) tungo sa DM baseline set na mas malapit sa astrophysical practice at mas matibay laban sa karaniwang kritisismo, nang hindi nagpapasok ng malaking bilang ng degrees of freedom at nang hindi binabago ang RC-bin→GGL-bin shared mapping o audit framework. Sinasaklaw ng P1A, at superset ito ng, naunang three-branch stress test: pinananatili nito ang SCAT/AC/FB habang idinadagdag ang hierarchical c–M scatter + prior, one-parameter core proxy, at lensing-side shear-calibration nuisance m; nagbibigay din ito ng pinagsamang modelong DM_STD. Pinananatili ang EFT_BIN bilang control reference.

Supplementary note: ang closure strengths at kaugnay na values sa Appendix B (P1A) ay gumagamit ng mas malaking Monte Carlo budget (halimbawa, ndraw=400, nperm=24) kaysa sa quick budget na ginamit sa pangunahing teksto upang masaklaw ang buong EFT kernel family (halimbawa, ndraw=60, nperm=12). Kaya maaaring magpakita ang absolute values ng O(10)-level sampling drift. Gayunman, patas ang model-to-model comparisons sa loob ng parehong budget/table, at nananatiling matatag sa mga budget ang tanda at sukat ng bentahe.

B.1 Layunin at Pagpoposisyon (Bakit P1A, at Bakit Bilang Appendix)

Hindi sinusubukan ng P1A na ubusin ang lahat ng posibleng ΛCDM halo modeling choices (gaya ng nonsphericity, environmental dependence, complex galaxy–halo connections, o high-dimensional baryon physics). Sa halip, sinusunod ng P1A ang prinsipyong “low-dimensional, auditable, reproducible”: bawat enhancement module ay nagpapasok lamang ng ≤1 key effective parameter at nananatiling saklaw ng tatlong mahigpit na constraint ng papel na ito:
(i) Parameter ledger: bawat bagong parameter ay dapat tahasang itala at iulat kasama ang information criteria (AICc/BIC);
(ii) Shared mapping: ginagamit pa rin ang parehong RC-bin→GGL-bin grouping map; hindi pinapayagan ang hiwalay na “tuning the mapping” para sa iisang dataset;
(iii) Closure test: anumang enhancement ay dapat magpakita ng tunay na gain sa RC→GGL transfer prediction, hindi lamang mas mahusay na RC-only fitting.

B.2 DM 7+1 + DM_STD: Mga Depinisyon ng Module, Parameters, at Pagpasok sa Joint Posterior

Bilang independent runpack, nagbibigay ang P1A ng 8 DM workspaces (DM 7+1) plus 1 EFT control: mula sa DM_RAZOR bilang baseline, bumubuo ito ng tatlong legacy one-parameter enhancements (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), nagdadagdag ng tatlong mas standard na defensive modules (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), at pagkatapos ay nagbibigay ng pinagsamang modelong DM_STD. Ang shared goal ng mga module na ito ay saklawin ang tatlong pinakakaraniwang kritisismo habang dinaragdagan ang dimensionality sa pinakamaliit na paraan: (a) paano pumapasok ang c–M scatter at priors sa hierarchical model; (b) kung makukuha ba ang pangunahing epekto ng baryonic feedback ng one-parameter core proxy; at (c) kung maaaring mapagkamalang physical signal ang key lensing-side systematics.

Workspace	dm_model	Bagong parameter(s) (≤1)	Pisikal na motibasyon (core)	Prinsipyo ng implementation (audit-friendly)
DM_RAZOR	NFW (fixed c–M, walang scatter)	—	Minimal at naa-audit na ΛCDM halo baseline; ginagamit para sa mahigpit na paghahambing sa EFT	Fixed ang shared mapping; mahigpit ang parameter ledger; ginagamit lamang bilang baseline para sa relative comparison
DM_RAZOR_SCAT	NFW + c–M scatter (legacy)	σ_logc	May scatter ang c–M relation; ina-approximate gamit ang one-parameter log-normal scatter	≤1 bagong parameter; pinananatili ang shared mapping; closure gain ang ginagamit bilang acceptance criterion
DM_RAZOR_AC	NFW + Adiabatic Contraction (legacy)	α_AC	Maaaring magdulot ang baryonic infall ng halo adiabatic contraction; ina-approximate gamit ang one-parameter strength	≤1 bagong parameter; hindi binabago ang mapping; iniuulat ang AICc/BIC changes at closure gain
DM_RAZOR_FB	NFW + feedback core (legacy)	log r_core	Maaaring bumuo ang feedback ng core sa inner region; ina-approximate gamit ang one-parameter core scale	≤1 bagong parameter; parehong closure/negative-control protocol; hindi lamang RC-only improvement ang target
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc (hier)	Mas standard na hierarchical c_i∼logN(c(M_i),σ_logc); naaapektuhan ang joint posterior ng parehong RC at GGL	Explicit prior; marginalized ang latent c_i; low-dimensional at naa-audit pa rin
DM_CORE1P	1-parameter core proxy (inspirado ng coreNFW/DC14)	log r_core	Gumagamit ng one-parameter core proxy para sa pangunahing epekto ng baryonic feedback, iniiwasan ang high-dimensional star-formation details	Sumisipi ng standard literature; ≤1 bagong parameter; nakatali sa closure test
DM_RAZOR_M	NFW + lensing shear-calibration nuisance	m_shear (GGL)	Inaabsorb ang isang key weak-lensing systematic bilang effective parameter, binabawasan ang panganib na mapagkamalang pisika ang systematics	Tahasang nire-record ang nuisance; hindi makaaapekto pabalik sa RC; pangunahing hinahatulan ang resulta sa pamamagitan ng closure robustness
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Isinasama ang tatlong pinakakaraniwang klase ng kritisismo sa standard baseline na low-dimensional pa rin	Iniuulat ang parameter ledger + information criteria; closure ang pangunahing metric; ginagamit bilang pinakamalakas na DM defensive control

Tala: ang mga pangalan ng parameter sa itaas ay sumusunod sa engineering implementation (halimbawa, σ_logc, α_AC, log r_core, at m_shear). Ang design focus ng P1A ay “gawing medyo mas malakas ang DM baseline habang pinananatili itong naa-audit,” hindi gawing uncontrollable high-dimensional fitter ang panig ng DM. Partikular, ipinapasok ng DM_HIER_CMSCAT ang c–M scatter nang hierarchical: ang concentration c_i ng bawat halo ay binibigyan ng log-normal scatter sa paligid ng c(M_i), constrained ng global σ_logc at c(M) prior; naaapektuhan ng hierarchical structure na ito ang joint posterior ng parehong RC at GGL.

B.3 Estadistikal na Protokol at Product Conventions na Konsistent sa Pangunahing Teksto

Muling ginagamit ng P1A ang lahat ng data products, shared mapping, at audit framework mula sa pangunahing teksto. Nananatiling konsistent ang execution order at product conventions:
(1) Run‑1: RC-only inference (outputs posterior_samples.npz at metrics.json);
(2) Run‑2: RC→GGL closure test (outputs closure_summary.json at permuted baseline);
(3) Run‑3: RC+GGL joint fit (outputs joint_summary.json).
Lahat ng siniping numero ay nagmumula sa awtomatikong compiled table (Tab_S1_P1A_scoreboard) at maaaring suriin pagkatapos patakbuhing muli ang buong P1A workflow gamit ang reference-table comparison script na built into the P1A full_fit_runpack.

B.4 Pangunahing Resulta, Table/Figure Entry Points, at Archive Plan (Parehong DOI)

Ibinibigay ng seksyong ito ang core quantitative conclusions ng P1A. Binubuod ng Talahanayan B1 ang key metrics para sa RC-only, RC→GGL closure, at RC+GGL joint fitting (ang parentheses ay nagpapakita ng differences relative to the DM_RAZOR baseline). Ang closure strength ay tinutukoy bilang ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (mas mataas ay mas mabuti). Ipinapakita ng Fig. B1 ang parehong scoreboard. Ang mga pangunahing punto ay ang mga sumusunod:
• Sa tatlong legacy branches, tanging DM_RAZOR_FB (feedback/core) ang nagbibigay ng maliit na net improvement sa closure strength: 122.21→129.45 (+7.25); walang net improvement ang SCAT at AC;
• Ang bagong idinagdag na DM_HIER_CMSCAT at DM_RAZOR_M ay may napakaliit na epekto (~0) sa closure strength, at hindi rin nagpapakita ang DM_CORE1P ng makabuluhang net improvement;
• Maaaring lubos na magpabuti ang pinagsamang modelong DM_STD sa joint logL (mas malapit sa joint-fit optimum), ngunit bumababa ang closure strength nito, na nagpapahiwatig na ang gain nito ay pangunahing mula sa joint-fit flexibility kaysa cross-probe transferability;
• Bilang kontrol, nananatili pa rin ang malinaw na bentahe ng EFT_BIN sa parehong closure strength at joint fitting. Kaya matatag ang pangunahing kongklusyon laban sa pagpapasok ng “mas malakas na DM baseline + lensing nuisance.”

Para sa direktang paghahambing sa main-text results, binubuod ng Talahanayan S1a–S1b ang mahigpit na paghahambing sa pagitan ng pamilya ng EFT at DM_RAZOR: pinapabuti ng EFT models ang joint fit ng ΔlogL_total≈1155–1337 relative to DM_RAZOR at umaabot sa ΔlogL_closure=172–281 sa closure test. Gumagawa lamang ang P1A ng “mas mahigpit na kontrol” sa panig ng DM; ang layunin nito ay bawasan ang mga alalahaning gaya ng “strawman baseline” o “systematics-as-physics,” hindi palitan ang pangunahing paghahambing.

Talahanayan B1 | P1A scoreboard (mas mataas ay mas mabuti; ipinapakita ng parentheses ang differences relative to the DM_RAZOR baseline).

Sangay ng modelo (workspace)	Δk	Pinakamahusay na RC-only logL_RC (Δ)	Closure strength ΔlogL_closure (Δ)	Pinakamahusay na joint logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Fig. B1 | P1A scoreboard: closure at joint ΔlogL relative to baseline (mas mataas ay mas mabuti).

Halimbawang tags para sa completed run set na tumutugma sa appendix na ito (ginagamit upang mahanap ang P1A intermediate products at tables/figures):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.

B.5 Iminungkahing Citation (Appendix Citation Note)

Kapag kailangang sipiin ng mga mambabasa ang “DM-baseline standardization stress test” bukod sa pangunahing kongklusyon ng papel, inirerekomendang sipiin nila ang pangunahing kongklusyon kasama ang sumusunod na tala: “Tingnan ang Appendix B (P1A) para sa standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), sa ilalim ng parehong closure protocol.”