Isang paliwanag para sa publiko batay sa “P1_RC_GGL: Mahigpit na Pagsusuri ng Pagsasara para sa Dinamika ng Galaksiya at Weak Lensing (v1.1)”
Mga tala sa pagbasa |
Ito ay isang edisyong paliwanag, hindi isa pang akademikong ulat. Batay ito sa orihinal na ulat ng P1, pinananatili ang mahahalagang talahanayan at larawan, at idinaragdag sa bawat pangunahing hakbang ang paliwanag para sa publiko kung “ano ang ibig sabihin nito.” |
Binabasa lamang ng artikulong ito ang mga konklusyon ng P1 sa loob ng itinakda nitong datasets, parameter ledger, at statistical protocol: sa pinagsamang pagsusuri ng galaxy rotation curves (RC) at galaxy–galaxy mahinang lensing (GGL), malinaw na nauuna ang modelo ng karaniwang tugon ng grabidad ng EFT kaysa sa minimal na DM_RAZOR baseline na sinubok dito. |
Hindi binabasa ng artikulong ito ang P1 bilang konklusyong “napabagsak ang madilim na materya.” Ang P1 ay unang hakbang lamang ng seryeng eksperimento na P; sinusubok nito ang isang observable layer ng EFT, ang “mean gravity floor,” hindi ang buong nilalaman ng kumpletong teoryang EFT. |
0 | Unawain muna ang P1 sa loob ng limang minuto: ano ba talaga ang sinusuri nito?
Isipin ang P1 bilang isang eksperimento ng pagpapatunay sa pagitan ng magkaibang probe. Hindi lang nito tinatanong kung kayang i-fit ng isang modelo ang isang dataset; inilalagay nito sa iisang mesa ng audit ang dalawang magkaibang pagbasa ng grabidad: binabasa ng mga kurba ng pag-ikot (RC) ang dinamika sa loob ng disk ng galaksiya, samantalang binabasa ng galaxy–galaxy mahinang lensing (GGL) ang nakaproyektong tugon ng grabidad sa mas malalaking sukat.
- Ang RC ay parang speedometer: ipinapakita nito kung gaano kabilis umiikot ang gas at mga bituin sa iba’t ibang radius ng disk ng galaksiya.
- Ang GGL naman ay parang timbangan: mula sa bahagyang pagbaluktot ng liwanag sa likod ng mga galaksiyang nasa unahan, tinatantiya nito ang karaniwang distribusyon ng grabidad/massa sa paligid ng mga galaksiya sa mas malalaking sukat.
- Ito ang pangunahing tanong ng P1: kaya ba ng iisang modelo na matuto muna ng tuntunin mula sa RC, pagkatapos ay ilipat ang tuntuning iyon sa GGL at manatiling makabuluhan?
Pinakapusod na pangungusap ng P1 |
Itinataas ng P1 ang pamantayan ng paghahambing mula sa “gaano kahusay ang single-probe fit?” tungo sa “kaya ba nitong magsara sa pagitan ng mga probe?” Kapag mahusay sa tamang mapping at bumabagsak ang signal matapos i-shuffle ang mapping, mas malamang na nahuli ng modelo ang istrukturang grabidad na magkapareho sa RC at GGL. |
Talahanayan 0 | Mga pangunahing numero ng P1 at kung paano ito babasahin ng karaniwang mambabasa
Sukatan | Pagbasa sa loob ng P1 / P1A | Paano ito uunawain ng karaniwang mambabasa |
Pinagsamang fitting ΔlogL_total | Sa pangunahing paghahambing sa katawan, ang EFT ay 1155–1337 na mas mataas kaysa DM_RAZOR | Kabuuang pagkakaiba ng score kapag pinagsama ang dalawang dataset; mas malaki, mas mabuti ang kabuuang paliwanag. |
Lakas ng pagsasara ΔlogL_closure | Sa pangunahing paghahambing sa katawan, 172–281 ang EFT, samantalang 127 ang DM_RAZOR | Kakayahang hulaan ang GGL matapos huminuha gamit ang RC lamang; mas malaki, mas “self-consistent” sa pagitan ng mga probe. |
Negatibong kontrol na shuffle | Matapos guluhin ang RC-bin→GGL-bin, bumaba sa 6–23 ang closure signal ng EFT | Kapag nasira ang tamang pagtutugma, dapat mawala ang bentahe; habang mas malinaw itong nawawala, mas mahusay nitong naaalis ang pekeng signal. |
P1A multi-DM stress test | DM 7+1 + DM_STD, at pinanatili ang EFT_BIN bilang kontrol | Hindi lamang minimal na DM_RAZOR ang tinitingnan ng P1A; inilalagay nito ang ilang mababang-dimensiyon at maa-audit na DM enhancement branch sa iisang closure protocol. |
1 | Bakit kailangang gawin ang P1? Saan naiipit ang kosmolohiya sa sukat ng galaksiya?
Matagal na mahirap lutasin ang mga suliranin sa sukat ng galaksiya dahil ang pangangailangan para sa “dagdag na grabidad/massa” ay hindi lamang usapin ng kurba ng pag-ikot. Ipinakikita ng maraming obserbasyon ang mahigpit na ugnayan sa pagitan ng nakikitang baryonikong materya sa mga galaksiya at ng aktuwal na pagbasa ng dinamika/lensing. Para sa landas ng madilim na materya, nangangahulugan ito na kailangang napakapinong iugnay ang mga dark halo, baryonikong feedback, kasaysayan ng pagbuo ng galaksiya, at mga sistematika ng obserbasyon. Para naman sa mga landas ng grabidad na hindi umaasa sa madilim na materya, hindi sapat na magmukhang mahusay ang modelo sa RC; dapat din itong manatiling matatag sa mahinang lensing, mga batas ng population scaling, at negatibong kontrol.
Ito ang motibasyon ng P1. Hindi ito nagsisimula sa pahayag na “mali ang madilim na materya” o “tiyak na tama ang EFT.” Sa halip, dinadala nito sa audit ang isang masusuring pahayag: kaya bang mag-iwan ang karaniwang tugon ng grabidad sa EFT ng signal na nare-reproduce at naililipat sa pagsasara ng RC→GGL sa pagitan ng mga probe?
Panlabas na background ng literatura: bakit mahalaga ang RC+GGL window? |
Ipinakita ng radial acceleration relation (RAR) na iminungkahi nina McGaugh, Lelli, at Schombert noong 2016 na may mahigpit na ugnayan, at napakaliit na scatter, sa pagitan ng observed acceleration na sinusundan ng rotation curves at ng acceleration na hinuhulaan mula sa baryonic matter. Dahil dito, hindi maiiwasan ng anumang teorya sa sukat ng galaksiya ang baryon–gravity-response coupling. |
Ginamit nina Brouwer et al. (2021) ang KiDS-1000 mahinang lensing upang palawigin ang RAR sa mas mababang acceleration at mas malalaking radius, at ikinumpara ang MOND, Verlinde emergent gravity, at LambdaCDM models. Itinuro rin nila na ang pagkakaiba ng early-type at late-type galaxies, gaseous halos, at galaxy–halo connections ay nananatiling mahahalagang suliranin sa paliwanag. |
Mas pinalawak pa nina Mistele et al. (2024) ang paggamit ng mahinang lensing upang baligtaring tukuyin ang circular velocity curves ng isolated galaxies, at iniulat nilang walang malinaw na pagbaba sa saklaw na daan-daang kpc hanggang humigit-kumulang 1 Mpc, na tugma sa BTFR. Ipinapakita nito na ang mahinang lensing ay nagiging mahalagang panlabas na pagbasa para subukan ang galaxy-scale gravitational response. |
Kaya ang halaga ng P1 ay hindi nasa pagiging “unang nagtalakay sa RC at GGL nang magkasama,” kundi sa paglalagay sa kanila sa isang maa-audit na protocol na binubuo ng nakapirming mapping, talaang pang-parameter, pagsasarang RC-only→GGL, negatibong kontrol na shuffle, at P1A multi-DM stress test.
2 | Ano ang ibig sabihin ng EFT sa P1? Hindi ito teoryang epektibong larangan
Dito, ang EFT ay tumutukoy sa Teorya ng Hibla ng Enerhiya (Energy Filament Theory), hindi sa teoryang epektibong larangan (Effective Field Theory) na karaniwan sa pisika. Sa teknikal na ulat ng P1, maingat at limitado ang paggamit sa EFT: hindi ito ipinapasok bilang kumpletong pangwakas na teorya, kundi pinapaliit muna bilang isang parameterisasyon ng “karaniwang tugon ng grabidad” na maaaring maobserbahan, ma-fit, at mapabulaanan.
Sa mas payak na salita: hindi muna tinatalakay ng P1 ang lahat ng mikroskopikong pinagmumulan ng dagdag na grabidad, at hindi rin nito sinusubukang patunayan nang isang bagsakan ang buong EFT. Mas makitid ngunit mas matigas ang tanong nito: kung may isang uri ng karaniwang dagdag na tugon ng grabidad sa sukat ng galaksiya, kaya ba nitong ipaliwanag muna ang RC at pagkatapos ay hulaan ang GGL?
Anong bahagi ng EFT ang kinukuha ng P1? |
Kinukuha ng P1 ang “mean gravity floor”: isang statistically stable na karaniwang ambag na maaaring ilipat sa iba’t ibang sample. |
Hindi muna hinahawakan ng P1 ang “noise floor” (stochastic / noise floor): ang mga random term, indibiduwal na pagkakaiba, o karagdagang dispersion na maaaring manggaling sa mas mikroskopikong fluctuation processes. |
Hindi rin tinatalakay ng P1 ang buong mikroskopikong mekanismo, abundance, lifetime, o global cosmological constraints. Unang hakbang ito ng seryeng P, hindi pangwakas na hatol. |
3 | Plano ng serye ng P1: bakit magsisimula sa “karaniwang batayan”?
Maaaring unawain ang seryeng P bilang programa ng obserbasyonal na retrieval para sa EFT. Hindi nito inilalatag nang sabay-sabay ang lahat ng pahayag; inuuna nito ang bahaging pinakamadaling subukan gamit ang pampublikong datos. Ang estratehiya ng P1 ay subukan muna ang karaniwang termino: kung hindi man lang maisara ng karaniwang tugon ng grabidad ang RC→GGL, mahina ang pasukan para talakayin pa ang mas komplikadong mga termino ng ingay o mikroskopikong mekanismo.
Talahanayan 1 | Patong-patong na posisyon ng seryeng P
Antas | Tanong na kailangang sagutin | Posisyon sa P1 |
P1 | Kaya bang magsara ang karaniwang tugon ng grabidad sa RC→GGL? | Pangunahing tanong ng kasalukuyang ulat |
P1A | Kapag pinalakas ang panig ng DM, nananatili bang matatag ang konklusyon? | Appendix B: DM 7+1 + DM_STD stress test |
Mga susunod na seryeng P | Maaari ba itong palawakin sa mas maraming datos, mas maraming probe, at mas komplikadong sistematikong error? | Direksiyon ng susunod na gawain |
Mas malalim na tanong | Paano ikokonekta ang karaniwang termino, noise term, at mikroskopikong mekanismo? | Hindi sakop ng mga konklusyon ng P1 |
4 | Ano ang datos? Ano ang sinasabi ng RC at GGL?
4.1 Mga kurba ng pag-ikot RC: ang “panukat ng bilis” sa disk ng galaksiya
Itinatala ng mga kurba ng pag-ikot kung gaano kabilis umiikot ang gas at mga bituin sa paligid ng sentro ng galaksiya sa iba’t ibang radius. Mas mabilis ang ikot, mas malakas na sentripetal na puwersa ang kailangan sa radius na iyon, kaya mas malakas ang epektibong grabidad. Ginamit ng P1 ang database ng SPARC; matapos ang preprocessing, isinama nito ang 104 na galaksiya, 2,295 na velocity data point, at hinati ang mga ito sa 20 RC-bin.
4.2 Weak lensing GGL: “timbangan ng grabidad” sa mas malaking sukat
Sinusukat ng galaxy–galaxy mahinang lensing kung paano bahagyang binabaluktot ng foreground galaxies ang liwanag mula sa background galaxies. Kaugnay ito ng nakaproyektong tugon ng grabidad sa mas malaki, halo-scale na saklaw, at hindi ito nakasalalay sa mga detalye ng dinamika ng gas sa galaksiya. Gumamit ang P1 ng pampublikong GGL data mula sa KiDS-1000 / Brouwer et al. 2021: 4 na stellar-mass bin, 15 radius point bawat bin, kabuuang 60 data point, at buong kovaryans ang ginamit.
4.3 Nakatakdang mapping: bakit mahalaga ang 20 RC-bin → 4 GGL-bin?
Ikinonekta ng P1 ang 20 RC-bin at 4 GGL-bin sa pamamagitan ng nakapirming tuntunin: bawat GGL-bin ay tumutugma sa 5 RC-bin, at kinukuha ang weighted average ayon sa bilang ng galaksiya. Hindi nagbabago ang mapping na ito para sa lahat ng modelo; ito ang matigas na hadlang para sa pagsusuri ng pagsasara at patas na paghahambing.
Bakit hindi maaaring i-tune ang mapping pagkatapos? |
Kung pinapayagang pumili pagkatapos kung “aling RC-bin ang tutugma sa aling GGL-bin,” maaaring gumawa ang modelo ng pagsasara sa pamamagitan ng pag-aayos ng pagtutugma. Inilock na ng P1 ang 20→4 mapping bago ang pagsusuri at sinadyang sirain ito gamit ang shuffle negative control upang malaman kung talagang nakadepende sa pisikal na makatwirang pagtutugma ang closure signal. |
5 | Mga modelo at pamamaraan: ano ba talaga ang inihahambing ng P1?
5.1 Panig ng EFT: mababang-dimensiyong karaniwang tugon ng grabidad
Sa panig ng EFT, gumagamit ng mababang-dimensiyong karagdagang termino ng bilis upang ilarawan ang karaniwang tugon ng grabidad. Ang hugis ng dagdag na termino ay kinokontrol ng walang-dimensiyong kernel function f(r/ℓ), kung saan ang ℓ ang pandaigdigang sukat, at ang amplitude ay ibinibigay ayon sa RC-bin. Iba’t ibang kernel function ang kumakatawan sa iba’t ibang panimulang dalisdis, bilis ng transisyon, at pangmatagalang buntot, at ginagamit ang mga ito bilang stress test ng katatagan.
5.2 Panig ng DM: kailangang magkahiwalay basahin ang pangunahing paghahambing sa katawan at ang Appendix P1A
Sa pangunahing paghahambing sa katawan, ang DM_RAZOR ay isang pinasimple at maa-audit na NFW baseline: nakapirmi ang c–M relation, at walang halo-to-halo scatter, adiabatic contraction, feedback core, hindi-spherical na termino, o environmental term. Bentahe ng disenyo nito ang kontroladong dami ng kalayaan at madaling reproduksiyon; limitasyon naman nito na hindi nito kinakatawan ang lahat ng LambdaCDM o lahat ng modelo ng halo ng madilim na materya.
Kaya sa Appendix B (P1A), ginawang isang hanay ng “standardized stress tests” ang panig ng DM. Nang hindi binabago ang shared mapping at closure protocol, unti-unting idinagdag ang mababang-dimensiyong enhancement branches gaya ng SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m, at pinagsamang baseline na DM_STD, habang pinananatili ang EFT_BIN bilang kontrol. Maaari mong unawain ang P1A nang ganito: hindi lamang isang minimal na DM baseline ang kinukumpara, kundi ilang karaniwan at maa-audit na mekanismo ng DM ang sinusukat gamit ang iisang pamantayan ng pagsasara.
Eksaktong pormulasyon ng konklusyon na ginagamit ng artikulong ito |
Katawan: sa pangunahing paghahambing, malinaw na mas mahusay ang seryeng EFT kaysa minimal na DM_RAZOR. |
Appendix B / P1A: sa ilalim ng ilang mababang-dimensiyon at maa-audit na DM enhancement branches at DM_STD stress test, maaaring gumanda ang ilang joint fitting ng DM, ngunit hindi inaalis ng mga ito ang bentahe ng EFT_BIN sa lakas ng pagsasara. |
Kaya ang pinakaligtas na pahayag ay ito: sa loob ng datos, mapping, parameter ledger, at closure protocol ng P1/P1A, nagpapakita ang karaniwang tugon ng grabidad ng EFT ng mas malakas na consistency sa pagitan ng datasets; hindi ito katumbas ng pag-aalis sa lahat ng modelo ng madilim na materya. |
5.3 Pagsusuri ng pagsasara: ang pinakamahalagang eksperimental na lohika ng P1
1. Gumawa ng pag-aangkop gamit lamang ang RC at kumuha ng isang set ng RC-only na posterior na sampol.
2. Huwag muling iangkop gamit ang GGL; gamitin nang direkta ang posterior ng RC upang hulaan ang GGL.
3. Gamitin ang buong kovaryans upang kalkulahin ang iskor ng hula ng GGL sa tamang pagmamapa, logL_true.
4. I-randomize ang pagtutugma ng RC-bin→GGL-bin at kalkulahin ang negatibong kontrol, logL_perm.
5. Ibawas ang dalawa upang makuha ang lakas ng pagsasara: ΔlogL_closure = <logL_true> − <logL_perm>.
Payak na talinghaga |
Ang pagsusuri ng pagsasara ay parang retake sa ibang exam room: natututo muna ang modelo sa exam room ng RC, pagkatapos ay sasagot sa exam room ng GGL. Kung ang natutuhan nito ay tunay na shared rule at hindi lokal na trick, dapat mahusay pa rin ito kapag lumipat ng room; kapag sinadyang guluhin ang pagtutugma ng mga exam room, dapat mawala ang bentahe. |
5.4 Bago basahin ang mga teknikal na talahanayan: hawakan muna ang apat na pasukan
Talahanayan 5.4 | Ruta sa pagbasa ng susunod na pangkat ng landscape na teknikal na talahanayan
Pasukan | Ano ang titingnan | Bakit mahalaga |
Talahanayan S1a | Kabuuang score ng pinagsamang RC+GGL fitting | Sinasagot nito: “kapag magkasamang tiningnan ang dalawang dataset, sino ang mas malakas ang kabuuang paliwanag?” |
Talahanayan S1b | Lakas ng pagsasara, shuffle, at mga scan ng katatagan | Sinasagot nito: “ang natutuhan ba mula sa RC ay naililipat sa GGL?” |
Talahanayan B0 | Mga depinisyon ng maraming DM enhancement branch sa P1A | Iniiwasan nitong gawing payak ang P1 bilang “paghahambing lamang sa minimal na DM_RAZOR.” |
Talahanayan B1 | Closure at joint scoreboard ng P1A | Sinusuri nito kung nawawala ba ang bentahe sa pagsasara matapos palakasin ang DM. |
Tala sa layout |
Simula sa susunod na pahina, gagamit ng landscape pages upang ganap na mapanatili ang malalapad na talahanayan ng orihinal na ulat, maiwasan ang pagtanggal ng column, at hindi ito masiksik hanggang sa hindi na mabasa. Nauna nang ibinigay sa katawan ang pambatang/karaniwang pagbasa; ang landscape technical tables ay para sa kailangang mag-check ng mga numero at model branches. |
Larawan 0.1 | Isang larawang nagpapaliwanag sa daloy ng pagsusuri ng pagsasara sa P1

Paliwanag: ang itaas na chain ay ang “pagsusuri ng pagsasara” (RC lamang ang i-fit → gamitin ang RC posterior upang hulaan ang GGL); ang ibabang chain ay ang “pinagsamang fitting” (RC+GGL ang sabay na bibigyan ng score). Sa kanan, inihahambing ang tunay na mapping sa shuffled mapping upang makuha ang lakas ng pagsasara na ΔlogL.
6 | Mahahalagang teknikal na talahanayan: pangunahing talahanayan ng orihinal na ulat at mga talahanayan ng P1A
Talahanayan S1a | Pangunahing sukatan ng pinagsamang fitting (RC+GGL, Strict; pinanatili mula sa orihinal na ulat)
Modelo (workspace) | W kernel | k | Pinagsamang logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Talahanayan S1b | Mga sukatan ng pagsasara at katatagan (Strict; pinanatili mula sa orihinal na ulat)
Modelo (workspace) | Pagsasarang ΔlogL (true-perm) | ΔlogL matapos ang negatibong kontrol na shuffle | Saklaw ng ΔlogL sa σ_int scan | Saklaw ng ΔlogL sa R_min scan | Saklaw ng ΔlogL sa cov-shrink scan |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
Talahanayan B0 | Depinisyon ng DM enhancement branches sa P1A (pinanatili mula sa Appendix B ng orihinal na ulat)
Workspace | dm_model | Bagong parameter (≤1) | Pisikal na motibasyon (core) | Prinsipyo ng implementasyon (audit-friendly) |
DM_RAZOR | NFW (fixed c–M, no scatter) | — | Pinasimple at maa-audit na LambdaCDM halo baseline; ginagamit para sa mahigpit na paghahambing sa EFT | Nakapirmi ang shared mapping; mahigpit ang parameter ledger; bilang baseline, ginagamit lamang sa relatibong paghahambing |
DM_RAZOR_SCAT | NFW + c–M scatter(legacy) | σ_logc | May scatter ang c–M relation; tinatayang gamit ang one-parameter log-normal scatter | ≤1 bagong parameter; shared mapping pa rin ang gamit; closure gain ang pamantayan ng pagtanggap |
DM_RAZOR_AC | NFW + Adiabatic Contraction(legacy) | α_AC | Maaaring magdulot ng adiabatic contraction ng halo ang pagbagsak ng baryons; tinatayang gamit ang one-parameter strength | ≤1 bagong parameter; hindi binabago ang mapping; iuulat ang pagbabago sa AICc/BIC at closure gain |
DM_RAZOR_FB | NFW + feedback core(legacy) | log r_core | Maaaring bumuo ang feedback ng core sa inner region; tinatayang gamit ang one-parameter core scale | ≤1 bagong parameter; pareho ang pormulasyon ng closure/negative control; hindi lamang RC-only improvement ang layunin |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc(hier) | Mas standard na hierarchical c_i∼logN(c(M_i),σ_logc); sabay nitong naaapektuhan ang joint posterior ng RC at GGL | Explicit na prior; minamarginalize ang latent c_i; nananatiling mababa ang dimensiyon at maa-audit |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | Gumagamit ng one-parameter core proxy para sa pangunahing epekto ng baryonic feedback, upang maiwasan ang mataas-dimensiyong detalye ng star formation | Sumasangguni sa standard literature; ≤1 bagong parameter; nakatali sa closure test |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear(GGL) | Sinisipsip ang pangunahing sistematikong error sa weak-lensing side bilang epektibong parameter, upang bawasan ang panganib na gawing “pisika” ang sistematikong error | Malinaw na itinatala ang nuisance; hindi pinapayagang makaapekto pabalik sa RC; closure robustness ang pangunahing batayan ng resulta |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Isinasama nang sabay ang tatlong pinakakaraniwang pagtutol sa isang standardized baseline na mababa pa rin ang dimensiyon | Sabay na iniuulat ang parameter ledger at information criteria; closure ang pangunahing sukatan; nagsisilbing pinakamalakas na depensa ng DM comparison |
Talahanayan B1 | P1A scoreboard (mas mataas ay mas mabuti; pinanatili mula sa Appendix B ng orihinal na ulat)
Sangay ng modelo (workspace) | Δk | RC-only best logL_RC (Δ) | Lakas ng pagsasara ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Paano basahin ang Talahanayan B1 (P1A scoreboard) |
• Δk: dagdag na degree of freedom (mas malaki, mas komplikado ang modelo; hindi awtomatikong mas mabuti ang mas komplikado). • Ituon ang tingin sa dalawang column: lakas ng pagsasara ΔlogL_closure(Δ) (mas malaki, mas “transfer-consistent”) at Joint best logL_total(Δ) (kabuuang score ng joint fitting). • Ang (Δ) sa loob ng panaklong ay pagkakaiba laban sa DM_RAZOR, para madaling ihambing. |
• Ang pangunahing tanong ng talahang ito: mawawala ba ang bentahe sa pagsasara kapag “makatwirang pinalakas” ang DM baseline? • Tip sa pagbasa: malinaw na tumataas ang joint score ng DM_STD, ngunit bumababa ang closure strength; nananatiling mas mataas ang EFT_BIN sa closure strength. |
Buod sa isang pangungusap: sa loob ng hanay na ito ng mababang-dimensiyon at maa-audit na DM enhancements, ang pagpapabuti ng joint fitting ay hindi awtomatikong nagdudulot ng mas malakas na pagsasara; nananatiling pangunahing criterion ang closure, o transferability. |
7 | Paano babasahin ang pangunahing resulta?
7.1 Pinagsamang fitting: kapag magkasamang tiningnan ang dalawang dataset, mas mataas ang score ng EFT sa pangunahing paghahambing
Ipinapakita ng Talahanayan S1a at Larawan S4 na, sa parehong datos, iisang shared mapping, at halos parehong laki ng parameter, ang pinagsamang ΔlogL_total ng seryeng EFT laban sa DM_RAZOR ay 1155–1337. Para sa karaniwang mambabasa, ibig sabihin nito: sa iisang scoring rule na pinagsasama ang RC at GGL, mas mataas ang kabuuang score ng mga modelo ng EFT sa pangunahing paghahambing.
7.2 Pagsusuri ng pagsasara: ang pinakadiin ng P1 ay “kakayahang mailipat”
Kapag mataas ang lakas ng pagsasara, nangangahulugan itong ang mga parameter na nahinuha gamit lamang ang RC ay mas nakahuhula rin ng GGL kahit hindi na muling tiningnan ang GGL. Sa ulat ng P1, ang ΔlogL_closure ng EFT ay 172–281, samantalang 127 ang sa DM_RAZOR. Mas mahalaga ito kaysa sabihing “maayos naman ang bawat sariling fitting,” dahil nililimitahan nito ang kalayaan ng modelo sa ikalawang dataset.
7.3 Negatibong kontrol: bakit mabuti ang “pagbagsak ng signal”?
Nang i-randomize ng P1 ang pagtutugma ng RC-bin→GGL-bin, bumaba ang closure signal ng EFT sa antas na 6–23. Para sa karaniwang mambabasa, ito ay parang anti-cheating check: kung ang bentahe sa pagsasara ay bunga lamang ng code, unit, kovaryans, o tsambang fitting, maaaring manatili pa rin ang bentahe kahit guluhin ang pagtutugma. Ngunit ang aktuwal na resulta ay bumagsak ang bentahe, kaya ipinakikita nitong nakadepende ito sa tamang mapping.

Larawan S3 | Lakas ng pagsasara (mas mataas ay mas mabuti): karaniwang bentahe sa log-likelihood para sa RC-only → GGL prediction.
Paano basahin ang larawang ito |
Ito ang pangunahing larawan ng P1. Habang mas mataas ang bar, mas naipapasa ng modelo sa GGL ang impormasyong natutuhan nito mula sa RC. |
Sa kabuuan, mas mataas ang seryeng EFT kaysa DM_RAZOR; ipinapakita nitong sa eksperimento na “matuto muna sa RC, saka hulaan ang GGL,” mas malakas ang cross-probe closure ng EFT. |

Larawan S4 | Bentahe sa pinagsamang fitting (mas mataas ay mas mabuti): best logL_total ng RC+GGL laban sa DM_RAZOR.
Paano basahin ang larawang ito |
Tinitingnan ng larawang ito ang kabuuang score matapos pagsamahin ang RC at GGL. |
Lahat ng seryeng EFT ay malinaw na mas mataas sa 0, kaya ang bentahe ng EFT sa pangunahing paghahambing ay hindi isang lokal na single-point phenomenon, kundi kabuuang resulta ng joint analysis. |

Larawan R1 | Negatibong kontrol: malaki ang ibinaba ng closure signal matapos i-shuffle ang grouping.
Paano basahin ang larawang ito |
Ipinapakita ng larawang ito na kapag ginulo ang tamang RC↔GGL binning relationship, malinaw na bumababa ang closure signal. |
Dahil dito, mas mukhang tunay na consistency sa cross-data mapping ang resulta ng P1, hindi numerikal na aksidenteng makukuha sa anumang mapping. |
8 | Katatagan at mga kontrol: paano iniiwasan ng P1 ang “maganda lang dahil tinono ang parameter”?
Ang pinakamadaling kuwestiyunin sa isang teknikal na ulat ay kung ang bentahe ba ay nagmula sa isang noise setting, isang bahagi ng central-region data, isang paraan ng paghawak ng kovaryans, o overfitting. Sinasagot ito ng P1 sa pamamagitan ng maraming pressure test.
Talahanayan 2 | Paano babasahin ang katatagan at negatibong kontrol sa P1
Pagsubok | Anong pagdududa ang nais nitong alisin | Paano basahin |
σ_int scan | Kung may dagdag na hindi kilalang dispersion sa RC, matatag pa rin ba ang konklusyon? | Matapos paluwagin ang RC errors, nananatiling matatag ang ranking at laki ng bentahe ng EFT. |
R_min scan | Kung hindi lubos na pinagkakatiwalaan ang central region ng galaksiya, matatag pa rin ba ang konklusyon? | Matapos i-trim ang central region, nananatiling positibo ang bentahe ng EFT. |
cov-shrink scan | Kung may kawalan ng katiyakan sa estimate ng GGL covariance, sensitibo ba ang ranking? | Matapos i-shrink ang covariance papunta sa diagonal matrix, hindi sensitibo ang bentahe. |
Ablation ladder | Umaasa ba ang EFT sa hindi kailangang complexity para piliting mag-fit? | May pangangailangan ang buong EFT_BIN sa ilalim ng information criteria. |
LOO leave-out prediction | Naipaliliwanag lang ba ng modelo ang datos na nakita na nito? | Kahit may iniwang-out na GGL bin, nagpapakita pa rin ito ng medyo malakas na generalization performance. |
RC-bin shuffle | Galing ba sa tunay na mapping ang pagsasara? | Pagkatapos guluhin ang grouping, bumababa ang closure, na sumusuporta sa mapping dependence. |

Larawan R2 | Saklaw ng ΔlogL_total sa σ_int scan (mas mataas ay mas mabuti).
Paano basahin ang larawang ito |
Sinusuri kung nananatili ang pangunguna ng EFT matapos baguhin ang setting ng intrinsic dispersion ng RC. |

Larawan R3 | Saklaw ng ΔlogL_total sa R_min scan (mas mataas ay mas mabuti).
Paano basahin ang larawang ito |
Sinusuri kung matatag pa rin ang bentahe ng EFT matapos i-trim ang komplikadong central region. |

Larawan R4 | Saklaw ng ΔlogL_total sa cov-shrink scan (mas mataas ay mas mabuti).
Paano basahin ang larawang ito |
Sinusuri kung sensitibo ang ranking sa paraan ng paghawak sa covariance ng mahinang lensing. |

Larawan R5 | Ablation ladder ng EFT_BIN (AICc, mas mababa ay mas mabuti).
Paano basahin ang larawang ito |
Sinusuri kung kailangan talaga ang buong EFT_BIN para maipaliwanag ang datos, at hindi lamang pagdaragdag ng parameter. |

Larawan R6 | LOO: distribusyon ng log-likelihood para sa iniwang-out na bin.
Paano basahin ang larawang ito |
Sinusuri kung may predictive performance pa rin ang modelo sa GGL bin na hindi nito nakita. |

Larawan R7 | Negatibong kontrol: ang shuffled mapping ay malinaw na nagpapababa sa mean logL_true ng pagsasara.
Paano basahin ang larawang ito |
Mula sa anggulo ng mean logL_true, ipinapakita pa nito na nakadepende ang closure sa tamang cross-data mapping. |
9 | P1A: bakit mahalagang pagwawasto ang pagkakaroon ng maraming DM model sa appendix?
Hindi sinasagot ng seksiyong ito ang tanong na “iisa lang bang minimal na DM_RAZOR ang tinalo ng EFT?” Sa halip, tinatanong nito: kapag pinalakas natin ang DM baseline sa loob ng mababang-dimensiyon, nare-reproduce, at malinaw na parameter ledger (P1A), mababago ba ang konklusyon ng closure test at joint fitting? Sa ibang salita, layunin ng P1A na bawasan ang puna na “napakahinang DM baseline lang ang pinili mo” at dalhin ang usapan sa tanong na: sa loob ng isang hanay ng maa-audit na DM enhancements, may natitira pa bang pagkakaiba sa closure performance?
Hindi sinusubukan ng disenyo ng P1A na ubusin ang lahat ng posibleng pagmomodelo ng LambdaCDM halo, at hindi rin nito ginagawang mataas-dimensiyon at hindi maa-audit ang panig ng DM. Pinipili nito ang mga enhancement na mababa ang dimensiyon, nare-reproduce, at malinaw ang parameter ledger: concentration scatter, adiabatic contraction, feedback core, hierarchical c–M scatter prior, one-parameter core proxy, weak-lensing shear-calibration nuisance, at pinagsamang DM_STD.
Pangunahing pagbasa sa P1A |
Sa tatlong legacy branch, tanging feedback/core ang nagdulot ng maliit na net improvement sa closure strength; walang net closure improvement ang SCAT at AC. |
Maliit o hindi malinaw ang net improvement ng DM_HIER_CMSCAT, DM_RAZOR_M, at DM_CORE1P sa closure strength. |
Malinaw na napapabuti ng DM_STD ang joint logL, ngunit bumababa ang closure strength; ipinahihiwatig nitong higit nitong pinapahusay ang flexibility ng joint fitting kaysa ang transfer-prediction power ng RC→GGL. |
Sa Talahanayan B1 ng P1A, nananatiling mas mataas ang EFT_BIN sa closure strength at joint fitting advantage; kaya hindi dapat gawing payak ang pangunahing pahayag ng P1 bilang “minimal na DM_RAZOR lang ang tinalo nito.” |

Larawan B1 | P1A scoreboard: ΔlogL ng pagsasara at pinagsamang fitting laban sa baseline (mas mataas ay mas mabuti).
Paano basahin ang larawang ito |
Ipinapakita ng larawang ito ang pagganap ng maraming DM enhancement branches laban sa baseline. |
Ang kahulugan nito ay hindi “naalis ang lahat ng DM,” kundi ito: sa mababang-dimensiyon at maa-audit na DM enhancements na pinili ng P1A, hindi inalis ng pinalakas na DM ang closure advantage ng EFT_BIN. |
10 | Kahulugan ng eksperimento ng P1: bakit sulit gawin ito?
10.1 Metodolohikal na kahulugan: itaas ang “pagsasara sa pagitan ng mga probe” kaysa “single-probe fitting”
Ang pinakamadaling bitag sa mga teorya sa sukat ng galaksiya ay ang pagtalunan kung kayang i-fit ng isang modelo ang isang set ng mga kurba ng pag-ikot. Itinaas ng P1 ang tanong: ang mga parameter na natutuhan mo mula sa RC, kaya ba nilang hulaan ang mahinang lensing nang hindi muling inaayos sa GGL? Dahil dito, ang P1 ay nagiging “transfer prediction test” sa halip na simpleng “fitting contest.”
10.2 Kahulugan sa transparency: gawing bahagi ng resulta ang chain na maaaring suriin muli
Isang mahalagang ambag ng P1 ang sabay na paglalabas ng datos, mga talahanayan at larawan, run labels, negatibong kontrol, reproduction package, at audit chain. Mahalaga ito sa mga sumusuporta at kumokontra: maaaring bumalik ang talakayan sa iisang pampublikong datos, iisang mapping, iisang script, at iisang sukatan, sa halip na paghambingin lamang ang mga slogan.
10.3 Pisikal na kahulugan: nagbibigay ito ng malakas na pressure test para sa direksiyong “grabidad na hindi madilim na materya”
Sa direksiyong hindi umaasa sa madilim na materya, maraming modelo ang nakapagpapaliwanag ng ilang bahagi ng mga kurba ng pag-ikot o RAR. Mas mahirap ang sabay na makapasa sa weak-lensing readings at maipakitang nakadepende sa tamang mapping ang signal sa negatibong kontrol. Ang kahulugan ng P1 ay inilagay nito ang karaniwang tugon ng grabidad ng EFT sa isang protocol na parang “panlabas na pagsusulit”: ang RC ang training field, ang GGL ang transfer field, at ang shuffle ang anti-cheating field.
10.4 Isa ba itong mahalagang eksperimento sa larangan ng grabidad na hindi madilim na materya?
Maingat na sagot: kung mananatiling tama ang data processing, reproduction package, at closure protocol ng P1 matapos ang panlabas na pagsusuri, maaari itong ituring na isang RC+GGL closure experiment na seryosong dapat pagtuunan sa direksiyon ng non-dark-matter gravity / modified gravity. Hindi nakasalalay ang halaga nito sa pangungusap na “napabagsak ang madilim na materya,” kundi sa pagbibigay nito ng criterion sa pagitan ng mga probe na maaaring kopyahin, hamunin, at palawakin.
Mayroon na bang kapantay na mataas na RC+GGL predictive-closure framework? |
May mga kaugnay na framework at tradisyon ng obserbasyon: mahusay na naoorganisa ng MOND/RAR ang maraming rotation-curve phenomena; ikinumpara rin ng KiDS-1000 weak-lensing RAR work ang MOND, Verlinde emergent gravity, at LambdaCDM models; at kaya ring ipaliwanag ng LambdaCDM ang ilang weak-lensing/dynamical phenomena sa pamamagitan ng galaxy–halo connection, gas halo, at feedback modeling. |
Ngunit ang eksaktong pahayag ng P1 ay hindi “walang ibang framework sa mundo na kayang magpaliwanag ng RC+GGL.” Sa halip: sa ilalim ng mismong pampublikong protocol ng P1—nakatakdang mapping, RC-only→GGL closure, shuffle negative control, parameter ledger, at P1A multi-DM stress test—iniulat ng EFT ang mas malakas na closure performance. |
Sa madaling salita, ang bahaging pinakanararapat subukin ng labas na komunidad ay ang konkretong, nare-reproduce na comparison protocol na iminungkahi ng P1. Napakahalagang susunod na hakbang ang malaman kung may MOND/RAR, LambdaCDM/HOD, hydrodynamical simulation, o iba pang modified-gravity framework na makakamit ang kapareho o mas mataas na closure score sa ilalim ng parehong protocol. |
11 | Ano ang maipapakita ng P1? Ano ang hindi nito maipapakita?
Talahanayan 3 | Hangganan ng mga konklusyon ng P1
Maaaring ipakita | Sa ilalim ng RC+GGL data, fixed mapping, at pangunahing comparison protocol ng P1, mas mataas ang joint fitting at closure strength ng seryeng EFT kaysa minimal na DM_RAZOR. |
Maaaring ipakita | Sa loob ng mababang-dimensiyon at maa-audit na DM enhancement range ng P1A, hindi inalis ng maraming DM enhancements ang closure advantage ng EFT_BIN. |
Maaaring ipakita | Ipinapakita ng shuffle negative control na nakadepende ang closure signal sa tamang cross-data mapping, at hindi ito makukuha mula sa kahit anong mapping. |
Hindi maaaring ipakita | Hindi maaaring sabihing napabagsak na ng P1 ang lahat ng modelo ng madilim na materya. Hindi pa rin na-uubos ng P1A ang non-spherical effects, environmental dependence, komplikadong galaxy–halo connection, high-dimensional feedback, o buong cosmological simulations. |
Hindi maaaring ipakita | Hindi maaaring sabihing napatunayan na mula sa first principles ang buong EFT. Sinusuri lamang ng P1 ang phenomenological layer ng karaniwang tugon ng grabidad. |
Hindi maaaring ipakita | Hindi maaaring sabihing naalis na ang lahat ng sistematikong error. Nagbibigay lamang ang P1 ng robustness evidence sa loob ng nakalistang pressure tests at audit scope. |
12 | Mga karaniwang tanong: ilang tanong na madalas itanong ng pangkalahatang mambabasa
Q1: Ibig bang sabihin nito na “wala ang madilim na materya”?
Hindi. Kailangang ikulong ang konklusyon ng P1 sa saklaw ng datos, protocol, at mga modelong pangkontrol ng artikulong ito. Mas malayo na ang P1A kaysa minimal na DM_RAZOR, ngunit hindi pa rin nito kinakatawan ang lahat ng posibleng modelo ng madilim na materya.
Q2: Ibig bang sabihin nito na “napatunayan na ang EFT”?
Hindi rin. Sinusuri ng P1 ang EFT bilang parameterisasyon ng karaniwang tugon ng grabidad, at ipinakikita nitong mas malakas ang pagganap nito sa pagsasarang RC→GGL. Hindi konklusyon ng P1 ang mikroskopikong mekanismo o ang buong teorya.
Q3: Bakit hindi na lang direktang banggitin ang significance na σ?
Gumagamit ang P1 ng pinag-isang likelihood score, information criteria, at closure difference. Ang ΔlogL ay relatibong bentahe sa ilalim ng iisang scoring rule; hindi ito katumbas ng iisang σ value.
Q4: Bakit kailangang guluhin ang RC-bin→GGL-bin?
Ito ay negatibong kontrol. Ang tunay na signal sa pagitan ng mga probe ay dapat nakadepende sa tamang mapping; kung kasinglakas pa rin ito matapos guluhin, mas malamang na may implementation bias o estadistikal na pekeng signal.
Q5: Ano ang pinakamahalagang susunod na hakbang para sa P1?
Palawakin ang parehong protocol sa mas maraming datos, mas maraming DM control, mas komplikadong sistematikong error, at mas maraming modified-gravity framework; lalo na, kailangang makapag-retest ang mga panlabas na grupo gamit ang parehong closure metric.
13 | Maliit na glosaryo
Talahanayan 4 | Maliit na glosaryo
Termino | Isang-pangungusap na paliwanag |
Kurba ng pag-ikot (RC) | Relasyong radius–bilis sa disk ng galaksiya, ginagamit upang baligtaring tukuyin ang epektibong grabidad sa loob ng disk. |
Weak lensing (GGL) | Sinusukat ang karaniwang grabidad/mass distribution sa paligid ng foreground galaxies gamit ang estadistikal na pagbaluktot ng hugis ng background galaxies. |
Pagsusuri ng pagsasara | Ginagamit ang RC posterior upang hulaan ang GGL at inihahambing ito sa negatibong kontrol na may shuffled mapping. |
Negatibong kontrol | Sinadyang sirain ang mahalagang istruktura upang tingnan kung mawawala ang signal; ginagamit para alisin ang pekeng signal. |
NFW halo | Density profile ng halo ng madilim na materya na karaniwang ginagamit sa cold dark matter models. |
c–M relation | Relasyon sa pagitan ng concentration c at mass M ng halo ng madilim na materya; ang pagpapahintulot sa scatter ay nakaaapekto sa flexibility ng modelo. |
DM_STD | Standardized DM stress-test branch sa P1A na pinagsasama ang ilang mababang-dimensiyong DM enhancement at lensing nuisance. |
ΔlogL | Pagkakaiba ng log-likelihood ng dalawang modelo sa ilalim ng iisang scoring rule; positibong halaga ay nangangahulugang mas mahusay ang una. |
Kovaryans | Matrix na naglalarawan sa ugnayan ng mga data point; sa weak-lensing data, karaniwang kailangang gamitin ang buong kovaryans. |
14 | Iminungkahing ruta sa pagbasa at mga pasukan ng citation
1. Basahin muna ang Seksiyon 0–2 ng artikulong ito upang mabuo ang tanong ng P1 at ang maingat na posisyon ng EFT sa loob ng P1.
2. Pagkatapos, tingnan ang Larawan S3, Larawan S4, at Talahanayan S1a/S1b upang maunawaan ang lakas ng pagsasara, pinagsamang fitting, at negatibong kontrol.
3. Kung inaalala mo kung “sobrang hina ba ang DM baseline,” diretsong basahin ang Seksiyon 9 at Talahanayan B1 / Larawan B1.
4. Kung teknikal na re-review ang layunin, bumalik sa P1 technical report v1.1, Tables & Figures Supplement, at full_fit_runpack.
Pangunahing pasukan ng archive |
P1 technical report (release-level, Concept DOI): 10.5281/zenodo.18526334 |
P1 full reproduction package (Concept DOI): 10.5281/zenodo.18526286 |
EFT structured knowledge base (optional, Concept DOI): 10.5281/zenodo.18853200 |
Tala sa lisensiya: ang technical report ay gumagamit ng CC BY-NC-ND 4.0; ang full reproduction package ay gumagamit ng CC BY 4.0 (ayon sa technical report at Zenodo archive). |
15 | Mga sanggunian at panlabas na background
McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.
Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The mahinang lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.
Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.
Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.