Auditrapportages

De formele audit van het gecombineerde Helios-systeem (Systeem 1 Groeimodel + Systeem 2 Bear Market Model) vormt de kern van het beleggingsbewijs. Hier staan de volledige resultaten.

Zie Het Bewijs voor de samenvatting in het verhaal.

Eindoordeel

POSITIEF MET VOORBEHOUD — 21 van 25 formele auditcriteria gehaald.

De kolom “EUR afgedekt (75%, CME)” verwijst naar de afdekkingsvariant met CME-termijncontracten (CME Futures) — zie Valuta-afdekking voor de volledige uitleg.

Metriek	USD nominaal	EUR afgedekt (75%, CME)	EUR reëel
CAGR	21,68%	21,87%	19,06%
Max drawdown	-33,79%	-32,51%	-35,15%
Sharpe	0,93	0,91	0,81
Sortino	1,29	1,27	1,14
Calmar	0,64	0,67	0,54
S&P 500-correlatie	0,14	0,14	0,14
Trades	11.402	11.402	11.402

De vier niet-gehaalde criteria — DATA-02, STAT-06, STAT-07 en ROB-03 — worden hieronder per stuk besproken met de meetwaarde, de drempel en een belegger-interpretatie. Ze zijn gedocumenteerd en begrepen, niet weggeredeneerd.

Watervaltabel: van USD nominaal naar EUR reëel

Elke rij past één correctie toe op de ruwe USD-backtest, zodat zichtbaar wordt wat er van het brutorendement overblijft na valuta-afdekking en inflatie:

Fase	CAGR	Max DD	Sharpe	Sortino	Calmar	S&P-corr.
USD nominaal (met slippage)	21,68%	-33,79%	0,93	1,29	0,64	0,14
EUR onafgedekt	22,20%	-36,04%	0,92	1,36	0,62	0,09
EUR afgedekt (75%, CME)	21,87%	-32,51%	0,91	1,27	0,67	0,14
EUR afgedekt (75%, IBKR Spot)	21,53%	-36,22%	—	—	—	—
EUR reëel (CME-hedge)	19,06%	-35,15%	0,81	1,14	0,54	0,14

Attributiedecompositie (7 componenten)

De opbouw van het gecombineerde rendement, uitgesplitst naar bron:

Component	Waarde
Gecombineerde CAGR	21,68%
S1 standalone CAGR	14,95%
S2 standalone CAGR	3,82%
Benchmark (SPY) CAGR	10,24%
S1 alpha boven benchmark	4,71%
Gewichtsallocatie-effect	2,77%
Kostenslippage	1,21% van brutorendement

De totale handelskosten bedragen $438.586 over 11.402 trades ($84.189 commissies + $354.398 slippage). De bedragen staan in USD omdat de onderliggende ledger in USD wordt bijgehouden; in de waterval hierboven zijn ze al meegerekend in de EUR-afgedekte en EUR-reële CAGR.

25 kwantitatieve criteria

De audit bestaat uit vijf categorieën met elk vijf criteria:

Margingebruik — Geslaagd

Metriek	Waarde	Drempel
Piekmargeverhouding	1,89x	< 3,0x
Gemiddelde margeverhouding	1,21x	—
Min. margin-callafstand	27,9%	> 10%

Gewichtsgevoeligheid — Geslaagd (robuust)

Scenario	CAGR	vs. baseline
Laag S1 / basis S2	17,99%	-6,8%
Vorige iteratie S1 / basis S2	19,30%	+0,0%
Definitief S1 / basis S2	21,68%	+6,6%
Minimum S1 / minimum S2	14,55%	-24,6%

Maximale relatieve CAGR-daling: 24,6% — binnen de robuustheidsdrempel van 30%. De prestaties schalen monotoon met het S1-gewicht, zonder plotselinge breuken bij het variëren van de gewichten.

Leverage-efficiëntie — Efficiënt

Metriek	Waarde
CAGR-verbetering (leveraged vs. niet)	2,77%
Drawdown-kosten	4,59%
Efficiëntieratio	0,60
Drempel	> 0,30

De gemiddelde piekmarge ligt op 1,89x — dat is het concrete leverage-niveau waarop de strategie draait, ruim onder de auditdrempel van 3,0x.

Parametergevoeligheid — Geslaagd

Vijf varianten getest. Maximale relatieve CAGR-daling: 13,69%. Alle varianten blijven winstgevend en binnen de 30%-drempel.

4 criteria niet gehaald

Dit zijn de vier auditcriteria die formeel niet gehaald zijn: drie “niet geslaagd” en één “gedeeltelijk geslaagd”. Hieronder per criterium de meetwaarde, de drempel en een belegger-interpretatie.

DATA-02 — Volledigheid van de prijsdata — Niet geslaagd

Wat de audit meet: of de onderliggende koersbestanden (alle 5.373 tickers) geen gaten, nullen of ontbrekende kolommen hebben. Uitkomst: 1 van de 4 deelchecks geslaagd. 1.521 tickers met in totaal 27.721 gap-ranges, 6 tickers met nulprijzen, 521 van de 5.373 bestanden zonder unadjusted_close-kolom.

Belegger-interpretatie: 27.721 gaten klinkt als datarommel. In de toelichting staat dat al die gaten vóór 1999 vallen, terwijl de backtest van 1999 tot 2025 loopt. De nulprijzen zitten in drie delisted of gehalteerde aandelen op specifieke data, en de ontbrekende kolom is op indextickers en geschrapte aandelen die niet voor orderuitvoering worden gebruikt. De data die de strategie werkelijk gebruikt, is wél schoon. De auditdrempel is streng genoeg om hier “niet geslaagd” te scoren, ook als het binnen de backtestperiode geen impact heeft — eerder een compliment aan de auditmethodiek dan een bezwaar tegen de strategie.

STAT-06 — Worst-case drawdown-vergelijking — Niet geslaagd

Wat de audit meet: in Helios’ 5 ergste drawdown-periodes — was SPY (buy-and-hold) minder diep gezakt in diezelfde periode? Uitkomst: in 4 van de 5 gevallen wel. Alleen tijdens COVID 2020 was Helios ondieper (-23,42%) dan SPY (-26,44%). De diepste Helios-drawdown in deze top-5: -30,77% (eurocrisis 2010-2012).

Belegger-interpretatie: Dit is de belangrijkste van de vier, en de eerlijkste. De audit kijkt specifiek naar Helios’ vijf zwakste momenten — niet naar SPY’s. In 2008, waar SPY -55,22% zakte, bleef Helios door regime-filter en hedges vrijwel buiten schot. Over het volledige 30-jaars venster blijft de max drawdown van Helios dan ook -33,79% (USD nominaal) tegenover -55,22% voor SPY. Het “niet geslaagd”-oordeel geeft aan dat Helios op zijn eigen slechtst dieper zakt dan SPY op die momenten — niet dat het totale risico hoger ligt.

STAT-07 — Forensische analyse van handelsconcentratie — Gedeeltelijk geslaagd

Wat de audit meet: of het totaalrendement niet afhangt van een handvol grote winnaars, of één enkele aandelenpositie het resultaat scheef trekt, en of de winst/verlies-ratio boven 1,5 ligt. Uitkomst: na verwijdering van de top-5 trades blijft de CAGR 17,8% (ruim boven de 10%-drempel), maar NVDA alleen is goed voor 10,9% van het totaalrendement (drempel: 5%) en de win/loss-ratio is 1,10 (drempel: 1,5).

Belegger-interpretatie: De enige “gedeeltelijk geslaagd” in plaats van “niet geslaagd” — dat onderscheid is terecht. NVDA die bijna 11% van het totale rendement draagt komt doordat de laatste twee jaar door AI-gedreven momentum is gedomineerd, precies het soort beweging waar deze strategie op jaagt. De ruggengraattest (“wat als we NVDA eruit halen?”) toont aan dat de rest van het systeem ook zonder die ene naam werkt. De win/loss-ratio van 1,10 klinkt laag, maar is typerend voor momentumstrategieën die verliezers snel afkappen en winnaars laten lopen — de verwachte verliezen zijn kleiner dan de verwachte winsten, dus een ratio net boven 1 is genoeg om winstgevend te zijn.

ROB-03 — Deflated Sharpe ratio — Niet geslaagd

Wat de audit meet: of het Sharpe-getal (hier 0,93 op USD nominaal) ook standhoudt als je rekening houdt met het feit dat er meerdere strategievarianten zijn getest voordat deze werd gekozen. Hoe meer varianten je test, hoe groter de kans dat je toevallig een “goede” uitkomst vindt. Uitkomst: deflated Sharpe ratio = 0,74, onder de drempel van 0,95 bij een aanname van 50 geteste varianten.

Belegger-interpretatie: De lastigste van de vier om met het blote oog te beoordelen. De Sharpe van 0,93 lijkt robuust, maar de deflated variant probeert te compenseren voor “als we 50 keer hadden geprobeerd, zouden we dan toevallig op 0,93 uitkomen?” Het antwoord is: niet duidelijk genoeg. Dat is geen bewijs dat de strategie niet werkt — het is een bewijs dat dit ene getal alleen (0,93) niet genoeg is om de twijfel weg te nemen. Als tegenwicht: de walk-forward-efficiëntie is 99% (de strategie houdt stand als je hem op verse data loslaat) en de factor-regressie-alpha is statistisch significant met p=0,003. Die twee leveren onafhankelijk bewijs dat het geen toeval is.

Subperiodeprestaties (USD nominaal)

Prestaties per marktregime

Periode	Data	CAGR	Sharpe	Sortino	Max DD
Dot-comhausse en -crash	1999–2002	48,42%	1,47	1,97	-25,67%
Herstel en huizenbubbel	2003–2007	7,42%	0,42	0,58	-23,72%
Financiële crisis	2008–2009	59,44%	1,57	2,85	-19,61%
Post-crisis bullmarkt	2010–2015	10,66%	0,61	0,80	-33,79%
Late-cycle expansie	2016–2019	10,09%	0,62	0,97	-17,05%
COVID, herstel en recent	2020–2025	20,16%	0,85	1,19	-28,13%

Het systeem is in elke subperiode winstgevend, met de sterkste prestaties in crisisperiodes (dot-com, GFC) — dat is het Bear Market Model aan het werk. In rustige bullmarktjaren (2003–2007 Sharpe 0,42; 2010–2015 Sharpe 0,61; 2016–2019 Sharpe 0,62) blijft het rendement positief maar bescheiden; de echte uitschieters zitten in periodes waarin de markt zelf kwetsbaar is.

Top 5 drawdowns (USD nominaal)

Rang	Gebeurtenis	Start	Dieptepunt	Diepte	Duur (dagen)	Herstel (dagen)
1	Europese schuldencrisis / VS-downgrade	2010-05-07	2012-06-08	-33,79%	763	293
2	COVID-19-crash	2020-02-28	2020-03-20	-28,13%	21	140
3	Dot-comcrash	2000-04-07	2000-05-26	-25,67%	49	259
4	Midcyclus-correctie (2006)	2006-05-19	2006-08-04	-23,72%	77	350
5	Recente correctie (2025)	2025-02-28	2025-05-23	-22,57%	84	154

De maximale drawdown trad op tijdens de Europese schuldencrisis (2010–2012), niet tijdens de GFC. Tijdens de GFC was het Bear Market Model juist actief en leverde het sterke rendementen in een instortende markt.

Monte Carlo-analyse

Betrouwbaarheidsintervallen (10.000 bootstrap-resamples)

USD nominaal:

Metriek	p5	Mediaan	Gemiddeld	p95	95%-BI
CAGR	13,07%	21,64%	21,76%	32,84%	[11,35%, 32,84%]
Sharpe	0,62	0,93	0,93	1,30	[0,56, 1,30]

EUR afgedekt (75%, CME):

Metriek	p5	Mediaan	Gemiddeld	p95	95%-BI
CAGR	12,98%	21,85%	21,96%	33,39%	[11,25%, 33,39%]
Sharpe	0,61	0,91	0,91	1,28	[0,55, 1,28]

EUR reëel:

Metriek	p5	Mediaan	Gemiddeld	p95	95%-BI
CAGR	10,30%	19,07%	19,16%	30,39%	[8,63%, 30,39%]
Sharpe	0,51	0,81	0,82	1,18	[0,45, 1,18]

Op het pessimistische p5-niveau levert de strategie 10,30% EUR reëel CAGR — dat is het niveau waar 95 van de 100 scenario’s beter uitkomen, maar ook 5 van de 100 slechter. Het 95%-betrouwbaarheidsinterval laat de bandbreedte zien waarbinnen de werkelijke uitkomst naar verwachting valt; de uitersten aan beide kanten horen erbij.

Survivorship bias

De geschatte impact van survivorship bias bedraagt -188 basispunten CAGR. Dit is een erkend caveat: de backtest gebruikt historische S&P 500-constituenten inclusief gedenoteerde aandelen, maar de Norgate-dataset dekt niet alle delistings volledig. Het restrisico is niet exact te becijferen — de -188 bps is zelf de best mogelijke schatting; een extra marge daarbovenop valt binnen de onzekerheid rond het cijfer zelf.

Methode

De kwantitatieve audit is uitgevoerd in Q1 2026, met volledige toegang tot de broncode van de strategie, de ruwe ledger (11.402 trades) en de historische marktdata (1996-2025, Norgate PIT-dataset). De 25 testscripts zijn zelf open source: elke metriek in dit rapport is reproduceerbaar vanuit de raw JSON-reports in knowledge-base/performance/audit-combined/.

De audit is intern uitgevoerd met reproduceerbare scripts en handmatige verificatie; een externe due-diligence-laag valt binnen het werkpakket van de beoogde commerciële medeoprichter. De numerieke uitkomsten in dit rapport komen direct uit die scripts, niet uit vrije interpretatie.

Colofon

Analyse en schrijfwerk zijn opgesteld met ondersteuning van een AI-taalmodel en vervolgens handmatig geverifieerd tegen de JSON-reports en de ledger. Alle numerieke uitkomsten komen rechtstreeks uit de reproduceerbare auditscripts.