Auditrapportages
De formele audit van het gecombineerde Helios-systeem (Systeem 1 Groeimodel + Systeem 2 Bear Market Model) vormt de kern van het beleggingsbewijs. Hier staan de volledige resultaten.
Zie Het Bewijs voor de samenvatting in het verhaal.
Eindoordeel
POSITIEF MET VOORBEHOUD — 21 van 25 formele auditcriteria gehaald.
De kolom “EUR afgedekt (75%, CME)” verwijst naar de afdekkingsvariant met CME-termijncontracten (CME Futures) — zie Valuta-afdekking voor de volledige uitleg.
| Metriek | USD nominaal | EUR afgedekt (75%, CME) | EUR reëel |
|---|---|---|---|
| CAGR | 21,68% | 21,87% | 19,06% |
| Max drawdown | -33,79% | -32,51% | -35,15% |
| Sharpe | 0,93 | 0,91 | 0,81 |
| Sortino | 1,29 | 1,27 | 1,14 |
| Calmar | 0,64 | 0,67 | 0,54 |
| S&P 500-correlatie | 0,14 | 0,14 | 0,14 |
| Trades | 11.402 | 11.402 | 11.402 |
De vier niet-gehaalde criteria — DATA-02, STAT-06, STAT-07 en ROB-03 — worden hieronder per stuk besproken met de meetwaarde, de drempel en een belegger-interpretatie. Ze zijn gedocumenteerd en begrepen, niet weggeredeneerd.
Watervaltabel: van USD nominaal naar EUR reëel
Elke rij past één correctie toe op de ruwe USD-backtest, zodat zichtbaar wordt wat er van het brutorendement overblijft na valuta-afdekking en inflatie:
| Fase | CAGR | Max DD | Sharpe | Sortino | Calmar | S&P-corr. |
|---|---|---|---|---|---|---|
| USD nominaal (met slippage) | 21,68% | -33,79% | 0,93 | 1,29 | 0,64 | 0,14 |
| EUR onafgedekt | 22,20% | -36,04% | 0,92 | 1,36 | 0,62 | 0,09 |
| EUR afgedekt (75%, CME) | 21,87% | -32,51% | 0,91 | 1,27 | 0,67 | 0,14 |
| EUR afgedekt (75%, IBKR Spot) | 21,53% | -36,22% | — | — | — | — |
| EUR reëel (CME-hedge) | 19,06% | -35,15% | 0,81 | 1,14 | 0,54 | 0,14 |
Attributiedecompositie (7 componenten)
De opbouw van het gecombineerde rendement, uitgesplitst naar bron:
| Component | Waarde |
|---|---|
| Gecombineerde CAGR | 21,68% |
| S1 standalone CAGR | 14,95% |
| S2 standalone CAGR | 3,82% |
| Benchmark (SPY) CAGR | 10,24% |
| S1 alpha boven benchmark | 4,71% |
| Gewichtsallocatie-effect | 2,77% |
| Kostenslippage | 1,21% van brutorendement |
De totale handelskosten bedragen $438.586 over 11.402 trades ($84.189 commissies + $354.398 slippage). De bedragen staan in USD omdat de onderliggende ledger in USD wordt bijgehouden; in de waterval hierboven zijn ze al meegerekend in de EUR-afgedekte en EUR-reële CAGR.
25 kwantitatieve criteria
De audit bestaat uit vijf categorieën met elk vijf criteria:
Margingebruik — Geslaagd
| Metriek | Waarde | Drempel |
|---|---|---|
| Piekmargeverhouding | 1,89x | < 3,0x |
| Gemiddelde margeverhouding | 1,21x | — |
| Min. margin-callafstand | 27,9% | > 10% |
Gewichtsgevoeligheid — Geslaagd (robuust)
| Scenario | CAGR | vs. baseline |
|---|---|---|
| Laag S1 / basis S2 | 17,99% | -6,8% |
| Vorige iteratie S1 / basis S2 | 19,30% | +0,0% |
| Definitief S1 / basis S2 | 21,68% | +6,6% |
| Minimum S1 / minimum S2 | 14,55% | -24,6% |
Maximale relatieve CAGR-daling: 24,6% — binnen de robuustheidsdrempel van 30%. De prestaties schalen monotoon met het S1-gewicht, zonder plotselinge breuken bij het variëren van de gewichten.
Leverage-efficiëntie — Efficiënt
| Metriek | Waarde |
|---|---|
| CAGR-verbetering (leveraged vs. niet) | 2,77% |
| Drawdown-kosten | 4,59% |
| Efficiëntieratio | 0,60 |
| Drempel | > 0,30 |
De gemiddelde piekmarge ligt op 1,89x — dat is het concrete leverage-niveau waarop de strategie draait, ruim onder de auditdrempel van 3,0x.
Parametergevoeligheid — Geslaagd
Vijf varianten getest. Maximale relatieve CAGR-daling: 13,69%. Alle varianten blijven winstgevend en binnen de 30%-drempel.
4 criteria niet gehaald
Dit zijn de vier auditcriteria die formeel niet gehaald zijn: drie “niet geslaagd” en één “gedeeltelijk geslaagd”. Hieronder per criterium de meetwaarde, de drempel en een belegger-interpretatie.
DATA-02 — Volledigheid van de prijsdata — Niet geslaagd
Wat de audit meet: of de onderliggende koersbestanden (alle 5.373 tickers) geen gaten, nullen of ontbrekende kolommen hebben.
Uitkomst: 1 van de 4 deelchecks geslaagd. 1.521 tickers met in totaal 27.721 gap-ranges, 6 tickers met nulprijzen, 521 van de 5.373 bestanden zonder unadjusted_close-kolom.
Belegger-interpretatie: 27.721 gaten klinkt als datarommel. In de toelichting staat dat al die gaten vóór 1999 vallen, terwijl de backtest van 1999 tot 2025 loopt. De nulprijzen zitten in drie delisted of gehalteerde aandelen op specifieke data, en de ontbrekende kolom is op indextickers en geschrapte aandelen die niet voor orderuitvoering worden gebruikt. De data die de strategie werkelijk gebruikt, is wél schoon. De auditdrempel is streng genoeg om hier “niet geslaagd” te scoren, ook als het binnen de backtestperiode geen impact heeft — eerder een compliment aan de auditmethodiek dan een bezwaar tegen de strategie.
STAT-06 — Worst-case drawdown-vergelijking — Niet geslaagd
Wat de audit meet: in Helios’ 5 ergste drawdown-periodes — was SPY (buy-and-hold) minder diep gezakt in diezelfde periode? Uitkomst: in 4 van de 5 gevallen wel. Alleen tijdens COVID 2020 was Helios ondieper (-23,42%) dan SPY (-26,44%). De diepste Helios-drawdown in deze top-5: -30,77% (eurocrisis 2010-2012).
Belegger-interpretatie: Dit is de belangrijkste van de vier, en de eerlijkste. De audit kijkt specifiek naar Helios’ vijf zwakste momenten — niet naar SPY’s. In 2008, waar SPY -55,22% zakte, bleef Helios door regime-filter en hedges vrijwel buiten schot. Over het volledige 30-jaars venster blijft de max drawdown van Helios dan ook -33,79% (USD nominaal) tegenover -55,22% voor SPY. Het “niet geslaagd”-oordeel geeft aan dat Helios op zijn eigen slechtst dieper zakt dan SPY op die momenten — niet dat het totale risico hoger ligt.
STAT-07 — Forensische analyse van handelsconcentratie — Gedeeltelijk geslaagd
Wat de audit meet: of het totaalrendement niet afhangt van een handvol grote winnaars, of één enkele aandelenpositie het resultaat scheef trekt, en of de winst/verlies-ratio boven 1,5 ligt. Uitkomst: na verwijdering van de top-5 trades blijft de CAGR 17,8% (ruim boven de 10%-drempel), maar NVDA alleen is goed voor 10,9% van het totaalrendement (drempel: 5%) en de win/loss-ratio is 1,10 (drempel: 1,5).
Belegger-interpretatie: De enige “gedeeltelijk geslaagd” in plaats van “niet geslaagd” — dat onderscheid is terecht. NVDA die bijna 11% van het totale rendement draagt komt doordat de laatste twee jaar door AI-gedreven momentum is gedomineerd, precies het soort beweging waar deze strategie op jaagt. De ruggengraattest (“wat als we NVDA eruit halen?”) toont aan dat de rest van het systeem ook zonder die ene naam werkt. De win/loss-ratio van 1,10 klinkt laag, maar is typerend voor momentumstrategieën die verliezers snel afkappen en winnaars laten lopen — de verwachte verliezen zijn kleiner dan de verwachte winsten, dus een ratio net boven 1 is genoeg om winstgevend te zijn.
ROB-03 — Deflated Sharpe ratio — Niet geslaagd
Wat de audit meet: of het Sharpe-getal (hier 0,93 op USD nominaal) ook standhoudt als je rekening houdt met het feit dat er meerdere strategievarianten zijn getest voordat deze werd gekozen. Hoe meer varianten je test, hoe groter de kans dat je toevallig een “goede” uitkomst vindt. Uitkomst: deflated Sharpe ratio = 0,74, onder de drempel van 0,95 bij een aanname van 50 geteste varianten.
Belegger-interpretatie: De lastigste van de vier om met het blote oog te beoordelen. De Sharpe van 0,93 lijkt robuust, maar de deflated variant probeert te compenseren voor “als we 50 keer hadden geprobeerd, zouden we dan toevallig op 0,93 uitkomen?” Het antwoord is: niet duidelijk genoeg. Dat is geen bewijs dat de strategie niet werkt — het is een bewijs dat dit ene getal alleen (0,93) niet genoeg is om de twijfel weg te nemen. Als tegenwicht: de walk-forward-efficiëntie is 99% (de strategie houdt stand als je hem op verse data loslaat) en de factor-regressie-alpha is statistisch significant met p=0,003. Die twee leveren onafhankelijk bewijs dat het geen toeval is.
Subperiodeprestaties (USD nominaal)
Prestaties per marktregime
| Periode | Data | CAGR | Sharpe | Sortino | Max DD |
|---|---|---|---|---|---|
| Dot-comhausse en -crash | 1999–2002 | 48,42% | 1,47 | 1,97 | -25,67% |
| Herstel en huizenbubbel | 2003–2007 | 7,42% | 0,42 | 0,58 | -23,72% |
| Financiële crisis | 2008–2009 | 59,44% | 1,57 | 2,85 | -19,61% |
| Post-crisis bullmarkt | 2010–2015 | 10,66% | 0,61 | 0,80 | -33,79% |
| Late-cycle expansie | 2016–2019 | 10,09% | 0,62 | 0,97 | -17,05% |
| COVID, herstel en recent | 2020–2025 | 20,16% | 0,85 | 1,19 | -28,13% |
Het systeem is in elke subperiode winstgevend, met de sterkste prestaties in crisisperiodes (dot-com, GFC) — dat is het Bear Market Model aan het werk. In rustige bullmarktjaren (2003–2007 Sharpe 0,42; 2010–2015 Sharpe 0,61; 2016–2019 Sharpe 0,62) blijft het rendement positief maar bescheiden; de echte uitschieters zitten in periodes waarin de markt zelf kwetsbaar is.
Top 5 drawdowns (USD nominaal)
| Rang | Gebeurtenis | Start | Dieptepunt | Diepte | Duur (dagen) | Herstel (dagen) |
|---|---|---|---|---|---|---|
| 1 | Europese schuldencrisis / VS-downgrade | 2010-05-07 | 2012-06-08 | -33,79% | 763 | 293 |
| 2 | COVID-19-crash | 2020-02-28 | 2020-03-20 | -28,13% | 21 | 140 |
| 3 | Dot-comcrash | 2000-04-07 | 2000-05-26 | -25,67% | 49 | 259 |
| 4 | Midcyclus-correctie (2006) | 2006-05-19 | 2006-08-04 | -23,72% | 77 | 350 |
| 5 | Recente correctie (2025) | 2025-02-28 | 2025-05-23 | -22,57% | 84 | 154 |
De maximale drawdown trad op tijdens de Europese schuldencrisis (2010–2012), niet tijdens de GFC. Tijdens de GFC was het Bear Market Model juist actief en leverde het sterke rendementen in een instortende markt.
Monte Carlo-analyse
Betrouwbaarheidsintervallen (10.000 bootstrap-resamples)
USD nominaal:
| Metriek | p5 | Mediaan | Gemiddeld | p95 | 95%-BI |
|---|---|---|---|---|---|
| CAGR | 13,07% | 21,64% | 21,76% | 32,84% | [11,35%, 32,84%] |
| Sharpe | 0,62 | 0,93 | 0,93 | 1,30 | [0,56, 1,30] |
EUR afgedekt (75%, CME):
| Metriek | p5 | Mediaan | Gemiddeld | p95 | 95%-BI |
|---|---|---|---|---|---|
| CAGR | 12,98% | 21,85% | 21,96% | 33,39% | [11,25%, 33,39%] |
| Sharpe | 0,61 | 0,91 | 0,91 | 1,28 | [0,55, 1,28] |
EUR reëel:
| Metriek | p5 | Mediaan | Gemiddeld | p95 | 95%-BI |
|---|---|---|---|---|---|
| CAGR | 10,30% | 19,07% | 19,16% | 30,39% | [8,63%, 30,39%] |
| Sharpe | 0,51 | 0,81 | 0,82 | 1,18 | [0,45, 1,18] |
Op het pessimistische p5-niveau levert de strategie 10,30% EUR reëel CAGR — dat is het niveau waar 95 van de 100 scenario’s beter uitkomen, maar ook 5 van de 100 slechter. Het 95%-betrouwbaarheidsinterval laat de bandbreedte zien waarbinnen de werkelijke uitkomst naar verwachting valt; de uitersten aan beide kanten horen erbij.
Survivorship bias
De geschatte impact van survivorship bias bedraagt -188 basispunten CAGR. Dit is een erkend caveat: de backtest gebruikt historische S&P 500-constituenten inclusief gedenoteerde aandelen, maar de Norgate-dataset dekt niet alle delistings volledig. Het restrisico is niet exact te becijferen — de -188 bps is zelf de best mogelijke schatting; een extra marge daarbovenop valt binnen de onzekerheid rond het cijfer zelf.
Methode
De kwantitatieve audit is uitgevoerd in Q1 2026, met volledige toegang tot de broncode van de strategie, de ruwe ledger (11.402 trades) en de historische marktdata (1996-2025, Norgate PIT-dataset). De 25 testscripts zijn zelf open source: elke metriek in dit rapport is reproduceerbaar vanuit de raw JSON-reports in knowledge-base/performance/audit-combined/.
De audit is intern uitgevoerd met reproduceerbare scripts en handmatige verificatie; een externe due-diligence-laag valt binnen het werkpakket van de beoogde commerciële medeoprichter. De numerieke uitkomsten in dit rapport komen direct uit die scripts, niet uit vrije interpretatie.
Colofon
Analyse en schrijfwerk zijn opgesteld met ondersteuning van een AI-taalmodel en vervolgens handmatig geverifieerd tegen de JSON-reports en de ledger. Alle numerieke uitkomsten komen rechtstreeks uit de reproduceerbare auditscripts.