FÆRDERSEILASEN: De fire X-41 seilte i klasse 5, de nest rasleste båtene.

Måleregel med systemsvikt

I Færderseilasen deltok det fire X-41 i samme klasse. Entypebåter med litt ulike seil. Under APH er forskjellen 1,5 %. Med weatherrouting ble det hele 8,8%. Nils Melsom Kristensen seilte på en av båtene. Han er forsker ved Meteorologisk institutt og skrevet et kritisk leserinnlegg.

Leserinnlegg fra Nils Melsom Kristensen

Når algoritmen trumfer virkeligheten – og ORC tåkelegger problemet

Weather Routing Scoring (WRS) kunne ha vært et av de viktigste fremskrittene for handicap-seiling på mange år. Dessverre ser det ut til at systemet i sin nåværende form ikke bare feiler teknisk, men at det også forsvares gjennom tåkelegging fra ORC.

Som seiler og forsker ved Meteorologisk institutt (MET), er jeg vant til å jobbe med værprognoser. Jeg vet bedre enn de fleste at vær er kaotisk. Meteorologimiljøet er helt åpent og transparent om at værvarsler aldri er perfekte. Vi gjør kontinuerlig verifikasjon av modellene våre, og fremskritt handler i stor grad om å identifisere og redusere feilkilder. Det er en åpen, vitenskapelig prosess, der alt arbeid gjennomgår grundig fagfellevurdering.

Det mest oppsiktsvekkende er at folkene i ORC selv innrømmer at de ikke vet hvordan rutene egentlig beregnes

Nils Melsom Kristensen

Men i debatten rundt resultatene fra årets Færderseilas, ser vi noe helt annet. Det er uheldig at en representant for ORC, som har en stor egeninteresse i at WRS skal fremstå som en suksess, nå setter dagsordenen ved å fokusere ensidig på værvarslingenes usikkerhet. Ved å fyre under påstanden om at «ratingen blir feil når værmodellene feiler», flyttes fokus effektivt bort fra de fundamentale, numeriske svakhetene i selve rutingalgoritmen. Det mest oppsiktsvekkende er at folkene i ORC selv innrømmer at de ikke vet hvordan rutene egentlig beregnes. At de likevel velger å stole blindt på systemet, er ikke bare underlig – det er faglig uforsvarlig.

Fire X-41 i Færderseilasen

Name Certificate APH ToT % diff APH WRS ToT % diff WRS
BarXCert1.1863-0.81.0548-8.8
XanaduCert1.1783-1.51.1369-1.7
SaillogicCert1.19610.01.15670.0
GottixCert1.1901-0.51.1337-2.0

WRS skaper stor forskjell for nesten identiske båter.

4 x X-41: Figuren viser vinden slik den er brukt i WRS for de fire X41 som seilte samme klasse, og dermed burde hatt ganske lik vind underveis. Dette er fra rutingen/ratingberegningen, så det har ikke noe med hvordan det ble eller ikke, men viser tydelig at feilen i algoritmen i WRS gir like båter forskjellig vind, og dermed forskjellig rating, selv om de skulle være på de samme stedene til samme tid...

Dobbel straff og APH-myten

Når algoritmen er feil, og varselet bommer, får man en «trippel straff»

Nils Melsom Kristensen

Det sies mye feil om APH (All Purpose Handicap) i disse dager. APH er et vektet middel av alle mulige vindretninger og styrker. Nettopp derfor er det så godt egnet for regattaer med varierende og til dels uforutsigbare forhold; det er robust fordi det er basert på et bredt spekter av muligheter.

I WRS har man forsøkt å snu dette på hodet ved å vekte rutingen etter de faktiske forholdene. Men når algoritmen er feil, og varselet bommer, får man en «trippel straff»: Først vektes de varslede forholdene forskjellig mellom båter grunnet feil i rutingalgoritmen, og deretter kan de faktiske forholdene slå ut ekstra gunstig for noen båter fremfor andre. Man kan derfor i stor grad ende opp med et resultat som ikke reflekterer båtens reelle hastighetspotensial, hverken under de varslede eller faktiske forhold, men hvor godt den traff med algoritme-lotteriet.

ORC kunne gjort en veldig enkel test for å vise alle at WRS fungerer som det skal; de kunne prøvd å simulere APH-tallene. Simuler at båtene seiler rundt den omtalte øya, i de forholdene som APH er bygget på, og se om resultatet matcher APH. Dette ville vært det naturlige stedet å starte utviklingen og verifikasjonen av WRS dersom man fulgte normal vitenskapelig metode, men jeg kan ikke se at det er gjort noe sted.

EKSPERT: Nils Melsom Kristensen er seiler og forsker ved Meteorologisk institutt.
X-41: Nils Melsom Kristensen seilte om bord på «SailLogic».
DIAGRAM: Her beregner jeg differansen i TWS mellom starten og slutten av hvert rutesegment for hver båt. Deretter multipliserer vi TWS_delta med segmentdistansen, og summerer for hver båt. Figuren er interessant og indikerer i stor grad hvem som «taper» og «vinner» på grunn av feilen jeg peker på. Båter under den horisontale linjen har en lavere rating enn forventet basert på APH, mens båter over har en høyere rating. Båter til høyre for den vertikale linjen har i stor grad seilt disse «lange rutesegmentene» i økende vind, noe som betyr at de har blitt beregnet med en lavere vindstyrke enn det det sannsynligvis burde ha vært. Båter til venstre har seilt flere eller lange etapper i avtakende vind. Dette er ingen perfekt måte å kvantifisere feilen på, men jeg mener vi kan si at båtene til høyre for den vertikale linjen har hatt fordel av feilen, mens de til venstre har kommet uheldig ut. Jo lenger unna den vertikale linjen, desto større ulempe/fordel. Det virker systematisk at lange etapper med økende vind gir gunstige ratinger.

Hva er egentlig «rettferdig»?

Når WRS nå beviselig skaper store resultatforskjeller for identiske båter som seiler samme bane, har vi passert grensen for hva som er akseptabelt i en rettferdig konkurranse.

Nils Melsom Kristensen

Respittseiling vil aldri bli «rettferdig» i absolutt forstand. Det er en matematisk umulighet å måle ulike båttyper perfekt mot hverandre i et dynamisk element som havet. Spørsmålet er derfor: Hva betyr rettferdig i denne sammenheng? For de fleste seilere handler det ikke om å ha en algoritme som treffer perfekt på hvert minste vindskift. Det handler om å seile med et system som over tid oppleves riktig, og som er forståelig og forutsigbart. Vi har i lange tider levd med at det noen ganger er «de små båters race», og andre ganger «de stores». Det har skapt debatt, ja, men ikke mistillit.

Når WRS nå beviselig skaper store resultatforskjeller for identiske båter som seiler samme bane, har vi passert grensen for hva som er akseptabelt i en rettferdig konkurranse. Problemet er ikke at været er uforutsigbart – problemet er at algoritmen som skal måle oss, håndterer denne uforutsigbarheten på en måte som forsterker feil fremfor å utjevne dem.

Hvis ORC ønsker å beholde tilliten fra seilmiljøet, må de slutte å bruke værvarselets natur som et skjold for egne systemsvikt. Den tekniske debatten om rutingsegmenter, aliasing-effekter og diskretisering må tas på alvor. Vi fortjener et system basert på ærlig matematikk, ikke på politisk omdømmebygging og tåkelegging av åpenbare svakheter.

Mitt høyst personlige råd til regatta-arrangører fremover er å fortsette å bruke rating basert på ORC, enkelt og greit fordi det er det beste målesystemet, men å gjøre resultatberegningen ved hjelp av APH. Fordi det er det som over tid vil oppleves som minst urettferdig, og mest forutsigbart for seilerne.

Nils Melsom Kristensen
Seiler og forsker ved Meteorologisk institutt

 

For dem som ønsker, og orker, å gå inn i detaljene rundt hvorfor WRS “blir som det blir”, vil jeg peke dere til min gjennomgang her