Lees het interview van CEO Tijmen de Gelder met Funda over het inzetten van woningdata
Sluiten X

Werkwijze en accuratesse van de AVM van Altum AI

Voorspelling van het Automated Valuation Model (AVM) van Altum AI

Het AVM-model is getraind om de werkelijke marktwaarden te voorspellen van woningen in Nederland. De gewenste output van het model is de transactiewaarde, daarom is onze doelvariabele de transactieprijs.


We gebruiken veel functies om ons model te trainen, zoals transactiegegevens (laatste transactiedatum, type transactie), functies die het huis definiëren (binnenoppervlak, buitenoppervlak, volume, bouwjaar, woningtype), locatiegegevens, buurtgegevens, voorzieningen, inkomensgegevens, gegevens over belastingen en demografie.


Verder hebben we een uniek model gemaakt voor het identificeren van de meest betrouwbare referentiewoningen die ook een significante rol spelen in de uiteindelijke waardebepaling.

Trainingsset

De dataset bestaat uit alle unieke huizen die zijn verhandeld vanaf 1993 tot heden (we behouden de laatste transactie als een huis meer dan eens is verhandeld), na uitsluiting van de familietransacties. De trainingsset beslaat de meerderheid van de hele dataset.

Omgaan met verschillen in woningtype, locatie en bouwjaar

Het woningtype en de locatie gebruiken we als input voor het model, zodat het leert om onderscheid te maken tussen de woningtypen, waardoor de vertekening wordt verminderd. Bovendien zijn veel functies die de locatie van een huis definiëren gebruikt als input, zoals provincie, coördinaten, buurtcode en nog meer.

We nemen gegevens op van de afgelopen 3-4 jaar, die worden geïndexeerd. Op deze manier vertrouwen we niet op een deel van een woningpopulatie om het model te trainen, maar eerder op de algemene trends op de huizenmarkt voor alle woningtypen en locaties.

Om een verkeerde afwijking door een specifieke tijdsperiode in het verleden te voorkomen indexeren we de transactieprijzen naar de huidige tijd door gebruik te maken van de laatste periode van een HPI (woningprijsindex).

Indexeren van transacties

Altum AI HPI
We hebben een prognosemodel ontwikkeld die elke maand wordt bijgewerkt en onafhankelijk is van de Kadaster-prijsindex. Deze index volgt nauwkeurig de ontwikkeling van de Nederlandse huizenprijzen in de tijd en is beschikbaar van kleinere tot grotere gebieden in Nederland. Meer specifiek berekent Altum AI maandelijks deze huizenprijzenindexcijfers per buurt, wijk, gemeente, provincie en voor heel Nederland.


Kadaster HPI
We gebruiken de nieuwste beschikbare HPI die door het Kadaster wordt geleverd, omdat deze maandelijks geen significante bewegingen heeft. Ons model gebruikt ook veel andere variabelen, dus het niet bijwerken van de historische transacties maakt geen groot verschil voor het model. Tot slot, omdat we de meest recente transacties gebruiken, heeft het indexeringsproces slechts een kleine invloed op de prijzen – de schaal van de prijs is het belangrijkste onderdeel ervan.


In het geval van significante marktveranderingen beoordelen we de huidige marktpositie. Met behulp van historische bewegingen, vastgoedmarkt expertise en domeinkennis schatten we de huidige prijsindex en gebruiken deze om de transactieprijzen bij te werken.

Werkwijze t.a.v. trainen en valideren van het model

We meten de nauwkeurigheid van het model door een train-, validatie-, en testset toe te passen. Elke maand hebben we nieuwe gegevens, daarom trainen we ons AVM-model opnieuw om de stabiliteit en betrouwbaarheid te identificeren. Nadat we de maandelijkse statistieken hebben ontvangen, gebruiken we ze bovendien als een indicator van consistentie.

Ook hebben we een grote dataset voor de training opgesplitst in train-, validatie- en testsets op een slimme manier om ervoor te zorgen dat elke set bijna dezelfde verdeling heeft van de belangrijkste kenmerken, wat onze sets homogeen maakt en immuun voor overfitting.

Nauwkeurigheid en methodologie

Er is met veel statistieken rekening gehouden bij de uiteindelijke schatting van het model. De nauwkeurigheid wordt uitgedrukt door de waarschijnlijkheid dat een voorspelling binnen een vooraf bepaald bereik valt, de Forecast Standard Deviation (FSD).


De meest recente nauwkeurigheid, is 94.90% binnen een 20% foutmarge of 90,9% binnen een 15% foutmarge en 82,5% binnen een 10% foutmarge. Bovendien zijn we erg trots op onze Median Absolute Percentage Error (MdAPE), die in totaal 3,74% ± 0,09% is. Dit is voor alle woonobjecten in Nederland variërend van € 70.000 tot € 1.500.000.


We gebruiken een combinatie van een machine learning model en statistieken waarmee we zowel het foutpercentage als de betrouwbaarheid van de voorspelling bepalen voor elk individueel huis in onze API. Door deze statistieken kan worden gedefinieerd hoeveel vertrouwen we hebben in de geschatte waarde.


Een werkgroep van het Ministerie van Binnenlandse Zaken heeft nieuwe richtlijnen in ontwikkeling voor het gebruik van AVM’s die een standaard bieden om de nauwkeurigheid en betrouwbaarheid van de output van AVM-providers te kunnen beoordelen. De methoden en technieken voor het betrouwbaar beoordelen van de nauwkeurigheid van de taxaties zijn grotendeels gebaseerd op internationale normen voor modelgebaseerde taxaties. Specifiek is de Standard on Ratio Studies van de International Association of Assessing Officers (IAAO) als uitgangspunt genomen, omdat deze standaard wereldwijd het meest gebruikt wordt en bovendien de meest gedetailleerde beschrijving van methoden is.


Altum AI past haar methodologieën voor het einde van het jaar aan deze normen aan.

Stabiliteit van de prestaties verdeeld over woningtypen, locaties en bouwjaren

Ratioanalyse

Beschrijving: de ratio-analyse toont de afwijking tussen de voorspelde waarde en de transactieprijs.

Norm: tussen 0,97-1,03

Type

verhouding

Provincie

verhouding

Bouwjaar Bereik

verhouding

2-onder-1-kap

1.0089

Drenthe

1,0062

Tot en met 1945

1.0145

appartement

1.015

Flevoland

1,004

1946-1964

1.011

hoekwoning

1.0085

Friesland

1,0109

1965-1974

1,0103

tussenwoning

1.005

Gelderland

1,009

1975-1982

1.0074

vrijstaand

1.0147

Groningen

1,0068

1983-1987

1.0063

  

Limburg

1.0053

1988-1991

1.0073

  

Noord-Brabant

1,01

1992-1999

1,0072

  

Noord-Holland

1.0098

2000-2005

1.0089

  

Overijssel

1.0091

2006-2013

1.0097

  

Utrecht

1.0132

2014-heden

1.011

  

Zeeland

1.0121

  
  

Zuid-Holland

1.012

  

COD (Coefficient of Dispersion)

Beschrijving: de COD toont de spreiding van de gemiddelde verhouding tot de mediane ratio

norm: tussen 0 – 10%

Type

COD

Provincie

COD

Bouwjaar Bereik

COD

2-onder-1-kap

5.92

Drenthe

6.01

Tot en met 1945

8.27

appartement

8,4

Flevoland

5.74

1946-1964

7.02

hoekwoning

5.58

Friesland

6.06

1965-1974

6.2

tussenwoning

4.94

Gelderland

6.19

1975- 1982

5,77

vrijstaand

7,89

Groningen

6,51

1983-1987

5,82

  

Limburg

6,6

1988-1991

5,35

  

Noord-Brabant

5,96

1992-1999

5,35

  

Noord- Holland

7,03

2000-2005

5,76

  

Overijssel

5,77

2006-2013

6,27

  

Utrecht

6,27

2014-heden

6,84

  

Zeeland

7,14

  
  

Zuid-Holland

7,11

  

Fout standaarddeviatie 95% betrouwbaarheidsinterval ratio-controles

Beschrijving: Betrouwbaarheid geeft aan hoe waarschijnlijk het is dat de kerncijfers in de steekproef overeenkomen met de werkelijke waarden in de hele categorie. Er kan niet zomaar van worden uitgegaan dat ratio’s normaal verdeeld zijn. Daarom moet eerst de verdeling van de ratio’s worden onderzocht (bijvoorbeeld COD en scheefheid van de verdeling).
Norm: ± 0,05

Type

verhouding

Provincie

verhouding

Bouwjaar Bereik

verhouding

2-onder-1-kap

0,0031

Drenthe

0,0063

Tot en met 1945

0,003

appartement

0,0025

Flevoland

0,0058

1946-1964

0,0032

hoekwoning

0, 0024

Friesland

0,0056

1965-1974

0,0026

tussenwoning

0,0014

Gelderland

0,003

1975-1982

0,0029

vrijstaand

0,0035

Groningen

0,0055

1983-1987

0,0039

  

Limburg

0,0051

1988-1991

0,004

  

Noord-Brabant

0, 0026

1992-1999

0,0028

  

Noord-Holland

0,0029

2000-2005

0,0036

  

Overijssel

0,0039

2006-2013

0,0036

  

Utrecht

0,0036

2014-heden

0,007

  

Zeeland

0,0073

  
  

Zuid-Holland

0,0025