Werkwijze en accuratesse van de AVM van Altum AI
Voorspelling van het Automated Valuation Model (AVM) van Altum AI
Het AVM-model is getraind om de werkelijke marktwaarden te voorspellen van woningen in Nederland. De gewenste output van het model is de transactiewaarde, daarom is onze doelvariabele de transactieprijs.
We gebruiken veel functies om ons model te trainen, zoals transactiegegevens (laatste transactiedatum, type transactie), functies die het huis definiëren (binnenoppervlak, buitenoppervlak, volume, bouwjaar, woningtype), locatiegegevens, buurtgegevens, voorzieningen, inkomensgegevens, gegevens over belastingen en demografie.
Verder hebben we een uniek model gemaakt voor het identificeren van de meest betrouwbare referentiewoningen die ook een significante rol spelen in de uiteindelijke waardebepaling.
Trainingsset
De dataset bestaat uit alle unieke huizen die zijn verhandeld vanaf 1993 tot heden (we behouden de laatste transactie als een huis meer dan eens is verhandeld), na uitsluiting van de familietransacties. De trainingsset beslaat de meerderheid van de hele dataset.
Omgaan met verschillen in woningtype, locatie en bouwjaar
Het woningtype en de locatie gebruiken we als input voor het model, zodat het leert om onderscheid te maken tussen de woningtypen, waardoor de vertekening wordt verminderd. Bovendien zijn veel functies die de locatie van een huis definiëren gebruikt als input, zoals provincie, coördinaten, buurtcode en nog meer.
We nemen gegevens op van de afgelopen 3-4 jaar, die worden geïndexeerd. Op deze manier vertrouwen we niet op een deel van een woningpopulatie om het model te trainen, maar eerder op de algemene trends op de huizenmarkt voor alle woningtypen en locaties.
Om een verkeerde afwijking door een specifieke tijdsperiode in het verleden te voorkomen indexeren we de transactieprijzen naar de huidige tijd door gebruik te maken van de laatste periode van een HPI (woningprijsindex).
Indexeren van transacties
Altum AI HPI
We hebben een prognosemodel ontwikkeld die elke maand wordt bijgewerkt en onafhankelijk is van de Kadaster-prijsindex. Deze index volgt nauwkeurig de ontwikkeling van de Nederlandse huizenprijzen in de tijd en is beschikbaar van kleinere tot grotere gebieden in Nederland. Meer specifiek berekent Altum AI maandelijks deze huizenprijzenindexcijfers per buurt, wijk, gemeente, provincie en voor heel Nederland.
Kadaster HPI
We gebruiken de nieuwste beschikbare HPI die door het Kadaster wordt geleverd, omdat deze maandelijks geen significante bewegingen heeft. Ons model gebruikt ook veel andere variabelen, dus het niet bijwerken van de historische transacties maakt geen groot verschil voor het model. Tot slot, omdat we de meest recente transacties gebruiken, heeft het indexeringsproces slechts een kleine invloed op de prijzen – de schaal van de prijs is het belangrijkste onderdeel ervan.
In het geval van significante marktveranderingen beoordelen we de huidige marktpositie. Met behulp van historische bewegingen, vastgoedmarkt expertise en domeinkennis schatten we de huidige prijsindex en gebruiken deze om de transactieprijzen bij te werken.
Werkwijze t.a.v. trainen en valideren van het model
We meten de nauwkeurigheid van het model door een train-, validatie-, en testset toe te passen. Elke maand hebben we nieuwe gegevens, daarom trainen we ons AVM-model opnieuw om de stabiliteit en betrouwbaarheid te identificeren. Nadat we de maandelijkse statistieken hebben ontvangen, gebruiken we ze bovendien als een indicator van consistentie.
Ook hebben we een grote dataset voor de training opgesplitst in train-, validatie- en testsets op een slimme manier om ervoor te zorgen dat elke set bijna dezelfde verdeling heeft van de belangrijkste kenmerken, wat onze sets homogeen maakt en immuun voor overfitting.
Nauwkeurigheid en methodologie
Er is met veel statistieken rekening gehouden bij de uiteindelijke schatting van het model. De nauwkeurigheid wordt uitgedrukt door de waarschijnlijkheid dat een voorspelling binnen een vooraf bepaald bereik valt, de Forecast Standard Deviation (FSD).
De meest recente nauwkeurigheid, is 94.90% binnen een 20% foutmarge of 90,9% binnen een 15% foutmarge en 82,5% binnen een 10% foutmarge. Bovendien zijn we erg trots op onze Median Absolute Percentage Error (MdAPE), die in totaal 3,74% ± 0,09% is. Dit is voor alle woonobjecten in Nederland variërend van € 70.000 tot € 1.500.000.
We gebruiken een combinatie van een machine learning model en statistieken waarmee we zowel het foutpercentage als de betrouwbaarheid van de voorspelling bepalen voor elk individueel huis in onze API. Door deze statistieken kan worden gedefinieerd hoeveel vertrouwen we hebben in de geschatte waarde.
Een werkgroep van het Ministerie van Binnenlandse Zaken heeft nieuwe richtlijnen in ontwikkeling voor het gebruik van AVM’s die een standaard bieden om de nauwkeurigheid en betrouwbaarheid van de output van AVM-providers te kunnen beoordelen. De methoden en technieken voor het betrouwbaar beoordelen van de nauwkeurigheid van de taxaties zijn grotendeels gebaseerd op internationale normen voor modelgebaseerde taxaties. Specifiek is de Standard on Ratio Studies van de International Association of Assessing Officers (IAAO) als uitgangspunt genomen, omdat deze standaard wereldwijd het meest gebruikt wordt en bovendien de meest gedetailleerde beschrijving van methoden is.
Altum AI past haar methodologieën voor het einde van het jaar aan deze normen aan.
Stabiliteit van de prestaties verdeeld over woningtypen, locaties en bouwjaren
Ratioanalyse
Beschrijving: de ratio-analyse toont de afwijking tussen de voorspelde waarde en de transactieprijs.
Norm: tussen 0,97-1,03
Type | verhouding | Provincie | verhouding | Bouwjaar Bereik | verhouding |
2-onder-1-kap | 1.0089 | Drenthe | 1,0062 | Tot en met 1945 | 1.0145 |
appartement | 1.015 | Flevoland | 1,004 | 1946-1964 | 1.011 |
hoekwoning | 1.0085 | Friesland | 1,0109 | 1965-1974 | 1,0103 |
tussenwoning | 1.005 | Gelderland | 1,009 | 1975-1982 | 1.0074 |
vrijstaand | 1.0147 | Groningen | 1,0068 | 1983-1987 | 1.0063 |
Limburg | 1.0053 | 1988-1991 | 1.0073 | ||
Noord-Brabant | 1,01 | 1992-1999 | 1,0072 | ||
Noord-Holland | 1.0098 | 2000-2005 | 1.0089 | ||
Overijssel | 1.0091 | 2006-2013 | 1.0097 | ||
Utrecht | 1.0132 | 2014-heden | 1.011 | ||
Zeeland | 1.0121 | ||||
Zuid-Holland | 1.012 |
COD (Coefficient of Dispersion)
Beschrijving: de COD toont de spreiding van de gemiddelde verhouding tot de mediane ratio
norm: tussen 0 – 10%
Type | COD | Provincie | COD | Bouwjaar Bereik | COD |
2-onder-1-kap | 5.92 | Drenthe | 6.01 | Tot en met 1945 | 8.27 |
appartement | 8,4 | Flevoland | 5.74 | 1946-1964 | 7.02 |
hoekwoning | 5.58 | Friesland | 6.06 | 1965-1974 | 6.2 |
tussenwoning | 4.94 | Gelderland | 6.19 | 1975- 1982 | 5,77 |
vrijstaand | 7,89 | Groningen | 6,51 | 1983-1987 | 5,82 |
Limburg | 6,6 | 1988-1991 | 5,35 | ||
Noord-Brabant | 5,96 | 1992-1999 | 5,35 | ||
Noord- Holland | 7,03 | 2000-2005 | 5,76 | ||
Overijssel | 5,77 | 2006-2013 | 6,27 | ||
Utrecht | 6,27 | 2014-heden | 6,84 | ||
Zeeland | 7,14 | ||||
Zuid-Holland | 7,11 |
Fout standaarddeviatie 95% betrouwbaarheidsinterval ratio-controles
Beschrijving: Betrouwbaarheid geeft aan hoe waarschijnlijk het is dat de kerncijfers in de steekproef overeenkomen met de werkelijke waarden in de hele categorie. Er kan niet zomaar van worden uitgegaan dat ratio’s normaal verdeeld zijn. Daarom moet eerst de verdeling van de ratio’s worden onderzocht (bijvoorbeeld COD en scheefheid van de verdeling).
Norm: ± 0,05
Type | verhouding | Provincie | verhouding | Bouwjaar Bereik | verhouding |
2-onder-1-kap | 0,0031 | Drenthe | 0,0063 | Tot en met 1945 | 0,003 |
appartement | 0,0025 | Flevoland | 0,0058 | 1946-1964 | 0,0032 |
hoekwoning | 0, 0024 | Friesland | 0,0056 | 1965-1974 | 0,0026 |
tussenwoning | 0,0014 | Gelderland | 0,003 | 1975-1982 | 0,0029 |
vrijstaand | 0,0035 | Groningen | 0,0055 | 1983-1987 | 0,0039 |
Limburg | 0,0051 | 1988-1991 | 0,004 | ||
Noord-Brabant | 0, 0026 | 1992-1999 | 0,0028 | ||
Noord-Holland | 0,0029 | 2000-2005 | 0,0036 | ||
Overijssel | 0,0039 | 2006-2013 | 0,0036 | ||
Utrecht | 0,0036 | 2014-heden | 0,007 | ||
Zeeland | 0,0073 | ||||
Zuid-Holland | 0,0025 |