Valuing residential property is inherently complex, requiring consideration of numerous environmental, economic, and property-specific factors. These complexities present significant challenges for automated valuation models (AVMs), which are increasingly used to provide objective assessments for property taxation and mortgage financing. The challenge of obtaining accurate and objective valuations for properties at a country level, and not just within major cities, is further compounded by the presence of multiple localised submarkets-spanning urban, suburban, and rural contexts-where property features contribute differently to value. Existing AVMs often struggle in such settings: traditional hedonic regression models lack the flexibility to capture spatial variation, while advanced machine learning approaches demand extensive datasets that are rarely available. In this article, we address these limitations by developing a robust statistical framework for property valuation in the Irish housing market. We segment the country into six submarkets encompassing cities, large towns, and rural areas, and employ a generalized additive model that captures non-linear effects of property characteristics while allowing feature contributions to vary across submarkets. Our approach outperforms both machine learning-based and traditional hedonic regression models, particularly in data-sparse regions. In out-of-sample validation, our model achieves R-squared values of 0.70, 0.84, and 0.83 for rural areas, towns, and Dublin, respectively, compared to 0.52, 0.71, and 0.82 from a random forest benchmark. Furthermore, the temporal dynamics of our model align closely with reported inflation figures for the study period, providing additional validation of its accuracy.


翻译:住宅房地产估值本质上具有复杂性,需要综合考虑众多环境、经济及物业自身特性因素。这些复杂性为自动估值模型带来了显著挑战,而此类模型正日益广泛地应用于房地产税基评估与抵押贷款融资的客观估值。在全国层面(而不仅限于主要城市)获取准确客观的物业估值,因存在多个本地化子市场(涵盖城市、郊区及农村等不同情境)而更为困难——不同子市场中物业特征对价值的影响机制存在差异。现有自动估值模型在此类场景中常显不足:传统特征价格回归模型缺乏捕捉空间异质性的灵活性,而先进的机器学习方法则需要难以获取的大规模数据集。本文针对爱尔兰住房市场,构建了一个稳健的房地产估值统计框架以突破这些局限。我们将全国划分为涵盖城市、大型城镇及农村区域的六类子市场,采用广义可加模型以捕捉物业特征的非线性效应,同时允许特征贡献度随子市场变化。该方法在数据稀疏区域的表现尤为突出,其性能优于基于机器学习的模型与传统特征价格回归模型。在样本外验证中,本模型在农村地区、城镇及都柏林的R平方值分别达到0.70、0.84和0.83,而随机森林基准模型的对应结果仅为0.52、0.71和0.82。此外,模型的时间动态特征与研究期间公布的通胀数据高度吻合,进一步验证了其准确性。

0
下载
关闭预览

相关内容

房地产是涵盖了土地及其地上建筑物、附着物、相关权益的不动产。
视觉基础模型的可解释性:综述
专知会员服务
26+阅读 · 1月24日
大模型技术发展及治理实践报告
专知会员服务
61+阅读 · 2024年12月27日
【AAAI2023】基于Dirichlet元模型的事后不确定性学习
专知会员服务
16+阅读 · 2022年12月16日
专知会员服务
22+阅读 · 2021年7月14日
专知会员服务
27+阅读 · 2021年2月2日
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
NLG任务评价指标BLEU与ROUGE
AINLP
21+阅读 · 2020年5月25日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关VIP内容
视觉基础模型的可解释性:综述
专知会员服务
26+阅读 · 1月24日
大模型技术发展及治理实践报告
专知会员服务
61+阅读 · 2024年12月27日
【AAAI2023】基于Dirichlet元模型的事后不确定性学习
专知会员服务
16+阅读 · 2022年12月16日
专知会员服务
22+阅读 · 2021年7月14日
专知会员服务
27+阅读 · 2021年2月2日
相关资讯
时空数据挖掘:综述
专知
34+阅读 · 2022年6月30日
NLG任务评价指标BLEU与ROUGE
AINLP
21+阅读 · 2020年5月25日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员