本文对经典的模糊半参数部分线性模型进行了推广。在本文中,考虑将样条函数和非参方法结合起来进而应用在具有模糊解释变量和模糊响应变量的数据中来,并将模糊响应变量的展形作为模糊响应变量的中心的线性组合,从而构建出一种新的自适应模糊半参数回归模型。模型中重点考虑解释变量的中心与响应变量之间的关系,以简便所构造的模型。然后,提出了一种交叉验证和最小绝对偏差混合的方法来实现所构造的自适应模糊半参数回归的目标函数优化问题,进而估计模糊半参回归模型的非参数部分的带宽和参数部分中待估计的实系数。为了验证所提出模型的有效性,本文中利用了一些常用的拟合指标来检验回归模型的性能。最后将本文中提出的回归模型与所提出的方法进行了对比分析,结果表明所提出的回归模型是较为有效的和准确的。
回归分析[1]是为了研究一个真实现象与其他真实现象之间的依赖关系而采用的统计方法,是一种有着广泛应用背景的数据分析方法。它主要基于观测数据讨论响应变量与一个或多个解释变量之间的相关依赖关系,广泛用于通过对解释变量的观测来描述、控制和预测响应变量的值。然而,由于数据不精确, 观测数据与相应的估计值之间存在偏差。提出了模糊回归方法来建立变量间关系的模型。它们还广泛应用于分析复杂系统,包括经济系统、社会系统、工程系统和环境系统,这些系统中人类主观判断的模糊性是有影响的[2] [3] [4] [5]。
Tanaka et al. [6]是最早提出了模糊线性回归问题。他于1982 年首次提出模糊线性回归模型,该模型主要用于反映模糊系统中解释变量与响应变量之间的关系。传统回归模型将真实数据与估计值之间的偏差视为观测误差,而模糊回归分析则将这种误差视为系统结构本身的模糊性,将数据与估计值之间的偏差视为系统参数的模糊性,从而通过参数模糊性来解决这一问题。他们最小化了系统的模糊性,以估计回归模型的参数。此后,模糊回归模型引起了一些研究者的兴趣。Yen et al. [7]将使用对称三角参数的模糊线性回归模型的结果扩展为不对称模糊三角系数的模型。沿着这个思路,后来的研究发展并完善了该模型的缺陷[8] [9]。
Diamond [10]研究了模糊回归建模问题中未知参数的最小二乘估计方法。
Xu 和Li [11]利用模糊数空间上定义的距离建立了模糊类比,并用最小二乘方法处理了模糊多元线性回归问题。随后一些作者对这种方法进行了研究和改进(例如[12] [13])。这些研究都是明确了输入输出之间的关系,从而建立多元线性回归模型,通过各种方法求解未知系数解决实际问题。
对于许多实际问题,输入和输出之间的函数形式往往是未知的, 我们无法得到他们之间的具体关系。
此时,有非参数技术来改进模糊回归分析。近几年不少学者研究了模糊非参回归模型:Petit-Renaud 和Denux [14]提出了一种基于模糊置信度分配的非参数回归方法。Farnoosh 等人[15]研究了具有多元实值输入和三角模糊输出的模糊非参数回归模型的岭估计。非参数方法通常存在一些解释性差,数据要求高等缺陷。而由于模糊半参数回归模型集合参数回归和非参数回归,因此,模糊半参回归模型具有了他们的