Beta回归模型基于EM算法的变量选择方法

更新时间:2023-08-06 14:09:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一第42卷第1期2019年1月一一一一一一一一一一一一一一安徽师范大学学报(自然科学版)JournalofAnhuiNormalUniversity(NaturalScience)一一一一一一一一一一一一Vol.42No.1Jan.2019一DOI:10.14182/J.cnki.1001-2443.2019.01.003

Beta回归模型基于EM算法的变量选择方法

王一玲?一赵为华?

(南通大学理学院?江苏南通一226019)

摘一要:本文针对响应变量取值为(0?1)区间上的比例数据研究Beta回归模型的贝叶斯变量选择

方法?首先通过选取合适的先验分布?基于贝叶斯随机搜索和EM方法提出了参数的估计算法?然

后根据回归系数相应的指示变量后验分布提出了重要变量选择的门限准则?所提方法具有易实施二

快速计算等特点?最后通过研究中国上市公司股息率实际数据的影响因素以说明所提方法的有

效性?

关键词:Beta回归模型?EM算法?贝叶斯变量选择

中图分类号:O212一一一文献标志码:A一一一文章编号:1001-2443(2019)01-0016-06

引一言

在对众多领域的实际问题进行统计分析时?取值在(0?1)区间上的比例数据是很常见的?比如股息率二考试通过率二工作效率二次品率以及资本比率等?对于(0?1)上的连续分布?最简单明确的方法是线性回归建模?并用普通最小二乘法估计回归系数?然而线性回归并不能保证拟合值或预测值完全落在区间(0?1)内?这使得结果很难解释?还会产生异方差问题?因此对分数响应变量建模时?直接线性回归是不合适的?为此?Ferrari和CribariNeto(2004)针对这样的响应变量提出了Beta回归模型?对Beta分布的密度函数进行参数重变换后?y~Beta(μ?φ)?即

f(y?μ?φ)=Γ(φ)Γ(μφ)Γ((1-μ)φ)

yμφ-1(1-y)(1-μ)φ-1?0<y<1?其中0<μ<1?φ>0?通过链接函数建立了Beta均值回归模型

g(μt)=ðki=1xtiβi?(1)其中β=(β0?β1? ?βk)T是一个未知回归参数向量?x1? ?xk是k个解释变量?由于Beta分布是一个双参数的分布?因此利用Beta回归刻画比例数据具有很好的灵活性?

在初始回归建模时通常引入许多解释变量去拟合响应变量?然而?这些潜在的解释变量中通常只有一小部分对响应变量有影响?而大部分解释变量的影响都是非常小甚至为零的?选择重要的变量以达到精简模型二提高预测精度近年来成为重要的话题?已有的很多文献都是基于惩罚函数的正则化变量选择方法?如LASSO?SCAD二MCP等罚函数方法?就基于Beta回归模型的变量选择而言?方匡南和王秉权(2016)基于SCAD罚函数方法研究正则化Beta回归?Zhao等(2014)基于坐标算法提出了变散度Beta回归模型的变量选择问题?事实上?变量选择问题是一个有挑战性的任务?在任意实际数据集中?真实的回归系数要么为零要么很大是不可能的?通常是趋向于零?因此?问题不在于找到零系数?而是找到那些足够小到可以认为不重要的系数?把它们缩小到零?最近兴起的贝叶斯变量选择方法相比于基于惩罚函数的变量选择方法具有更多的优势?主要体现在:(1)惩罚函数的变量选择方法需要选择惩罚参数?惩罚参数通常通过一些准则或交收稿日期:2018-06-10基金项目:国家社会科学基金会项目(15BTJ027)国家自然科学基金项目(15171112).

作者简介:通信作者:赵为华(1978 )?男?江苏海门人?副教授?博士?主要研究方向为回归建模.

引用格式:王玲?赵为华.Beta回归模型基于EM算法的变量选择方法[J].安徽师范大学学报(自然科学版)?2019?42(1):16-21.

本文来源:https://www.bwwdw.com/article/mfyj.html

Top