论文部分内容阅读
随着郭守敬望远镜(The Large Sky Area Multi-Object Fibre Spectroscopic Tele-scope,LAMOST)、美国SLAON和欧空局Gaia等大型巡天计划的实施,天体光谱的获取速度不断提高,我们获取了大量恒星光谱数据。例如,我国的LAMOST能同时观测高达4000个天体目标,每个观测夜晚能获取多达2-4万个天体的光谱,截至2015年12月共发布5,268,687条恒星光谱,且最近三年均以每年140余万条的速度发布数据。数据规模的大幅增长使得光谱自动计算、信息提取成为相关巡天计划科学目标实现程度的瓶颈之一。本文主要针对基于光谱的恒星大气物理参数估计问题,研究光谱特征的选择及其应用。主要做了以下三项工作: 首先,我们基于Least Absolute Shrinkage and Selection Operator(LASSO)算法研究了光谱特征的选择问题,给出了一种新的特征描述方法,并基于相关向量机(Relevance Vector Machine,RVM)研究了该特征在恒星大气物理参数有效温度、表面重力和化学丰度[Fe/H]估计中的应用。该方案的特色是,特征波长的定位和参数估计模型中对训练样本的稀疏化。特征波长的定位有助于对模型结果背后的物理本质进行探索,估计模型对训练样本的稀疏化则会提升计算速度。 然后,基于Fused LASSO算法研究了恒星光谱的特征选择问题。该模型不仅能够利用光谱流量与待估计参数的相关性,还能使用流量的时序关系信息。其结果,则会得到具有尺度自适应估计的光谱特征。 最后,我们基于多层贝叶斯先验分布原理和自动相关判定(AutomaticRelevance Determination)准则,提出了一种稀疏贝叶斯特征选择方法,并研究了它在恒星光谱特征选择与大气物理参数估计中的应用。与LASSO算法相比,该方案获得的特征更为疏散,特征对大气物理参量的敏感度更高的同时,也对噪声干扰更为稳健。