论文部分内容阅读
随着我国社会的快速发展和进步,人们的工作和生活节奏越来越快。毋庸置疑,高强度的工作和不规律的生活会使人体免疫系统功能下降,从而导致很多健康问题。因此,如何解决现代人类的健康问题已经成为重要的研究课题。 提高健康素养的方式主要分为医疗干预、运动干预、饮食干预等。医疗干预见效快,对于急性疾病是最佳的治疗手段,但同时具有副作用大、刺激性强等缺点;运动干预虽然副作用小,但适用范围小,对于大部分疾病无法起到医治的作用;饮食干预则介于二者之间,因为很多药性其实是从食物中发现的,所以饮食干预便利用食物的药效,温和修补体质。尤其针对慢性疾病的治疗,可以通过长期的调节,使体内的营养元素达到均衡状态,缓解慢性疾病的症状直至痊愈,从而提高人们的健康素养。但目前接受饮食干预的方式繁琐且单一,没有利用计算机技术辅助人类自主方便地了解自身饮食状况并进行饮食干预的方法。因此,基于上述背景,本文通过数据预处理、特征工程、机器学习和深度学习算法,提出一种合理有效的多维度智能饮食干预方法,旨在辅助人们完成饮食结构分析和饮食干预。本文的研究内容包括以下几个方面: 第一,饮食推荐算法的研究。本文以各类人群的膳食营养指南为依据,通过多种数据预处理、特征构造方法、聚类模型和菜品相似度计算方法,提出了一种基于用户画像、饮食记录和即时情境三维度特征的智能饮食推荐算法。经过实验验证表明,通过对菜品数据进行对数函数平滑和Z-Score标准化处理可以有效解决其在特征空间存在较多离群点并且特征量纲不一致的问题,进一步利用max-min标准化、1-范数正则化预处理方法和GBDT自动特征构造方法可以有效地捕获菜品的营养结构特征和口味特征。在基于用户画像的推荐算法中,通过推荐菜品在全集菜品中的分布情况证明了该推荐方式的有效性。在基于饮食记录的推荐算法中,K-means模型在内部评价指标DBI和DI上分别达到0.026和0.00075,并通过本文提出的类VDM类别型特征相似度计算方法,在食物口味挖掘中准确率达到67.4%,从而完成该推荐方式的营养结构分析和口味偏好挖掘的工作。在基于即时情境的推荐算法中,本文通过即时的外部特征对前两种推荐列表进行重排序,从而产生最符合用户当前状态的推荐列表。 第二,饮食搜索算法的研究。本文提出了一种基于Siamese Network的文本匹配模型和传统机器学习模型相结合的智能饮食搜索算法,以挖掘用户的潜在饮食意图,从而可以满足用户自然语言问答式的搜索意图。本文通过对大量搜索文本的分析,调研并实验了多种深度文本分类和文本匹配模型后,提出了一种结合基于改进的ARCI文本匹配模型和基于KD树的K近邻分类模型的饮食搜索算法,其中关键词判定模型的准确率达到98.6%,潜意图挖掘模型的Top5准确率达到81.36%,并且经过线下测试,针对单条搜索文本,关键词判定模型的时间开销在1.2ms左右,潜意图挖掘模型的时间开销在12.3ms左右。 第三,实验平台的搭建和有效性验证。本文搭建了一个集成饮食推荐算法和饮食搜索算法的实验平台,将本课题提出的算法在该平台进行线上部署以便进行研究成果的展示、算法的有效性验证,并通过该平台进行用户交互数据的采集为本课题的研究提供大数据支持,完成算法的迭代优化。通过各个模块的功能和时间开销测试,证明本实验平台在准确率和时间效率方面均达到了实际工程应用的水平。