解释:什么是多层建模[+3学习资源]

这份全面的指南包含了作为初学者需要了解的关于多层建模的一切,这是一种用于处理集群或分组数据的技术。

多层建模,也被称为层次线性建模、混合模型和随机效应建模,在医学研究、经济学、社会学、市场营销、教育心理学和其他领域中得到了广泛应用。

多层建模在市场营销领域也被用于高级调查分析、市场反应建模和客户关系管理。

多层建模

多层建模是一种处理集群或分组数据的技术。该过程也可用于分析具有重复测量数据的情况。多层一词表示层次或嵌套数据,多层分析意味着研究在多层数据结构的不同层次上测量的变量之间的关系。

图片来源:Bookdown

让我们考虑一个情景。假设一名护士被指派每周记录一群患者的血压。他们可以将连续的测量视为每个受试者内部的一组。

总的来说,多层建模可以处理具有不同测量周期的来自不同受试者的数据。在machine learning中,多层模型可以应用于包含在多个层次上变化的参数的情景中。

让我们深入了解多层建模的概念。

多层建模的优势

多层建模的方法可以对群组之间的变异进行建模,具有多个优势。

更好的推断

常规的回归模型并未考虑到更广泛的人群,导致了系数的低估和系数显著性的夸大。相比之下,多层建模使您能够更好地推断出从样本中提取的分组数据的增长曲线。

需要更少的参数

常规回归模型需要多个虚拟变量来表示复杂的数据组。相比之下,多层建模对于相同的数据组需要较少的参数。

群组效应

多层模型允许在群组之间共享信息,假设随机效应来自于一个共同的分布。与常规回归不同,这极大提高了对数据较少的群组的预测准确性。

多层建模的类型

接下来,让我们讨论不同类型的多层模型。

#1. 随机截距模型

在随机截距模型中,截距项可以在群组之间变化。需要添加一个随机变量来表示截距项,帮助预测每个观测值在因变量上的得分。

该模型假设斜率在不同环境下保持不变,并提供了有关族内相关性的信息,这在确定是否实际需要实施多层模型方面起着关键作用。

#2. 随机斜率模型

在随机斜率模型中,斜率与相关矩阵相对应,因此斜率在分组变量(如时间或个体)之间会有所不同。

在这种情况下,截距在不同环境下保持不变。随机斜率模型或系数模型有助于理解群组之间的变异性,而仅通过随机截距模型无法确定。

#3. 随机截距和斜率模型

在这种模型中,正如其名称所示,截距和斜率都可以在群组之间变化。这意味着它们的值在不同环境下会发生变化。随机截距和斜率模型被认为是最真实的模型类型。

多层次建模是如何工作的?

多层次模型是一种考虑多个层次变异的统计模型。这些模型也被称为分层线性模型、线性混合效应模型、混合模型、嵌套data models、随机系数模型、随机效应模型、随机参数模型或分块设计。

从人类研究和生物科学中收集到的不同类型的数据描绘了一种分层或聚类结构。

例如,具有相同生物父母的孩子在体格和心理特征方面比从更广泛的人群中随机选择的个体更相似。

类似地,员工或学生可以根据位置等个体因素进行分离。个体行为的逐步关联也导致多层次数据结构。

多层次模型考虑层次结构中每个层次的残差元素,从而形成一种分层数据结构。

分层模型还帮助学校管理当局整理学生的成果,这通常包括学校和学生层次的残差。

对于未经熟悉的人来说,学校残差或与学校相关的效应是一组未观察到的学校特征,可能会影响学生的结果。这些效应可能触发学生结果之间的关系。因此,将残差的方差分为两部分是安全的:学校间的成分和学校内的成分。

何时应使用多层次建模?

以下是你应该选择使用多层次模型的一些原因:

进行正确的推论

在多元回归的标准方法中,分析单位被视为独立观测。

多元回归无法识别分层结构的不足导致对正态误差的低估,进而导致对高层级预测变量的统计显著性的高估。分组的省略严重影响了关于高层级预测变量的预测的准确性。

推论到群体

多层次模型将样本中的群体视为从一组中随机选择的样本,这在许多情况下是研究的重要领域。这不能通过固定效应模型来实现,固定效应模型无法对样本之外的群体进行推论。

评估群体效应

多层次建模是确定观察结果和未观察到的群体特征的分离效应的最佳方法。

对群体效应的实质性兴趣

在许多研究领域,一个关键问题是个体结果中分组的程度以及“离群”群体中是否存在这种程度。

例如,在学校绩效评估中,重点是确定学校相关效应对学生表现的“附加价值”。在调整之前的成就之后,这可以通过多层次模型来确定。

学习资源

以下是您可以参考的最佳学习材料,以了解多层次建模的概念。

#1. 通俗易懂的多层次建模

《通俗易懂的多层次建模》是Karen Robson和David Pavalin撰写的关于多层次建模的最佳书籍,它为学生和教师呈现了完整的多层次分析阶段。

预览 产品 评分 价格


Multilevel Modeling in Plain Language 尚无评分 $24.84

这本书的“平实方法”帮助读者把握主题背后的思想,而不是解释其他学习资料中的公式。同样,教育工作者将能够很快掌握多层次分析的高级路径。

#2. 多层次分析:多层次建模简介

由T. A. B. Snijders撰写,《多层次分析:基础和高级多层次建模简介》提供了适应高级研究人员和教师在同一领域进行研究所需的易于理解的多层次分析内容。

预览 产品 评分 价格


Multilevel Analysis: An Introduction To Basic And Advanced Multilevel Modeling 尚无评分 $60.00

此外,希望扩展多层次分析领域知识的读者会发现本书是一本理想的资源。

本书涵盖了围绕多层次建模和分析的不同方法、技术和问题,并为读者提供了对多层次研究的清晰、概念和实践性理解。

#3. 使用R进行多层次建模

W. Holmes Finch、Jocelyn E. Bolin和Ken Kelley著的《使用R进行多层次建模》是一本关于使用R软件环境进行多层次数据建模的有价值的指南。本书回顾并介绍了多层次模型的基础,并解释了如何使用R实施这些模型。

预览 产品 评级 价格


Multilevel Modeling Using R (Chapman & Hall/CRC Statistics in the Social and Behavioral Sciences) $46.19

它还演示了在使用纵向数据进行多层建模的过程。除此之外,您还将在单层和多层数据中找到分类依赖变量的模型。

总结

在这里,我们介绍了多层建模的基本概念,从其优势到技术的工作原理。如果您是学生或教育工作者,上述学习材料将帮助您理解多层建模的高级概念。

您还可以探索一些热门 machine learning models

类似文章