gtsummary 项目教程
1. 项目介绍
gtsummary
是一个用于创建出版级数据摘要和分析结果表的 R 包。它提供了优雅且灵活的方式来生成分析和摘要表,适用于各种数据集和回归模型。gtsummary
能够自动检测连续、分类和二分变量,并计算适当的描述性统计量,同时支持自定义格式和样式。
2. 项目快速启动
安装
首先,确保你已经安装了 R 环境。然后,使用以下代码安装 gtsummary
包:
install.packages("gtsummary")
如果你想安装开发版本,可以使用以下代码:
install.packages("pak")
pak::pkg_install("ddsjoberg/gtsummary", dependencies = TRUE)
基本使用
以下是一个简单的示例,展示如何使用 gtsummary
生成一个数据摘要表:
library(gtsummary)
# 加载示例数据集
data(trial)
# 生成摘要表
table1 <- trial |> tbl_summary(include = c(age, grade, response))
# 显示表格
table1
3. 应用案例和最佳实践
案例1:生成描述性统计表
假设你有一个包含患者年龄、性别和治疗反应的数据集,你可以使用 tbl_summary
函数生成一个描述性统计表:
table2 <- tbl_summary(
trial,
include = c(age, grade, response),
by = trt, # 按治疗组分组
missing = "no" # 不单独列出缺失数据
) |>
add_n() |> # 添加总观察数列
add_p() |> # 添加组间差异检验
modify_header(label = "**Variable**") |> # 更新列标题
bold_labels() # 加粗标签
table2
案例2:生成回归模型结果表
假设你有一个逻辑回归模型,你可以使用 tbl_regression
函数生成一个回归结果表:
mod1 <- glm(response ~ trt + age + grade, trial, family = binomial)
t1 <- tbl_regression(mod1, exponentiate = TRUE)
t1
4. 典型生态项目
gtsummary
通常与其他 R 包一起使用,以增强其功能和灵活性。以下是一些常见的生态项目:
- gt:
gtsummary
依赖于gt
包来生成 HTML 表格。gt
提供了丰富的表格样式和格式化选项。 - broom:
gtsummary
使用broom
包来整理回归模型的输出,使其更易于处理和展示。 - labelled: 用于处理数据标签和变量标签,使数据更易于理解和解释。
通过结合这些生态项目,gtsummary
能够生成更加复杂和美观的表格,满足各种数据分析和报告需求。