TD2D数据集:50人多模态分心检测,Random Forest达96%准确率
前言
TD2D(Takeover during Distracted L2 Automated Driving)是2025年发布的首个针对L2级自动驾驶的分心检测多模态数据集。本文解读数据集特点和研究发现,为IMS数据采集和算法开发提供参考。
一、数据集概述
1.1 基本信息
| 指标 | 数值 |
|---|---|
| 名称 | TD2D |
| 参与者 | 50人 |
| 任务条件 | 10种 |
| 传感器 | ECG + PPG + EDA + 眼动追踪 |
| 场景 | L2级自动驾驶 |
| 开源 | Zenodo (DOI: 10.5281/zenodo.14185964) |
1.2 研究来源
论文:Driver Distraction Detection in Conditionally Automated Driving Using Multimodal Physiological and Ocular Signals
期刊:Electronics (MDPI), September 2025
机构:Xihang University, Hubei University of Arts and Science
二、任务设计
2.1 十种任务条件
TD2D设计了十种任务条件,覆盖不同模态的分心:
| 类型 | 任务 | 描述 |
|---|---|---|
| 基线 | 无次任务 | 正常驾驶 |
| 视觉任务 | 电子书阅读 | 视觉分心 |
| 视觉短信 | 视觉分心 | |
| 屏幕互动游戏 | 视觉分心 | |
| 认知任务 | 0-back | 认知分心(低) |
| 1-back | 认知分心(中) | |
| 2-back | 认知分心(高) | |
| 听觉任务 | 有声书聆听 | 听觉分心 |
| 语音短信 | 听觉分心 | |
| 语音游戏 | 听觉分心 |
2.2 NASA-TLX工作量重分类
研究使用NASA-TLX主观评分重新分类任务:
| 类别 | 任务 |
|---|---|
| 低工作量 | 基线、有声书 |
| 中工作量 | 语音短信、语音游戏、0-back |
| 高工作量 | 电子书、视觉短信、屏幕游戏、1-back、2-back |
三、传感器与信号
3.1 多模态传感器
| 传感器 | 信号 | 特征 |
|---|---|---|
| ECG | 心电图 | HRV、心率 |
| PPG | 光电容积描记 | 心率、血氧 |
| EDA | 电皮肤活动 | 皮肤电导 |
| 眼动追踪 | 注视数据 | 注视点、扫视、眨眼 |
3.2 特征提取
总计25个特征:
| 模态 | 特征类别 | 特征数 |
|---|---|---|
| 心血管 | 时域、频域 | ~10 |
| EDA | 时域、频域 | ~5 |
| 眼动 | 注视、扫视、眨眼 | ~10 |
3.3 时间窗口优化
研究发现最优时间窗口配置:
| 参数 | 最优值 | 说明 |
|---|---|---|
| 窗口长度 | 5-8秒 | 平衡准确率与延迟 |
| 重叠率 | 部分重叠 | 时序重叠比窗口长度影响更大 |
四、分类结果
4.1 模型对比
| 模型 | 被试内准确率 | 跨被试准确率 |
|---|---|---|
| Random Forest | 96% | 69% |
| SVM | 较低 | 较低 |
| MLP | 较低 | 较低 |
4.2 SHAP 特征重要性
| 排名 | 特征类别 | 重要性 |
|---|---|---|
| 1 | 眼动特征 | ⭐⭐⭐⭐⭐ |
| 2 | EDA特征 | ⭐⭐⭐ |
| 3 | 心血管特征 | ⭐⭐ |
4.3 模态贡献分析
1 | |
关键发现:
- 眼动特征是主要判别因子
- EDA提供补充鲁棒性
- 心血管特征辅助信息
五、跨被试泛化挑战
5.1 问题分析
| 指标 | 被试内 | 跨被试 | 差距 |
|---|---|---|---|
| 准确率 | 96% | 69% | 27% |
5.2 原因分析
- 个体差异:生理信号基线差异大
- 信号质量:不同被试传感器佩戴质量不同
- 行为模式:分心行为表现形式不同
5.3 解决方案
| 方案 | 说明 |
|---|---|
| 域适应 | 学习域不变特征 |
| 迁移学习 | 预训练+微调 |
| 数据增强 | 合成数据补充 |
| 被试特定校准 | 初始校准阶段 |
六、IMS 应用建议
6.1 数据采集参考
TD2D为IMS数据采集提供了良好范本:
| 要素 | TD2D方案 | IMS建议 |
|---|---|---|
| 参与者 | 50人 | ≥100人覆盖多样性 |
| 任务设计 | 10种任务 | 参考TD2D任务类型 |
| 传感器 | 4种模态 | 优先眼动+EDA |
| 时间窗口 | 5-8秒 | 采用此配置 |
6.2 算法开发建议
特征工程
- 优先提取眼动特征
- EDA作为补充特征
- 心血管特征可选
模型选择
- Random Forest 作为基线
- 深度学习探索(CNN-LSTM)
- 考虑跨被试泛化
时间窗口
- 默认使用5-8秒窗口
- 部分重叠提升检测率
6.3 跨被试泛化策略
1 | |
七、数据集获取
7.1 下载地址
Zenodo: https://zenodo.org/records/14185964
7.2 许可证
- 开源许可
- 学术研究免费使用
- 商用需联系作者
7.3 数据格式
| 文件 | 格式 |
|---|---|
| 生理信号 | CSV |
| 眼动数据 | CSV |
| 标签 | CSV |
| 元数据 | JSON |
八、相关数据集对比
| 数据集 | 参与者 | 传感器 | 场景 | 特点 |
|---|---|---|---|---|
| TD2D | 50 | 4种 | L2自动驾驶 | 多模态、任务丰富 |
| STEW | 48 | EEG | 静态任务 | EEG认知负荷 |
| NTHU-DDD | 36 | 摄像头 | 手动驾驶 | 疲劳检测 |
| Drive&Act | 多人 | 多视角 | 自动驾驶 | 细粒度行为 |
总结
TD2D数据集的核心贡献:
| 贡献 | 说明 |
|---|---|
| 首个L2分心检测数据集 | 自动驾驶场景 |
| 多模态信号 | ECG+PPG+EDA+眼动 |
| 任务丰富 | 10种分心类型 |
| 基准结果 | Random Forest 96% |
IMS 启示:
- 眼动特征是分心检测的核心
- 多模态融合提升鲁棒性
- 跨被试泛化是主要挑战
- 5-8秒时间窗口最优
研究日期: 2026-03-13
数据集:TD2D (Zenodo DOI: 10.5281/zenodo.14185964)
关键词: TD2D, 多模态, 分心检测, 数据集, Random Forest
TD2D数据集:50人多模态分心检测,Random Forest达96%准确率
https://dapalm.com/2026/03/13/2026-03-13-TD2D数据集-50人多模态分心检测基准/