TD2D数据集：50人多模态分心检测，Random Forest达96%准确率

前言

TD2D（Takeover during Distracted L2 Automated Driving）是2025年发布的首个针对L2级自动驾驶的分心检测多模态数据集。本文解读数据集特点和研究发现，为IMS数据采集和算法开发提供参考。

一、数据集概述

1.1 基本信息

指标	数值
名称	TD2D
参与者	50人
任务条件	10种
传感器	ECG + PPG + EDA + 眼动追踪
场景	L2级自动驾驶
开源	Zenodo (DOI: 10.5281/zenodo.14185964)

1.2 研究来源

论文：Driver Distraction Detection in Conditionally Automated Driving Using Multimodal Physiological and Ocular Signals
期刊：Electronics (MDPI), September 2025
机构：Xihang University, Hubei University of Arts and Science

二、任务设计

2.1 十种任务条件

TD2D设计了十种任务条件，覆盖不同模态的分心：

类型	任务	描述
基线	无次任务	正常驾驶
视觉任务	电子书阅读	视觉分心
	视觉短信	视觉分心
	屏幕互动游戏	视觉分心
认知任务	0-back	认知分心（低）
	1-back	认知分心（中）
	2-back	认知分心（高）
听觉任务	有声书聆听	听觉分心
	语音短信	听觉分心
	语音游戏	听觉分心

2.2 NASA-TLX工作量重分类

研究使用NASA-TLX主观评分重新分类任务：

类别	任务
低工作量	基线、有声书
中工作量	语音短信、语音游戏、0-back
高工作量	电子书、视觉短信、屏幕游戏、1-back、2-back

三、传感器与信号

3.1 多模态传感器

传感器	信号	特征
ECG	心电图	HRV、心率
PPG	光电容积描记	心率、血氧
EDA	电皮肤活动	皮肤电导
眼动追踪	注视数据	注视点、扫视、眨眼

3.2 特征提取

总计25个特征：

模态	特征类别	特征数
心血管	时域、频域	~10
EDA	时域、频域	~5
眼动	注视、扫视、眨眼	~10

3.3 时间窗口优化

研究发现最优时间窗口配置：

参数	最优值	说明
窗口长度	5-8秒	平衡准确率与延迟
重叠率	部分重叠	时序重叠比窗口长度影响更大

四、分类结果

4.1 模型对比

模型	被试内准确率	跨被试准确率
Random Forest	96%	69%
SVM	较低	较低
MLP	较低	较低

4.2 SHAP 特征重要性

排名	特征类别	重要性
1	眼动特征	⭐⭐⭐⭐⭐
2	EDA特征	⭐⭐⭐
3	心血管特征	⭐⭐

4.3 模态贡献分析

1	`眼动特征 >>> EDA特征 > 心血管特征`

关键发现：

眼动特征是主要判别因子
EDA提供补充鲁棒性
心血管特征辅助信息

五、跨被试泛化挑战

5.1 问题分析

指标	被试内	跨被试	差距
准确率	96%	69%	27%

5.2 原因分析

个体差异：生理信号基线差异大
信号质量：不同被试传感器佩戴质量不同
行为模式：分心行为表现形式不同

5.3 解决方案

方案	说明
域适应	学习域不变特征
迁移学习	预训练+微调
数据增强	合成数据补充
被试特定校准	初始校准阶段

六、IMS 应用建议

6.1 数据采集参考

TD2D为IMS数据采集提供了良好范本：

要素	TD2D方案	IMS建议
参与者	50人	≥100人覆盖多样性
任务设计	10种任务	参考TD2D任务类型
传感器	4种模态	优先眼动+EDA
时间窗口	5-8秒	采用此配置

6.2 算法开发建议

特征工程
- 优先提取眼动特征
- EDA作为补充特征
- 心血管特征可选
模型选择
- Random Forest 作为基线
- 深度学习探索（CNN-LSTM）
- 考虑跨被试泛化
时间窗口
- 默认使用5-8秒窗口
- 部分重叠提升检测率

6.3 跨被试泛化策略

策略1：被试特定校准
      初始5分钟正常驾驶数据校准
      
策略2：在线自适应
      运行时持续更新模型
      
策略3：元学习
      学习快速适应新用户

七、数据集获取

7.1 下载地址

Zenodo: https://zenodo.org/records/14185964

7.2 许可证

开源许可
学术研究免费使用
商用需联系作者

7.3 数据格式

文件	格式
生理信号	CSV
眼动数据	CSV
标签	CSV
元数据	JSON

八、相关数据集对比

数据集	参与者	传感器	场景	特点
TD2D	50	4种	L2自动驾驶	多模态、任务丰富
STEW	48	EEG	静态任务	EEG认知负荷
NTHU-DDD	36	摄像头	手动驾驶	疲劳检测
Drive&Act	多人	多视角	自动驾驶	细粒度行为

总结

TD2D数据集的核心贡献：

贡献	说明
首个L2分心检测数据集	自动驾驶场景
多模态信号	ECG+PPG+EDA+眼动
任务丰富	10种分心类型
基准结果	Random Forest 96%

IMS 启示：

眼动特征是分心检测的核心
多模态融合提升鲁棒性
跨被试泛化是主要挑战
5-8秒时间窗口最优

研究日期： 2026-03-13
数据集：TD2D (Zenodo DOI: 10.5281/zenodo.14185964)
关键词： TD2D, 多模态, 分心检测, 数据集, Random Forest

数据集 > DMS

#分心检测 #TD2D #多模态 #数据集 #Random Forest

TD2D数据集：50人多模态分心检测，Random Forest达96%准确率

https://dapalm.com/2026/03/13/2026-03-13-TD2D数据集-50人多模态分心检测基准/

作者

Mars

发布于

2026年3月13日

许可协议

Euro NCAP 2026 CPD要求详解：直接检测+15秒警告上一篇