屏下DMS不能只看99图像保真度而要看任务级验证就绪度

屏下 DMS 不能只看“99% 图像保真度”,而要看任务级验证就绪度

发布时间: 2026-03-25
主题: 屏下 DMS / 验证方法 / vendor claim 审视 / task-level validation / IMS 工程化
关键词: image fidelity、validation readiness、under-display camera、gaze drift、uncertainty、task-level metrics


一句话结论

最近围绕屏下 DMS,最吸引眼球的一类说法是:

  • 图像保真度接近裸露摄像头
  • AI restoration 可修复显示层带来的退化
  • 甚至出现了类似 99% image fidelity 这样的宣传表述

这些说法未必是错的,但真正的问题是:

对 DMS 来说,图像“看起来像”原图,并不等于任务“做起来像”原链路。

也就是说:

  • 图像保真度高,不代表 gaze 几何就不漂
  • 去噪/去模糊成功,不代表 eyelid 时序就稳定
  • restoration 指标漂亮,不代表 distraction / drowsiness / phone use / impairment 的误报漏报就可接受

所以对于 IMS 团队来说,真正该盯的不是单个 vendor claim,
而是:

屏下 DMS 是否具备 task-level validation readiness。


1. 为什么“99% fidelity”这类说法天然不够

因为 DMS 不是图像增强产品,而是安全相关感知系统。

它最终要交付的不是一张图,而是:

  • 眼部关键点
  • gaze vector
  • 头姿
  • 眨眼/眼睑时序
  • fatigue / distraction / phone use / impairment 等决策信号

这意味着,哪怕图像级指标很好,也可能出现以下问题:

1.1 结构性小偏差被任务级放大

比如对普通图像来说看不出的轻微几何畸变,
可能会在 gaze estimation 里被放大成:

  • 角度偏差
  • AOI 归属错误
  • 手机使用与看路状态误判

1.2 时序平滑会伤害疲劳检测

restoration 很可能会引入:

  • temporal smoothing
  • frame-to-frame consistency bias
  • 局部纹理补偿

这些对图像主观观感可能有帮助,
但对 blink、PERCLOS、eyelid openness 这类时序敏感任务,未必是好事。

1.3 vendor metric 可能没覆盖真实使用场景

很多“图像保真度”数字,常见风险包括:

  • 只在有限光照下测
  • 只比较静态样本
  • 不覆盖不同 UI 亮度/显示内容
  • 不覆盖眼镜、墨镜、口罩、头部偏角
  • 不覆盖热漂移、老化、面板差异

所以它更像一个 marketing metric,不等于量产验证结论。


2. 屏下 DMS 该如何改成“任务级验证思维”

更合理的问题不是:

  • 图像 fidelity 有多高?

而是:

  • 在屏下退化 + restoration 之后,DMS 各任务的功能边界有没有发生系统性漂移?

2.1 对眼部任务,看关键点稳定性而不是只看图像质量

推荐关注:

  • eye landmark jitter
  • eyelid openness variance
  • pupil/iris center consistency
  • blink onset/offset timing error

因为眼部是 fatigue / drowsiness / gaze 的底座。

2.2 对 gaze 任务,看几何误差而不是只看“能不能看见眼睛”

推荐关注:

  • gaze angle drift
  • AOI classification confusion
  • on-road vs off-road boundary error
  • long-tail cases under sunglasses / off-axis pose

2.3 对决策任务,看最终风险输出的稳健性

比如:

  • distraction false alarm change
  • fatigue threshold sensitivity shift
  • phone use confusion rate
  • impairment suspicion score stability

真正的量产判断应落在这些指标上。


3. 一个更可执行的评估框架:四层验证法

第一层:图像层(Image-level)

可看:

  • SNR
  • blur/noise reduction
  • perceptual similarity
  • image fidelity

用途:

  • 只作为最底层 sanity check
  • 不能作为最终 Go/No-Go 依据

第二层:特征层(Feature-level)

重点看:

  • face detection recall
  • eye landmark stability
  • head pose error
  • gaze vector error
  • eyelid/iris tracking consistency

用途:

  • 判断 restoration 是否改变了关键中间表征

第三层:任务层(Task-level)

重点看:

  • fatigue detection performance
  • distraction / phone use accuracy
  • drowsiness warning latency
  • false positive / false negative changes

用途:

  • 判断功能是否还能满足 DMS 任务要求

第四层:系统层(System-level)

重点看:

  • display state change 对任务的影响
  • degraded mode 是否触发正确
  • input unreliable 是否能被识别
  • ECU 负载变化下稳定性
  • warning latency 与 HMI 联动是否受影响

用途:

  • 判断是否真的具备量产验证就绪度

4. 对 IMS 团队最重要的启示:把“可疑输入”显式化

屏下 DMS 最大的工程风险之一,是系统可能在“输入已经不可靠”的情况下,
还假装自己看得很清楚。

这比单纯精度下降更危险。

因此建议:

4.1 增加 input quality / uncertainty 输出

除了正常感知结果,系统还应输出:

  • input_quality_score
  • restoration_confidence
  • task_reliability_hint
  • degraded_mode_flag

4.2 明确任务级降级策略

例如:

  • gaze 不可靠时,退到 head-pose-only
  • eyelid 时序异常时,降低 fatigue 判定权重
  • AOI 漂移增大时,提高 off-road 判定阈值
  • 输入质量过低时,禁止给出高置信度 impairment 结论

4.3 对宣传指标保持工程上的“默认不信任”

不是说供应商一定夸大,
而是工程上必须默认:

没有任务级验证,就没有量产级结论。


5. 推荐新增的验证矩阵

如果 IMS 要真的评估屏下 DMS,可用下面这类矩阵:

维度 示例
显示状态 黑屏 / 常规 UI / 高亮 UI / 局部高对比
光照 白天 / 夜晚 / 逆光 / 隧道进出
驾驶员状态 正常 / 疲劳 / 分心 / 手机使用
遮挡 墨镜 / 普通眼镜 / 口罩 / 帽檐
姿态 正视 / 偏头 / 俯仰 / 大角度侧视
面板差异 不同批次 / 不同温度 / 老化前后
算法状态 restoration on/off / model v1/v2

最终看的不是单点最优,而是:

  • 哪些区域稳定
  • 哪些区域退化明显
  • 哪些任务必须降级
  • 哪些任务还能保持法规可接受性

6. 研发优先级建议

P0:建立 task-level benchmark,而不是只收图像 demo

P0:把 uncertainty / degraded mode 作为正式接口输出

P1:建立 gaze / eyelid / head pose 的 feature-wise regression dashboard

P1:对 vendor claim 做复现实验,不直接当设计输入

P2:把 screen-state-aware synthetic validation 纳入回归体系


7. 对 TrendRadar 的下一轮搜索建议

建议从“屏下 DMS 很酷”升级到更工程化的词:

  • under-display DMS task-level validation
  • gaze drift under degraded imaging
  • eyelid timing stability image restoration
  • uncertainty-aware driver monitoring
  • restoration-aware perception validation automotive

配图建议

  1. 屏下 DMS 图像层 vs 任务层验证框架图(自绘)
  2. 四层验证法流程图(自绘)
  3. 验证矩阵热力图示意(自绘)

参考资料


结语

屏下 DMS 接下来最容易踩的坑,就是把“图像变清楚了”误当成“任务已经可靠了”。

真正成熟的工程判断应该是:

先问任务有没有漂,再问图像有多像。

这一步如果不做,很多看起来漂亮的屏下 DMS 方案,最后都可能卡在量产验证阶段。


屏下DMS不能只看99图像保真度而要看任务级验证就绪度
https://dapalm.com/2026/03/25/2026-03-25-屏下DMS不能只看99图像保真度而要看任务级验证就绪度/
作者
Mars
发布于
2026年3月25日
许可协议