Article

实时视频流 AI 分析工程化实践

2024/11/16 · 更新于 2025/3/3

这篇文章整理的是视频流 AI 分析相关的工程实践。相比离线图片推理，实时视频系统多了很多约束：输入源不稳定、编解码开销大、延迟敏感、GPU 资源需要持续监控，结果还要重新编码或推流给下游。

我早期写过几篇独立笔记，分别记录 DeepStream 管线、中文绘制、GPU 状态推送和视频计算工具。现在回看，它们更适合合在一起讲：怎么把视觉算法放进实时视频流系统里。

视频流管线不是简单的循环读帧

最直观的视频分析写法是 OpenCV 读帧、模型推理、绘制结果、再写出视频。但在多路视频、高分辨率或长时间运行场景下，这种方式很容易遇到性能瓶颈。

DeepStream 的优势在于把解码、预处理、推理、后处理、编码和推流组织成管线，并尽量利用 GPU 加速。它适合处理 RTSP 输入、批量多路流、实时推理和 RTMP 输出这类场景。

视频流系统需要关注的不是某一帧是否能跑通，而是持续运行时的整体状态：

检测框、类别名、告警信息和统计值都需要叠加到视频画面上。对离线图片来说，绘制开销通常不是重点；但在视频流里，每一帧都要重复执行，中文字体绘制、文本尺寸计算和透明背景叠加都会消耗时间。

我更倾向于把实时绘制看成一个独立模块：类别标签、颜色、字号和布局提前配置，常用中文标签做缓存，主流程只负责把检测结果转成绘制指令。这样可以减少主推理流程里的杂质，也方便后续替换输出样式。

视频 AI 服务常常需要长期运行。相比一次性推理脚本，服务侧更需要监控 GPU 状态、进程状态和异常告警。

我曾经整理过一个 GPU 使用情况推送工具，用于定时获取 GPU 利用率、显存占用和任务状态，并把异常情况推送到钉钉。这类工具本身不复杂，但对无人值守服务很实用：当显存持续升高、GPU 长时间空闲或进程异常退出时，维护人员可以更早发现问题。

这类经验后来也影响了我写服务的方式：算法服务不光要有”推理接口”，还得有日志、状态检查、资源监控和异常恢复机制。

视频分析不一定只做逐帧检测。有些任务需要利用帧间变化，比如运动趋势、目标速度、背景变化或异常扰动。NVIDIA DALI 这类工具可以用于视频解码和光流计算，在需要高吞吐预处理时有一定价值。

不过我对这类工具的态度比较保守：只有当任务确实需要视频级特征，并且性能瓶颈明确落在预处理阶段时，才值得引入更复杂的加速框架。否则系统复杂度可能超过收益。

实时视频 AI 系统的关键不是把单张图模型套到视频上，而是围绕视频流的稳定性、延迟、资源占用和结果输出重新设计工程链路。

这些实践对应的代码和工具有些比较小，但覆盖了视频 AI 项目里几个常见环节：流媒体接入、GPU 加速、结果绘制、状态监控和异常处理。对我来说，这部分经验比单个模型结构更接近真实的工程落地。