我有一个项目,我们正在使用gstreamer, x264等,通过本地网络多播视频流到多个接收器(连接到监视器的专用计算机)。我们在视频源(摄像机)系统和显示器上都使用gstreamer。
我们使用RTP,负载96和libx264来编码视频流(没有音频)。
但现在我需要量化(尽可能接近)帧采集和显示之间的延迟。
谁有使用现有软件的建议?
理想情况下,我希望能够运行测试软件几个小时,以产生足够的统计数据来量化系统。这意味着我无法进行一次性测试,例如将源摄像机指向显示高分辨率的接收显示器并手动计算差异…
我确实意识到使用纯软件解决方案,我将无法量化视频采集延迟(即CCD到帧缓冲区)。
我可以安排源和显示系统上的系统时钟同步到高精度(使用PTP),因此我将能够信任系统时钟(否则我将使用一些软件来跟踪系统时钟之间的差异并从测试结果中删除此差异)。
如果有帮助,项目应用程序是用c++编写的,所以我可以使用C事件回调,如果它们可用,考虑在自定义标头中嵌入系统时间(例如帧xyz,编码时间TTT -并在接收器上使用相同的信息来计算差异)。
我有一个解决方案:我写了一个gstreamer过滤器插件(基于插件模板),在H.264编码器和网络传输之前,当帧被捕获(并在视频缓冲区上做标记)时,节省了系统时间。
在接收端,我找到标记(它为我提供了一个1/20的索引),并再次记录系统时间。
我希望这将是一个相对简单的练习,然后关联索引和比较系统时间。只要两个系统的时钟保持同步(或者有已知的差异),我就应该能够计算出差异(即延迟)。
filter->source
在发送方和接收方上的设置不同,以确定滤波器的定时行为。
/* chain function
* this function does the actual processing
*/
static GstFlowReturn
gst_my_filter_chain (GstPad * pad, GstBuffer * buf)
{
GstMyFilter *filter;
struct timeval nowTimeval;
guint8* data;
int i,j,offset;
filter = GST_MYFILTER (GST_OBJECT_PARENT (pad));
if (filter->startTime == 0){
filter->startTime = GST_BUFFER_TIMESTAMP(buf);
gettimeofday(&filter->startTimeval, NULL);
filter->startTimeUL = (filter->startTimeval.tv_sec*1e6 + filter->startTimeval.tv_usec)/1e3; // in milliseconds?
filter->index = 0;
GstCaps* caps;
gint width, height;
const GstStructure *str;
caps = GST_BUFFER_CAPS(buf);
str = gst_caps_get_structure (caps, 0);
if (!gst_structure_get_int (str, "width", &width) ||
!gst_structure_get_int (str, "height", &height)) {
g_print ("No width/height availablen");
} else {
g_print ("The video size of this set of capabilities is %dx%dn",
width, height);
filter->width=width;
filter->height=height;
}
}
gettimeofday(&nowTimeval, NULL);
unsigned long timeNow = (nowTimeval.tv_sec*1e6 + nowTimeval.tv_usec)/1e3; // in milliseconds?
if (filter->silent == FALSE){
fprintf(filter->ofp, "%20lu,",
timeNow);
}
data = GST_BUFFER_DATA(buf);
if (filter->source){
offset = filter->index % 20;
for (i = 0; i < 10; i++){
for (j = 0; j < 10; j++){
data[(i+20)*filter->width+(j+offset*10)*1]=23;
}
}
fprintf(filter->ofp, " %u", offset);
} else {
unsigned long avg;
unsigned int min=(unsigned int)(-1UL);
unsigned int minpos=0;
int k=0;
for (k=0; k < 20; k++){
avg=0;
i=5; // in the middle of the box row
for (j = 0; j < 10; j++){
avg += data[(i+20)*filter->width+(j+k*10)*1];
}
if (avg < min){
min = avg;
minpos=k;
}
}
fprintf(filter->ofp, " %u", minpos);
}
fprintf(filter->ofp, "n");
filter->index++;
/* just push out the incoming buffer without touching it */
return gst_pad_push (filter->srcpad, buf);
}
用法如下:发送方/服务器:
GST_DEBUG="*:2" gst-launch-0.10 -v --gst-plugin-path=../../src/.libs videotestsrc num-buffers=100 ! myfilter src=1 ! x264enc tune=zerolatency,speed-preset=fast ! rtph264pay ! udpsink port=3000 host=127.0.0.1
接收端/客户端:
GST_DEBUG="*:2" gst-launch-0.10 -v --gst-plugin-path=../../src/.libs udpsrc port=3000 ! "application/x-rtp, media=(string)video, encoding-name=(string)H264, payload=(int)96" ! gstrtpjitterbuffer do-lost=true ! rtph264depay ! ffdec_h264 ! myfilter src=0 ! ffmpegcolorspace ! ximagesink
显然,在测试实现中我不会使用localhost (127.0.0.1)!!
我使用--gst-plugin-path
,因为我没有安装我的定时滤波器。
该项目需要尽可能小的延迟-理想情况下为100ms或更少。现在有了一些数字,我可以开始微调所需的参数,以最小化延迟。
我以前编写过一个简单的应用程序,该应用程序呈现顺序数字(例如mod 60)并将它们显示在屏幕上。然后,您可以将摄像机对准显示器,并让其中一台客户端机器将该流渲染到另一台显示器。用你的手机拍一张照片,看看这两个数字来计算你的延迟。
延迟时钟项目引起了我的注意,我认为它提供了一个更好的解决方案!
它将当前时间的二进制表示嵌入到图像缓冲区中,并在解码时提取该二进制图像。
显然,系统时钟必须同步!