TUM数据集

大家好，我是讯享网，很高兴认识大家。

TUM数据集下载链接
https://vision.in.tum.de/data/datasets/rgbd-dataset/download
https://vision.in.tum.de/data/datasets/visual-inertial-dataset

在这里插入图片描述
讯享网标定数据总共提供四种：
　　1.calib-cam1~8：相机标定，本质矩阵以及两个相机之间的姿态变换
　　2.calib-imu1~4：IMU标定，找到相机和IMU之间的最优姿态变换
　　3.calib-vignette2~3：光晕标定？？
　　4.calib-imu-static2:IMU标定，只包含IMU数据，用于估计IMU噪声和随机游走。格式timestamp, gyro_x, gyro_y, gyro_z, accel_x, accel_y, accel_z, temperature

数据集序列总共5种：
　　1.corridor1~5(走廊)：在走廊和几个办公室拍摄，只在开始和结束有真实值。
　　2.magistrale1~6（大厅）：在校园内的一个大厅拍摄，只在开始和结束有真实值。
　　3.outdoors1~8(户外)：在校园内的室外场景拍摄，只在开始和结束有真实值。
　　4.room1~6(室内)：对应有5个图像序列，整个过程都带有运动捕捉系统提高的真实值。
　　5.slides1~3(滑梯)：在大厅中拍摄，包含一段光照极差的路程，只在开始和结束有真实值。

由于 TUM数据集是从实际环境中采集的,需要解释一下它的数据格式(数据集一般都有自己定义的格式)。在解压后,你将看到以下这些文件:

rgb.txt 和 depth.txt 记录了各文件的采集时间和对应的文件名。
rgb/ 和 depth/目录存放着采集到的 png 格式图像文件。彩色图像为八位三通道,深
度图为 16 位单通道图像。文件名即采集时间。
groundtruth.txt 为外部运动捕捉系统采集到的相机位姿,格式为
(time, t x , t y , t z , q x , q y , q z , q w ),
我们可以把它看成标准轨迹。

rgb和depth文件夹下存放着彩色图和深度图。在这里插入图片描述图像的文件名是以采集时间命名的。而rgb.txt和depth.txt则存储了所有图像的采集时间和文件名称，例如：
. rgb/..png
表示在机器时间.采集了一张RGB图像，存放于rgb/..png中。

这种存储方式的一个特点是，没有直接的rgb-depth一一对应关系。由于采集时间的差异，几乎没有两张图像是同一个时刻采集的。然而，我们在处理图像时，需要把一个RGB和一个depth当成一对来处理。所以，我们需要一步预处理，找到rgb和depth图像的一一对应关系。

请注意彩色图、深度图和标准轨迹的采集都是独立的,轨迹的采集频率比图像高很多。在使用数据之前,需要根据采集时间,对数据进行一次时间上的对齐,以便对彩色图和深度图进行配对。原则上,我们可以把采集时间相近于一个阈值的数据,看成是一对图像。并把相近时间的位姿,看作是该图像的真实采集位置。

python associate.py rgb.txt depth.txt

讯享网

程序默认时间差在0.02内的就可以当成一对图像。为了保存这个结果，我们可以把它输出到一个文件中去，这样，只要有了这个associate.txt文件，我们就可以找到一对对的RGB和彩色图啦！如：

讯享网python associate.py rgb.txt depth.txt > associate.txt

这段脚本会根据输入两个文件中的采集时间进行配对,最后输出到一个文件 associate.txt。输出文件含有被配对的两个图像的时间、文件名信息,可以作为后续处理的来源。

请注意彩色图、深度图和标准轨迹的采集都是独立的,轨迹的采集频率比图像高很多。在使用数据之前,需要根据采集时间,对数据进行一次时间上的对齐,以便对彩色图和深度图进行配对。
在这里插入图片描述 关于ground truth

ground truth是TUM数据集提供的标准轨迹，它是由一个外部的（很高级的）运动捕捉装置测量的，基本上你可以把它当成一个标准答案喽！ground truth的记录格式也和前面类似，像这样：

.2496 -0.0730 -0.4169 1.5916 0.8772 -0.1170 0.0666 -0.4608

#!/usr/bin/env python # coding=utf-8 import numpy as np import matplotlib.pyplot as plt import mpl_toolkits.mplot3d f = open("./groundtruth.txt") x = [] y = [] z = [] for line in f: if line[0] == '#': continue data = line.split() x.append( float(data[1] ) ) y.append( float(data[2] ) ) z.append( float(data[3] ) ) ax = plt.subplot( 111, projection='3d') ax.plot(x,y,z) plt.show() 复制代码

复制代码

把这部分代码复制存储成draw_groundtruth.py存放到数据目录中，再运行：

讯享网python draw_groundtruth.py

就能看到轨迹的形状啦：
　　在这里插入图片描述

第二件事，因为外部那个运动捕捉装置的记录频率比较高，得到的轨迹点也比图像密集很多，如何查找每个图像的真实位置呢？

可以用同样的方式来匹配associate.txt和groundtruth.txt中的时间信息：

python associate.py associate.txt groundtruth.txt > associate_with_groundtruth.txt

这时，我们的新文件 associate_with_groundtruth.txt 中就含有每个帧的位姿信息了：

. rgb/..png . depth/..png . -0.8683 0.6026 1.5627 0.8219 -0.3912 0.1615 -0.3811

更多详情可参考https://www.cnblogs.com/gaoxiang12/p/5175118.html

相关推荐