我使用暗网在我的自定义数据集上检测YOLOv4对象。对于视频上的这种检测,我使用:
./darknet detector demo data/obj.data yolo-obj.cfg yolo-obj_best.weights -ext_output video.mp4 -out-filename video_results.mp4
这为我的视频提供了每次检测打印的边界框。但是,我想创建一个.txt(或.csv(文件,为每个帧数创建预测。
我确实找到了这个答案,但这是一个json文件中的输出,我需要一个.txt或.csv文件。我对C不太熟悉,所以我发现很难将这个答案修改成我需要的格式。
关于如何使用命令行,特别是将结果保存为.txt格式,已经有了解释,链接:
https://github.com/AlexeyAB/darknet#how-在命令行上使用
为了节省时间,我将提供可能有用的一点:
- 要处理图像数据/train.txt列表并将检测结果保存到result.txt,请使用:
- darknet.exe检测器测试cfg/coo.data cfg/yolov4.cfg yolov4.weights-dont_show-ext_output<data/train.txt>result.txt
可能会迟到,但可能对其他人有帮助。
我遵循Rafael的建议,编写了一些代码来从JSON转换为cvs。我会把它放在这里,以防有人想使用它。这是针对分析视频的情况,所以每个";图像";是视频中的一帧。
import json
import csv
# with and height of the video
WIDTH = 1920
HEIGHT = 1080
with open('~/detection_results.json', encoding='latin-1') as json_file:
data = json.load(json_file)
# open csv file
csv_file_to_make = open('~/detection_results.csv', 'w', newline='n')
csv_file = csv.writer(csv_file_to_make)
# write the header
# NB x and y values are relative
csv_file.writerow(['Frame ID',
'class',
'x_center',
'y_center',
'bb_width',
'bb_heigth',
'confidence'])
for frame in data:
frame_id = frame['frame_id']
instrument = ""
center_x = ""
center_y = ""
bb_width = ""
bb_height = ""
confidence = ""
if frame['objects'] == []:
csv_file.writerow([frame_id,
class,
center_x,
center_y,
bb_width,
bb_height,
confidence
])
else:
for single_detection in frame['objects']:
instrument = single_detection['name']
center_x = WIDTH*single_detection['relative_coordinates']['center_x']
center_y = HEIGHT*single_detection['relative_coordinates']['center_y']
bb_width = WIDTH*single_detection['relative_coordinates']['width']
bb_height = HEIGHT*single_detection['relative_coordinates']['height']
confidence = single_detection['confidence']
csv_file.writerow([frame_id,
class,
center_x,
center_y,
bb_width,
bb_height,
confidence
])
csv_file_to_make.close()
希望这能有所帮助!如果你看到一个优化此代码的解决方案,当然也很受欢迎:(