YOLO把每张图片分成7*7个网格,每个网格内产生2个边界框,每个边界框需要预测5个值。同时每个网格还要判断网格内目标类别,这里目标类别共有20类,故最终的维度是( )。
举一反三
- 对于YOLO v1算法,网络的输出维度是多少(假设每张图划分为7*7网格,每个网格预测2个边框,识别的物体类别有30个)? A: 7*7*40 B: 7*7*30 C: 7*7*32 D: 7*7*42
- YOLO模型对输入图像划分成若干个网格,对每个网格中的物体进行分类即可。
- YOLO将图像分成8×8网格,每个网格有5个候选框,预测类别是10个,输出张量的值是( )。 A: 8×8×5×10 B: 8×8×5×2×10 C: 8×8×(5×5+10) D: 8×8×5×(5+10)
- 城市区域环境噪声监测布点:将要普查测量的城市分成等距离网格,测量点设在每个网格中心,网格数不应少于()个。 A: 20 B: 100 C: 250 D: 500
- 将容器划分为m行n列个网格,每个网格放置一个组件,应使用下列哪种布局类?