大疆笔试计算机视觉环境感知B卷

  1. clip模型特点:语言和视觉融合
  2. 卷积3×3(stride=1, dilation=1),池化步长2,2×2,卷积3×3(stride=3, dilation=1),等效步长
卷积层1:stride=1

这个卷积层不会改变特征图的步长,所以等效步长仍然是1。
池化层:2x2, stride=2

由于池化层的步长为2,因此特征图的等效步长被乘以2,即等效步长变为2。
卷积层2:3x3, stride=3, dilation=1

由于卷积层的步长为3,因此特征图的等效步长又被乘以3,即等效步长变为 2 * 3 = 6。

3. np a.shape=(3,3),b.shape=(3,1) 求a*b的shape: 会进行广播 3×3

4. kpconv、子流形稀疏卷积、PointNet和Pointformer哪不是用于点云特征提取的

KPConv:是一种用于点云特征提取的卷积方法,设计用于处理不规则的点云数据。

子流形稀疏卷积(Submanifold Sparse Convolution):是一种专门处理稀疏输入数据的卷积技术,也用于点云特征提取,特别是在稀疏的三维数据中。

PointNet:是一种基于点云的神经网络架构,直接处理点云数据,并提取特征。

Pointformer:是一种基于Transformer的架构,用于点云数据的特征提取,结合了自注意力机制以捕获点云中的局部和全局特征。

5. channelx2,计算量和带宽怎么变:4倍

带宽:
(kernel_size*kernel_size) *channel_input*channel_output
计算量:
(kernel_size*kernel_size*H*W) *channel_input*channel_output

6. 匈牙利算法,如果检测正确就一定能正确跟踪吗?

不能,依赖代价矩阵的设计

7. 1×1的卷积是否可以提取空间特征?:1×1卷积不直接提取空间特征,它的主要作用是通道间的信息整合和特征重组。

8. OHEM是什么?:OHEM(Online Hard Example Mining)是一种用于训练深度神经网络的技术,旨在提高模型对困难样本的学习能力。它在目标检测和分类任务中特别有用,帮助模型更有效地应对难以识别的样本,从而提高整体性能。

9. Dice损失常用于哪些任务:Dice损失常用于图像分割任务,尤其是在处理不平衡数据集或小目标分割任务中,如医学图像分割、语义分割、实例分割、遥感图像分析以及自动驾驶中的车道线检测等。它通过直接优化重叠区域的方式,提供了比传统交叉熵损失更适合这些场景的性能。

10. 浮点数非0非Nan非无穷浮点数相乘除一定是合法的吗?由于舍入误差、下溢/上溢、精度丢失和数值稳定性问题,这些操作并不总是绝对可靠。

11. 重复纹理环境中,sgbm是什么?robust norm的作用

12. ESEKF的特点

13. 非局部均值的作用:非局部均值(NLM)算法在图像去噪和增强中具有显著作用,它通过利用图像中的全局相似性来保留细节和纹理,同时去除噪声。NLM能够保持图像边缘、细节和纹理

14. triplet loss是什么?

15. 透视变换中3条世界中的平行线在相机平面一定交于一点吗? 不一定?三条线本身就平行于相机平面?

16. 模型复杂度增加有利于缓解过拟合吗?不能会更易造成过拟合

17. 哪些情况会显著降低KLT匹配的性能:

KLT特征点跟踪算法在处理快速运动、大视角变化、遮挡、低纹理区域、图像噪声、非刚性变形、光照变化和运动模糊等情况时可能会显著降低性能

18. 深度可分卷积是什么?:降低计算量

19. CUDA的三个步骤可以同时进行吗?内存到显存,计算,显存到内存:可以


评论

发表回复