自己对自己的菜不以为耻,反以为荣,“如果交接能让我搞懂了,那就说明彻底没问题了,整个研究院的人肯定都能轻松拿下。”
“还在划,还在划,来听大哥讲解了。”见孟繁岐已经拉下了项目,打开了文档和代码,王恺连忙起身招呼道。
在中气十足的招呼声中,十几位研究成员应声而来,直接将两人团团围住。
“嫂子,你坐这!”王恺见韩辞在一旁站着围观,顿时觉得自己表现的时候到了,连忙起身让座。
“别乱说嗷,我哪有这么好命。”孟繁岐觉得这小子还挺有意思的,“说正事吧,文档和论文的草稿我这里都给了,这个你们仔细仔细去读,我就不直接讲了。”
“今天主要就是说一下主要脉络和逻辑。yolo检测算法,就是you only look once,只看一次。指的是对图片仅进行一次扫描,它的主要速度提升就来自于此。
一个经典的检测方法的流程是这样的:先通过计算机图形学(或者深度学习)的方法,对图片进行分析,找出若干个可能存在物体的区域,将这些区域裁剪下来,放入一个图片分类器中,由分类器分类。
最愚蠢的做法就是用多个尺寸的选框反复扫描图片,后面则是使用一些办法,筛选最有可能的一些区域。这些做法都是两步走的,看一次图片选感兴趣的区域,再看一次图片去为这个区域做分类。
而我的做法是直接将整个图片划分成均匀的多个网格,其中每个格子都可以输出物体的类别和检测框的坐标。物体落在哪个区域,哪个区域就负责预测这个物体。
我的网络输出是一维的,前n个数字代表n个类别的概率,后面x个数字代表x个检测框的概率,最后4x个数字用以描述检测框在图片上的位置。”
“那怎么可能会快一两百倍呢?”有思维敏捷的白度研究员出声提问道,“比较注重速度的传统办法会削减提出的区域数量,通常最多也不过千余个。按照你的说法,你至少也需要数十个网格,每个网格又需要数个检测框,这样的话,感觉差别也不是非常大。”
“如果我们采用7x7的网格+两个检测框的话,总数量就仅为98个检测框。此外,在骨干网络的设计还有非极大值抑制的具体操作顺序上,也有很大的调整空间。”
“那性能应该会受到很大的影响吧?”
“多类的目标应该怎么去做?”
“这样的话,小目标的检测应该会是一个难题吧?”
随着孟繁岐的讲解,在场的研究员们理解越来越深,问题也越来越多。
孟繁岐不得不说,李彦弘的这个研究院确实聚集了一批相当出
『加入书签,方便阅读』
-->> 本章未完,点击下一页继续阅读(第2页/共3页)