推广 热搜: 汽车  汽车销量排行榜  suv销量排行榜  新能源汽车  新能源汽车前十名品牌  宝马x5优惠  保时捷卡宴  保时捷718  8月汽车销量排行榜  保时捷918 

谷歌使用AI追踪2D视频中的物体 或可用于自动驾驶汽车物体识别-超级汽车网

   日期:2022-04-25     作者:汽车网  联系电话:浏览:873    

据外媒报道,近日,谷歌发布了名为Objectron的管道,可以在2D图像中发现物体,并通过AI模型估算其姿态和大小。该公司表示,Objectron对机器人、自动驾驶汽车、图像检索和增强现实技术影响深远,例如,可以帮助工厂车间的机器人实时避开障碍物。

谷歌使用AI追踪2D视频中的物体 或可用于自动驾驶汽车物体识别

(图片来源:ai.googleblog.com)

追踪3D物体是一项复杂的工作,特别是当计算资源有限时。当仅有的可用图像为2D时,由于缺乏数据以及物体外观和形状多种多样,这会变得更加困难。

为此,Objectron研发团队开发了一种工具,可以使注释器通过分屏视角显示2D视频帧,来标记物体的3D边界框(即矩形边框)。这些3D边界框将叠加在点云数据、摄像头位置和识别到的平面上。注释器在3D视图中绘制3D边界框后,再通过查看2D视频帧中的投影来验证其位置。而对于静态物体,注释器只需在单个帧中标记目标物体象即可。该工具还使用AR会话数据中的实际摄像头姿态信息,将物体的位置传输到所有帧。

谷歌使用AI追踪2D视频中的物体 或可用于自动驾驶汽车物体识别

(图片来源:ai.googleblog.com)

为了补充真实世界的数据,以提高AI模型预测的准确性,该团队开发了一个引擎,将虚拟物体放入包含AR会话数据的场景中。这允许使用相机姿态信息、检测到的平面,以及估算的照明,生成物理上可能的、并具有与场景匹配的照明的位置,从而产生高质量的合成数据,其中的渲染物体符合场景的几何形状,并无缝融入真实背景。在验证试验中,合成数据的运用使AI模型预测准确性提高了约10%。

此外,该团队表示,当前版本的Objectron模型足够轻巧,可以在旗舰移动设备上实时运行。借助LG V60 ThinQ,三星Galaxy S20 +和Sony Xperia 1 II等手机中的Adreno 650移动图形芯片,该模型能够每秒处理约26帧。

Objectron在MediaPipe中可用,MediaPipe是一个框架,用于构建跨平台的AI管道,该管道包括快速推理和媒体处理(如视频解码)。提供训练有素的识别鞋子和椅子的模型,以及端到端演示应用程序。

该团队表示,未来计划与研发社区共享其他解决方案,以刺激新的用例、应用和研究工作。此外,该团队打算将Objectron模型进行扩展,以识别更多类别的物体,并进一步提高其在设备中的性能。

 
打赏
 
更多>相关资讯

最新发布
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报
联系电话:  微信: