谷歌使用AI追踪2D视频中的物体或可用于自动驾驶汽车物体识别-超级汽车网

日期：2022-04-25 作者：汽车网联系电话：浏览：882

据外媒报道，近日，谷歌发布了名为Objectron的管道，可以在2D图像中发现物体，并通过AI模型估算其姿态和大小。该公司表示，Objectron对机器人、自动驾驶汽车、图像检索和增强现实技术影响深远，例如，可以帮助工厂车间的机器人实时避开障碍物。

谷歌使用AI追踪2D视频中的物体或可用于自动驾驶汽车物体识别

（图片来源：ai.googleblog.com）

追踪3D物体是一项复杂的工作，特别是当计算资源有限时。当仅有的可用图像为2D时，由于缺乏数据以及物体外观和形状多种多样，这会变得更加困难。

为此，Objectron研发团队开发了一种工具，可以使注释器通过分屏视角显示2D视频帧，来标记物体的3D边界框（即矩形边框）。这些3D边界框将叠加在点云数据、摄像头位置和识别到的平面上。注释器在3D视图中绘制3D边界框后，再通过查看2D视频帧中的投影来验证其位置。而对于静态物体，注释器只需在单个帧中标记目标物体象即可。该工具还使用AR会话数据中的实际摄像头姿态信息，将物体的位置传输到所有帧。

谷歌使用AI追踪2D视频中的物体或可用于自动驾驶汽车物体识别

（图片来源：ai.googleblog.com）

为了补充真实世界的数据，以提高AI模型预测的准确性，该团队开发了一个引擎，将虚拟物体放入包含AR会话数据的场景中。这允许使用相机姿态信息、检测到的平面，以及估算的照明，生成物理上可能的、并具有与场景匹配的照明的位置，从而产生高质量的合成数据，其中的渲染物体符合场景的几何形状，并无缝融入真实背景。在验证试验中，合成数据的运用使AI模型预测准确性提高了约10%。

此外，该团队表示，当前版本的Objectron模型足够轻巧，可以在旗舰移动设备上实时运行。借助LG V60 ThinQ，三星Galaxy S20 +和Sony Xperia 1 II等手机中的Adreno 650移动图形芯片，该模型能够每秒处理约26帧。

Objectron在MediaPipe中可用，MediaPipe是一个框架，用于构建跨平台的AI管道，该管道包括快速推理和媒体处理（如视频解码）。提供训练有素的识别鞋子和椅子的模型，以及端到端演示应用程序。

该团队表示，未来计划与研发社区共享其他解决方案，以刺激新的用例、应用和研究工作。此外，该团队打算将Objectron模型进行扩展，以识别更多类别的物体，并进一步提高其在设备中的性能。

打赏

更多>相关资讯

最新发布

推荐资讯

点击排行

联系电话: 微信：

• 一季度净利润转正，销量再创新高。大力士业绩	• 一季度利润猛增18倍。长城汽车的变现工具是什
• 2023年百万级豪华SUV销量榜：劳斯莱斯排名第十	• 2027年停售燃油车的东风本田今年纯电动车型销量
• 东风本田\| 发布2030新战略，“新”出发	• 庆祝成立75周年，本田有望以电动化形式“复活”
• 观点\| 本田水村早苗：2030年推出30款纯电动车型	• 索尼本田将推出三款新车与特斯拉竞争
• 2024年4月俄罗斯汽车销量大幅增长，前十中有9个	• 20万-40万，你要“脸”还是“腿”？这5款车一定

谷歌使用AI追踪2D视频中的物体 或可用于自动驾驶汽车物体识别-超级汽车网

谷歌使用AI追踪2D视频中的物体或可用于自动驾驶汽车物体识别-超级汽车网