据外媒报道,为了自动从科学论文中获取重要数据,美国国家标准与技术研究所(NIST)的计算机科学家研发了一种方法,可以精确地检测图像数据中密集、低质量的小几何物体,如三角形。NIST的该款模型采用神经网络法来探测模式,也可用于现代生活的多种应用中。
(图片来源:NIST)
NIST的神经网络模型可在一组确定的测试图像中捕获97%的目标物体,将物体的中心定位于人工选择的几个像素内。
NIST计算机科学家Adele Peskin解释表示:“该项目的目的是恢复期刊文章中丢失的数据。但是对小型、密集型物体进行探测的研究还有很多其他应用。目前,图像分析、自动驾驶汽车、机器检查等领域都会利用物体探测技术,因为此种小型、密集型物体特别难以定位和分隔开。”
研究人员从20世纪初期的期刊文章中获取数据,通常结果会仅以图形形式呈现,而且有些是手工绘制的,扫描或复印会让图形分辨率变差。研究人员希望提取数据点的位置,以恢复原始数据,以便进行进一步分析。到目前为止,此类数据都是人工提取的。
NIST研究人员采用了最初由德国研究人员研发,用于分析生物医学图像的网络架构U-Net,首先将图像的尺寸压缩,减少空间信息,然后添加特征和上下文信息层,以获取精确、高分辨率的结果。
该网络的最佳性能可让其定位目标中心的准确率达97%,使研究人员足以利用神经网络从更新版的期刊论文中恢复数据。
虽然目前NIST的研究人员没有计划进行后续研究,但是表示,该神经网络绝对可以用于解决其他图像分析问题。