该系统分析数字形式的图像,确定哪些标志表明给定元素(交通灯)的存在。训练后,。如果一切顺利,那么我们可以说计算机已经学会了注意到交通灯,并且能够在任何图片中找到它。 人类和机器的学习过程是不同的。如果我们使用视觉图像进行操作,那么计算机就会接收数字形式的信息。对他来说,图片是一组像素,每个像素都有亮度和颜色值。为了让机器“理解”所描绘的内容,需要使用特殊的算法。
首先,在图片中确定提议对象之间的边界。为此使用了多种方法,包括高斯差分 (DoG) 算法。在这种情况下,原始图像会受到多次高斯模糊,并且每次都使用不同的滤波器。接下来,对获得的结果进行比较,以识别最具对比的片段,这些片段通常是对象之间的边界。 此后,图中的重 展数据 要位置被转换为数字形式。输出是一个描述符——图形图像的数字记录。正是通过描述符的比较,才将图片与其类似物识别出来。
为了创建计算机视觉运行的描述符,需要使用各种算法——SIFT、SURF、HOG 等。 计算机图形学的类型及其特点 另请阅读 计算机图形学的类型及其特点 更多细节 图像描述符由大量数字表示,如果使用完整的符号,则匹配数字形式将需要大量的软件资源。因此,为了加快计算速度,描述符被分为簇 - 组。这种操作称为聚类。 月 日前,GeekBrains 课程 提供 % 折扣 只需 个月,您就可以找到收入为 , 卢布的 工作 预订折扣 聚类之后,主要工作转移到簇级别,这种从描述符到簇的转变称为量化。
|