您当前所在位置:主页 > 水生花卉 >

花卉识别app(基于卷积神经网络的花卉识别)

更新:2022-11-16 20:25归类:水生花卉人气:98

1. 基于卷积神经网络的花卉识别

1.形色识花:是一款植物类型的APP社交,可以发现很多的花,遇见很多的植物,还可以随时随地,拍照上传植物照片,利用应用得出植物的花名和寓意,可以识别精准的植物有4千多种呢,准确率达到92%。连复杂的多肉植物都可以识别出来。

2、iflora:是一款中国植物图像库app,基于《中国植物志》及中国植物物种信息数据库,通过移动互联网技术、数据库构建技术、网络通讯等技术实现iFlora移动平台的构建、iFlora检索特征库和图形形态库的建立,用户可随时随地的进行植物物种信息的综合查询、向导式索引表检索。

3、植物图鉴:提供便捷的植物查询功能和百科科普,让喜爱植物的朋友可以更加了解植物的习性,遇到不认识的植物直接拍照查询,方便又快捷,不用再苦苦找寻,操作简单。

4、微软识花:是微软亚洲研究院携手中国科学院植物研究所、科学出版社联合出品的app。只需拍摄花儿照片或选取手机图库中的花儿图片,由植物专家标定的庞大花卉数据库将快速、精确地识别花儿,并通过花语、药用价值等信息,讲述关于花儿的小秘密。

5、拍照识花:仅凭相片或网络图片就可以鉴别花卉植物的品类(拍照识图的深度应用),是基于卷积神经网络的计算深度学习技术,进行多项技术改进以提升图像识别在柔性物体上的识别效果,可以识别上千种常见花卉植物,用户只需拍照就能识别出相片中的花卉种类

2. 卷积神经网络在图像处理中的应用

卷积神经网络通过局部连接、权值共享、下采样等方法来达到更好的图像识别效果。

3. 卷积神经网络提取的图像特征包括哪些

首先简单介绍一下什么是语义分割。计算机视觉是深度学习的热门研究方向,在人脸识别、图像检索、自动驾驶等领域拥有广泛的应用。语义分割(semantic segmentation)则是计算机视觉中的一项基本任务,其目标是将图像的每个像素所属类别进行划分,使得不同种类的物体在图像上可以被区分开来。

(a)原图像 (b)语义分割

语义分割被广泛用于自动驾驶、医疗影像分析和机器人等领域,其在地理信息影像分析场景下的应用,主要是通过训练深度神经网络模型,让机器从影像中识别道路、河流、建筑物等不同地物。

实现流程

基于深度学习的语义分割技术识别影像中的建筑物,主要包括数据准备、模型构建、模型推理几个过程。超图为我们提供了完成空间深度学习项目的GeoAI流程工具,支持完整的任务实现流程,可以帮助快速构建适合于各自业务的AI模型,并获得推理结果。

空间深度学习实现流程

l 数据情况

l 1、训练数据:包含建筑物的影像块(约2万张)以及无建筑物的影像块(约5万张),影像块行列数目均为1024,分辨率为0.02-0.2m;以及与影像块对应的矢量标签数据。

l 2、测试数据为分布在非洲不同区域的影像块(约1万张),行列数目均为1024。

训练数据示例(含有矢量标签的影像数据)

l 模型选型

可以用于影像语义分割的模型有很多,包括FPN、FCN、U-Nett、PSPNet、DeepLab系列等。在选择分割模型时,需要针对项目要求,选择合适的模型。在该项目中,我们通过对比精度和效率,最终选用FPN模型。其中,EfficientNet 作为主干网络,用于提取图像基本特征, FPN则可以对EfficientNet提取的特征再做进一步处理。

l 1、EfficientNet

谷歌在2019年提出了一种新型卷积神经网络EfficientNet,具备高效的图像特征提取能力。卷积神经网络(CNN)通常在固定资源预算下开发,然后在更多资源加入进来时扩大规模,以达到更高精度,EfficientNet利用简单而高效的复合系数统一缩放模型的多个维度,有效提升了模型的准确率和效率。

选择合适的主干网络,可以使模型提取图像特征能力表现更好、效率更高。在语义分割中,常用的主干网络还包括ResNet、 VGG 、DenseNet等。

l 2、FPN

FPN(Feature Pyramid Network)是一种高效提取图片中各尺度特征的模型,可以使最终输出的特征更好地表示出输入图片各个维度的信息。本质上说它是一种加强主干网络特征表达的方法。

FPN基本架构

优化策略

为了提高模型整体表现,我们分别从数据、训练策略和推理过程几个方面进行了针对性的优化,下面将着重介绍几种对训练效率、推理准确度有显著提升作用的优化方法:

l 数据优化

l 1、进行数据增强

在深度学习项目中,一般数据越多,训练任务的效果越好。数据增强可以让有限的数据产生更多的有效训练数据,增加训练的数据量,提高模型的泛化能力。在数据优化过程中可以采用裁剪、缩放、旋转等多种数据增强方法。

部分数据增强效果

l 2、增加负样本

样本中增加部分包含无建筑物区域的训练数据(例如耕地)作为负样本,进行训练时可以提高推理准确度,减少模型误判情况。

耕地推理误判情况

l 训练优化

l 1、优化器

为了使模型输出逼近最优值,我们需要用各种优化策略和算法,来更新影响模型训练和输出的网络权重参数。通常我们将更新参数的算法称为优化器,即通过何种算法去优化网络权重参数。

如上表所示,梯度下降法是最基本的一类优化器;动量优化方法是在梯度下降法的基础上进行的改进;自适应学习率优化算法针对于模型训练过程的学习率设置进行优化,而学习率的有效调整可以提高训练速度和效果。

在实际应用中,需结合具体问题来选择适合的优化器。在该项目中,我们发现利用Radam + LookAhead优化器效果显著,这是一种新的组合优化器,把RAdam(经典Adam优化器的一个新变种)和LookAhead协同组合,能实现较高的优化水平,作为深度学习初学者也可以以此训练出一个表现较好的模型。

l 2、多显卡

l 多显卡训练可以使训练效率明显提升,同时在一定程度上也能提升模型的最终精度和泛化能力。

l

l 推理优化

l 1、多尺度图像推理加权

在推理过程中将图像放大缩小,利用多尺度图像进行推理,再将结果加权平均,得到最终输出结果,这种优化方法在应用中可以显著提高推理准确率。

多尺度图像推理加权

经过一系列优化后,该项目在测试数据集上的最终精度值IOU优于0.83,即可以较为准确地将影像中的建筑物分割出来,达到了实际应用的程度。

推理结果示例

IoU:用于评估语义分割算法性能的标准指标。这个标准用于测量真实范围和预测范围之间的相关度,相关度越高,该值越高。

如下图绿色标线是人为标记的正确结果,橙色标线是算法预测出来的结果,IoU的测算准则是两个区域重叠部分除以两个区域的集合部分得出的结果。一般来说,IoU> 0.5 就可以被认为一个不错的结果了。

IoU计算原理

小结

越来越多的实际应用场景需要从影像中推理出相关的语义或知识,而深度学习是解决这些场景任务的有效技术。本文以高分辨率影像建筑物语义分割为例,介绍了语义分割的实现以及从数据、训练和推理过程方面采用的不同优化方法,为建立行之有效的深度学习项目提供了一个实用参考。

文/超图研究院端产品研发中心 尚耘

4. 基于卷积神经网络的花卉识别本科毕业论文

1、形色识花:是一款植物类型的APP社交,可以发现很多的花,遇见很多的植物,还可以随时随地,拍照上传植物照片,利用应用得出植物的花名和寓意,可以识别精准的植物有4千多种呢,准确率达到92%。连复杂的多肉植物都可以识别出来。

2、iflora:是一款中国植物图像库app,基于《中国植物志》及中国植物物种信息数据库,通过移动互联网技术、数据库构建技术、网络通讯等技术实现iFlora移动平台的构建、iFlora检索特征库和图形形态库的建立,用户可随时随地的进行植物物种信息的综合查询、向导式索引表检索。

3、植物图鉴:提供便捷的植物查询功能和百科科普,让喜爱植物的朋友可以更加了解植物的习性,遇到不认识的植物直接拍照查询,方便又快捷,不用再苦苦找寻,操作简单。

4、微软识花:是微软亚洲研究院携手中国科学院植物研究所、科学出版社联合出品的app。只需拍摄花儿照片或选取手机图库中的花儿图片,由植物专家标定的庞大花卉数据库将快速、精确地识别花儿,并通过花语、药用价值等信息,讲述关于花儿的小秘密。

5、拍照识花:仅凭相片或网络图片就可以鉴别花卉植物的品类(拍照识图的深度应用),是基于卷积神经网络的计算深度学习技术,进行多项技术改进以提升图像识别在柔性物体上的识别效果,可以识别上千种常见花卉植物,用户只需拍照就能识别出相片中的花卉种类。

5. 基于卷积神经网络的花卉识别毕设答辩记录

1、形色识花:是一款植物类型的APP社交,可以发现很多的花,遇见很多的植物,还可以随时随地,拍照上传植物照片,利用应用得出植物的花名和寓意,可以识别精准的植物有4千多种呢,准确率达到92%。连复杂的多肉植物都可以识别出来。

2、iflora:是一款中国植物图像库app,基于《中国植物志》及中国植物物种信息数据库,通过移动互联网技术、数据库构建技术、网络通讯等技术实现iFlora移动平台的构建、iFlora检索特征库和图形形态库的建立,用户可随时随地的进行植物物种信息的综合查询、向导式索引表检索。

3、植物图鉴:提供便捷的植物查询功能和百科科普,让喜爱植物的朋友可以更加了解植物的习性,遇到不认识的植物直接拍照查询,方便又快捷,不用再苦苦找寻,操作简单。

4、微软识花:是微软亚洲研究院携手中国科学院植物研究所、科学出版社联合出品的app。只需拍摄花儿照片或选取手机图库中的花儿图片,由植物专家标定的庞大花卉数据库将快速、精确地识别花儿,并通过花语、药用价值等信息,讲述关于花儿的小秘密。

5、拍照识花:仅凭相片或网络图片就可以鉴别花卉植物的品类(拍照识图的深度应用),是基于卷积神经网络的计算深度学习技术,进行多项技术改进以提升图像识别在柔性物体上的识别效果,可以识别上千种常见花卉植物,用户只需拍照就能识别出相片中的花卉种类

6. 基于卷积神经网络的图像分类方法

使用CNN进行猫狗分类

卷积神经网络 (CNN) 是一种算法,将图像作为输入,然后为图像的所有方面分配权重和偏差,从而区分彼此。神经网络可以通过使用成批的图像进行训练,每个图像都有一个标签来识别图像的真实性质(这里是猫或狗)。一个批次可以包含十分之几到数百个图像。

对于每张图像,将网络预测与相应的现有标签进行比较,并评估整个批次的网络预测与真实值之间的距离。然后,修改网络参数以最小化距离,从而增加网络的预测能力。类似地,每个批次的训练过程都是类似的。

7. 基于卷积神经网络的图像识别

卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。

卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为平移不变人工神经网络。

卷积神经网络的构成是仿造生物的视知觉机制构建,可以进行监督学习和非监督学习。

其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。

8. 相比循环神经网络卷积神经网络更适合处理图像识别问题

由于人工智能不再是一个模糊的营销术语,而是更多的精确意识形态,因此理解所有AI术语越来越成为一项挑战。 国外AI领域的专家们聚在一起,聚集在一起,为大家定义了人工智能领域的一些最常见的术语。

A

Algorithms 算法:给AI、神经网络或其他机器提供的一套规则或指令,以帮助它自己学习; 分类,聚类,推荐和回归是四种最流行的类型。

Artificial intelligence 人工智能:机器能够做出决策并执行模拟人类智能和行为的任务。

Artificial neural network 人工神经网络(ANN):一种学习模型,可以像人脑一样工作,解决传统计算机系统难以解决的任务。

Autonomic computing 自主计算:系统的自适应自我管理能力,用于高级计算功能,无需用户输入。

C

Chatbots 聊天机器人:聊天机器人(简称聊天机器人),旨在通过文本聊天,语音命令或两者进行通信来模拟与人类用户的对话。它们是包含AI功能的计算机程序的常用接口。

Classification 分类:分类算法让机器根据训练数据为数据点分配类别。

Cluster analysis 聚类分析:一种用于探索性数据分析的无监督学习,用于查找数据中的隐藏模式或分组;群集使用由欧几里得或概率距离等度量定义的相似性度量建模。

Clustering 聚类:聚类算法允许机器将数据点或项目分组到具有相似特征的组中。

Cognitive computing 认知计算:一种模仿人类大脑思维方式的计算机模型。它涉及通过使用数据挖掘,自然语言处理和模式识别进行自学习。

Convolutional neural network 卷积神经网络(CNN):一种识别和理解图像的神经网络。

D

Data mining 数据挖掘:检查数据集以发现和挖掘可以进一步使用的数据模式。

Data science 数据科学:一个跨学科领域,结合了统计学,信息科学和计算机科学的科学方法,系统和过程,通过结构化或非结构化数据提供对现象的洞察。

Decision tree 决策树:基于树和分支的模型,用于映射决策及其可能的后果,类似于流程图。

Deep learning 深度学习:机器通过由级联信息层组成的人工神经网络自主模仿人类思维模式的能力。

F

Fluent 流畅:一种可以随时间变化的状况。

G

Game AI :一种特定于游戏的AI形式,它使用算法来代替随机性。 它是非玩家角色中使用的计算行为,用于生成玩家所采取的类似人类智能和基于反应的动作。

Genetic algorithm 遗传算法:一种基于遗传学和自然选择原理的进化算法,用于寻找困难问题的最优或近似最优解,否则需要数十年才能解决。

H

Heuristic search techniques 启发式搜索技术:支持通过消除不正确的选项来缩小搜索问题的最佳解决方案的范围。

K

Knowledge engineering 知识工程:专注于构建基于知识的系统,包括其所有科学,技术和社会方面。

L

Logic programming 逻辑编程:一种编程范式,其中基于事实和规则的知识库进行计算; LISP和Prolog是用于AI编程的两种逻辑编程语言。

M

Machine intelligence 机器智能:一个涵盖机器学习,深度学习和经典学习算法的总称。

Machine learning 机器学习:人工智能的一个方面,专注于算法,允许机器学习而不需要编程,并在暴露于新数据时进行更改。

Machine perception 机器感知:系统接收和解释来自外部世界的数据的能力,类似于人类如何使用我们的感官。 这通常使用附加的硬件来完成,尽管软件也是可用的。

N

Natural language processing 自然语言处理:程序能够识别人类交流的能力。

R

Recurrent neural network 递归神经网络(RNN):一种神经网络,它能够理解顺序信息并识别模式,并根据这些计算创建输出。

S

Supervised learning 监督学习:一种机器学习,其中输出数据集训练机器生成所需的算法,如监督学生的教师; 比无监督学习更常见。

Swarm behavior 群体行为:从数学建模者的角度来看,它是由个人遵循的简单规则产生的紧急行为,不涉及任何中心协调。

U

Unsupervised learning 无监督学习:一种机器学习算法,用于从没有标记响应的输入数据组成的数据集中得出推论。 最常见的无监督学习方法是聚类分析。

补充:TF

TF是指谷歌的TensorFlow深度学习开源框架。Tensorflow是谷歌在 2015 年 11 月开源的机器学习框架,来源于 Google 内部的深度学习框架 DistBelief。由于其良好的架构、分布式架构支持以及简单易用,自开源以来得到广泛的关注。

鉴于TensorFlow目前这么流行,想要学习和实践的程序员们也可以了解下谷歌最近的AI开源项目——AIY Projects。AIY 全称是 Artificial Intelligence Yourself,顾名思义就是利用 AI 来进行的 DIY 功能套件。借助 AIY 项目,创客可以利用人工智能来实现更像人与人交流的人机交互。谷歌目前为 AIY Projects 推出了两款硬件产品--AIY Voice Kit 和 AIY Vision Kit。

9. 卷积神经网络在人脸识别中的应用

四年一度的世界杯,不仅是各国球队们大秀实力的赛场,也是各种新科技、新技术露面的好时机。在本次世界杯中,就有着多个闪耀着智能之光的“黑科技”横空出世,除了帮助大赛更加顺利举办之外,还将颠覆观众的观赛体验,向全世界的观众们展示科技改变生活的力量。

2018俄罗斯世界杯,可以说是有史以来最智能的世界杯—— VAR、大数据、智能穿戴设备、AI等各种“黑科技”层出不穷、交相辉映。下面,让我们一起来感受“智能黑科技”在世界杯赛场上的独特魅力!

?黑科技一:VAR视频裁判助理

本届世界杯最令人期待的新技术应用便是VAR—— 视频助理裁判(Video Assistant Referee)。在刚结束的小组赛第一轮,VAR技术就初现峥嵘。

6月18日20时,2018年俄罗斯世界杯F组第一轮在下诺夫哥罗德体育场展开争夺,韩国0-1负于瑞典。全场唯一进球出现在第65分钟,韩国替补出场的金民友禁区内犯规送点,主裁在VAR提示下判罚点球,格兰奎斯特建功。最终瑞典在首战当中迎来开门红。

这并非VAR首次“立功”。在法国对阵澳大利亚的比赛中,主裁判通过VAR的实时回访,判给法国队一个点球,从而让法国队逃离了玄学魔咒,艰难取胜。

为法国和瑞典提供“神助攻”的到底是啥“黑科技”?VAR视频助理裁判,由4人组成,他们在一间视频操作间工作,通过实时画面与虚拟画面相结合,来还原比赛细节,进行视频回放来缩小“错判率”。根据 FIFA 现行规定,VAR仅会在涉及进球有无、点球判罚、红黄牌(第二张黄牌判定)以及主裁判罚对象出错时介入比赛。

?黑科技二:大数据

大数据时代,海量的数据信息在人们的生活和商业运作中,起到了不可替代的作用。本届世界杯的最大特点之一,也许就是科技和数据交织的魅力,让足球运动更加“科学”。球队可以在赛前根据球员运动数据进行精确体育分析,来打造最佳的训练方式——掌握了数据信息,形成了具体参数,球队甚至可以用 大数据来制定针对对手的策略和战术方案,用“黑科技”武装自己,破解对手弱点。据悉,SAP最新发布的两项全新功能视频操控面板(Video Cockpit)和球员数据面板(Player Dashboard),就将在本届世界杯上为德国足球队独家使用。

与此同时,众多研究机构、高校、企业开启了大数据预测。近日,俄罗斯彼尔姆国立研究大学物理系大四学生维克多?扎科派洛建立了一个能预测2018年世界杯冠军的神经网络。综合各项参数进行分析计算后,他得出结论,世界杯前三名将是德国队、巴西队和阿根廷队。彼尔姆国立研究大学称,这项预测的准确度超过80%。但如果该项预测准确的话,俄罗斯队甚至不能在小组赛中出线……

?黑科技三:智能装备

作为一场球赛中最重要的道具,这一次2018 FIFA世界杯举办方也首次采用了 智能足球作为这次比赛的官方用球——Adidas在去年年底发布的Telstar 18智能足球。这款足球最大的亮点就是在球内嵌入了 NFC芯片,这次官方首次引入这项技术,据说可以与智能手机互动,查看足球的运动轨迹以及球员们的射门技巧。

除了足球,阿迪达斯还发布了一款 智能球鞋,可掌握运动者的运动速度、时间、消耗能量等信息。有了这些数据,教练就可以对运动员的训练进行个人定制。

此外,本届世界杯的裁判员手上佩戴了一款Hublot推出的 The Big Bang Referee智能手表。这款智能手表价值5200美元(约合人民币33630元),它的功能除了进球以及开场提醒外,还能显示两队的比分、进球球员名称、替补球员信息以及最后的哨前时间等。

?黑科技四:4K高动态直播

本届世界杯将采用全部 4K“高动态范围”拍摄,这不光为球迷带来了极佳的观赛体验,同样也为视频裁判提供了技术支持与辅助。

“高动态范围”是一种视频色彩处理技术,提升了画面的对比度,使颜色看上去更加明亮纯粹。拿出百亿美元的东道主在每个场馆使用30台高清摄像机,其中8台支持双4K UHD/HDR和1080p/SDR输出,另8台提供双1080p HDR/SDR输出,同时配备超慢动作摄像机、超运动摄像机,CINEFLEX空中系统,以及360度全景摄像机。

遗憾的是,只有极少数国家的球迷有机会享受这样的视觉盛宴。据悉,4K 信号对用户的设备带宽要求极高,乐观估计2020年东京奥运会前后有望实现普及。

?黑科技五:AI直播剪辑官

AI人工智能今年在世界杯上大放异彩,除了接下新闻记者的写稿苦活外,还积极接棒章鱼保罗预测世界杯冠军,甚至还威胁到了短视频剪辑师的地位,成为了世界杯短视频“剪刀手”。

6月14日,央视世界杯新媒体官方合作伙伴咪咕视频,就宣布在本届世界杯上率先引入“AI直播剪辑官”,参与世界杯直播精彩短视频实时剪辑。这是国内首次把AI技术应用于世界杯赛事直播短视频剪辑上,将开启世界杯直播短视频剪辑秒级时代,从而引发世界杯短视频爆发式增长。

据介绍,咪咕视频AI直播剪辑官拥有最前沿的人工智能技术:它有一双“3D卷积神经网络眼睛”,能准确识别进球、射门、点球、角球、红牌、黄牌、庆祝等七大场景、多种动作;它还拥有成熟的人脸识别技术和OCR识别技术,可以实现高速运动下的球星人脸实时定位与检测,识别直播流中的所有球星、球队,堪比一本“世界杯球星球员百科全书”。

AI会否真的取代传统的短视频剪辑专家?据悉,咪咕视频AI实时剪辑技术团队日前专门邀请了专业剪辑专家与AI系统进行现场PK。结论是,在剪辑时间、场景与球员辨识度、关键帧捕捉等技术上AI已经远超传统剪辑师,但是AI目前还无法更深层次的理解人的想法,在剪辑内容创意呈现方面,传统的专业剪辑师仍有优势。

不过,AI的发展潜力巨大,一旦它突破从感知到认知的关键节点,就能主动通过用户的行为习惯、个人爱好等,去主动定制化生产直播视频流。下一届世界杯,是否可以通过手机在咪咕视频上看到千人千面的赛事?C罗粉能不能让AI提供全程聚焦C罗的画面?相信科技的力量,会为我们带来越来越棒的世界杯体验。

上一篇:花卉施肥的原则(花卉合理施肥的目的) 下一篇:草本花卉和木本花卉(草本花卉和木本花卉哪个好养)

游客 回复需填写必要信息