智能算法(人工智能常用算法介绍)人工智能的三大基石——算法、数据和计
最近这段时间总有小伙伴问小编智能算法_人工智能常见算法简介 是什么,小编为此在网上搜寻了一些有关于智能算法_人工智能常见算法简介 的知识送给大家,希望能解答各位小伙伴的疑惑。
智能算法(人工智能常用算法介绍)
(资料图片)
人工智能的三大基石——算法、数据和计算能力。算法作为其中之一,非常重要。那么人工智能会涉及哪些算法呢?不同的算法适用于哪些场景?
1.根据模型训练方法的不同,可以分为四类:监督学习、无监督学习、半监督学习和强化学习。
常见的监督学习算法包括以下几类:
(1)人工神经 *** :反向传播、玻尔兹曼机、卷积神经 *** 、Hopfield *** 、多层感知器、径向基函数 *** 、RBFN)、受限玻尔兹曼机、递归神经 *** (RNN)、自组织映射(SOM)、脉冲神经 *** 等。
(2) Bayesin:朴素贝叶斯、高斯朴素贝叶斯、多项式朴素贝叶斯和平均单相关估计(AODE)
贝叶斯信念 *** (BBN)、贝叶斯 *** (BN)等。
(3)决策树:分类回归树(CART)、迭代二分器3 (ID3)、C4.5算法(C4.5算法)、C5.0算法(C5.0算法)、卡方自动交互检测、CHAID、决策树桩、ID3算法、随机森林、SLIQ(Quest中的监督学习)等。
(4)线性分类器:Fisher线性判别式。
线性回归、逻辑回归、多元逻辑回归、朴素贝叶斯分类器、感知、支持向量机等。
常见的无监督学习算法包括:
(1)人工神经 *** :生成拮抗 *** (GAN)、前馈神经 *** (feed forward neural networks)、逻辑学习机(logic learning machines)、自组织映射等。
(2)关联规则学习:Apriori算法、Eclat算法、FP-Growth算法等。
(3)层次聚类算法:单链聚类、概念聚类等。
(4)聚类分析:BIRCH算法、DBSCAN算法、期望更大化(EM)、模糊聚类、K-均值算法、K-均值聚类、K-中位数聚类、Mean-shift算法、Mean-shift算法。
(5)异常检测:K近邻(KNN)算法、局部离群因子(LOF)算法等。
常见的半监督学习算法包括:生成模型、低密度分离、基于图的方法、协同训练等。
常见的强化学习算法包括:Q-学习、状态-动作-奖励-状态-动作(SARSA)、DQN(深度Q *** )、策略梯度、基于模型的强化学习(基于模型的RL)、时间差异学习(临时)
常见的深度学习算法包括:深度信念机器、深度卷积神经 *** 、深度递归神经 *** 、分层时间记忆(HTM)、深度玻尔兹曼机器(DBM)、堆叠自动编码器、生成对抗 *** 等。
其次,根据要解决的任务不同,大致可以分为五种类型:二类分类算法、多类分类算法、回归算法、聚类算法和异常检测。
1.两级分类
(1)两类支持向量机(两类SVM):适用于数据特征多、模型线性的场景。
(2)二类平均感知器:适用于训练时间短、模型线性的场景。
(3)二类Logistic回归:适用于训练时间短,模型线性的场景。
(4)两类贝叶斯点机器:适用于训练时间短,模型线性的场景。(5)二类决策森林:适用于短时精准的训练场景。
(6)二类提升决策树:适用于训练时间短、准确率高、占用内存大的场景。
(7)二类决策丛林:适用于训练时间短、准确率高、占用内存小的场景。
(8)二类局部深度支持向量机(二类局部深度SVM):适用于数据特征较多的场景。
(9)两类神经 *** :适用于精度高、训练时间长的场景。
解决多分类问题通常有三种解决方案:一是从数据集和适用方法入手,用两个分类器解决多分类问题;二是直接使用具有多分类能力的多分类器;第三,把两个分类器改进成多分类器,解决今天的多分类问题。
常用算法:
(1)多类Logistic回归:适用于训练时间短、模型线性的场景。
(2)多类神经 *** :适用于精度高、训练时间长的场景。
(3)多类决策森林:适用于准确率高、训练时间短的场景。
(4)多类决策丛林:适用于准确率高、占用内存小的场景。
(5)“一对多”多类:取决于两个分类器的效果。
返回
回归问题通常用于预测特定值,而不是分类。其他方法类似于分类问题,只是返回的结果不同。我们称之为定量输出,或连续变量预测,回归;定性输出,或对离散变量的预测,称为分类。长毛巾的算法是:
(1)有序回归:适用于整理数据的场景。
(2)泊松回归:适用于预测事件数量的场景。
(3)快速森林分位数回归:适用于预测分布的场景。
(4)线性回归:适用于训练时间短,模型线性的场景。
(5)贝叶斯线性回归:适用于线性模型和训练数据较少的场景。
(6)神经 *** 回归:适用于精度高、训练时间长的场景。
(7)决策森林回归:适用于准确率高、训练时间短的场景。
(8)助推决策树回归:适用于准确率高、训练时间短、内存占用大的场景。
串
聚类的目标是发现数据的潜在规律和结构。聚类通常用于描述和度量不同数据源之间的相似性,并将数据源划分到不同的簇中。
(1)层次聚类:适用于训练时间短、数据量大的场景。
(2)K-means算法:适用于准确率高、训练时间短的场景。
(3)模糊C均值(FCM):适用于精度高、训练时间短的场景。
(4)自组织特征映射(SOM):适用于运行时间较长的场景。
异常检测
异常检测是指检测和标记数据中的异常或非典型分裂,有时也称为偏差检测。
异常检测看起来很像监督学习问题,两者都是分类问题。两者都是对样本的标签进行预测和判断,但实际上两者的区别是很大的,因为异常检测中的正样本(异常值)是很小的。常用的算法有:
(1)一类支持向量机(一类SVM):适用于数据特征较多的场景。
(2)基于PCA的异常检测:适用于训练时间较短的场景。
常见的迁移学习算法包括归纳迁移学习、直接迁移学习、无监督迁移学习、直推式迁移学习等。
算法的适用场景:
需要考虑的因素有:
(1)数据的大小、质量和特征。
(2)机器学习要解决的具体业务场景中的问题本质是什么?
(3)什么是可接受的计算时间?
(4)算法的精度要求有多高?
有了算法和训练好的数据(预处理过的数据),经过多次训练(考验计算能力的时候到了),经过算法人员的模型评估和调整,得到训练模型。当新的数据输入后,我们的训练模型就会给出结果。即使实现了业务所需的最基本的功能。
产品在互联网上自动运维是趋势,因为互联网需要快速响应的特性,决定了我们需要快速响应,快速修复问题。人工智能产品也不例外。AI+自动运维是如何工作的?