多领域交叉学科,机器学习( 三 )


1: 机器学习可以解决哪些问题?主要分为两类问题:分类问题和回归问题,其中分类问题又可以分为多分类问题和多标签多分类问题 。其他还有很多进阶版本的问题,一般由多个问题复合而成,比如物体检测,实际是把图像分割和分类问题整合到了一起;2: 机器学习算法有哪些?我们大体可以将机器学习的算法分为传统机器学习和深度学习算法 。
传统机器学习算法中,常见的有SVM,决策树,随机森林等,大都在sklearn中进行了集成,可以非常方便的调用 。深度学习算法主要依赖学习框架,主流的包含Tensorflow和PyTorch,各有优缺点,请自行了解做进一步选择 。其次就是深度学习的网络结构又可以分为卷积神经网络,递归神经网络,自动编码器,对抗生成网络,图卷积神经网络等 。
目前深度学习在各个领域都取得了巨大的性能提升,是机器学习中的重点领域,另外图卷积也逐渐成为重中之重;3: 常见的机器学习的流程是什么样的?一个不失一般性的流程由这么几部分构成:数据集整理,数据集预处理,数据集划分(训练集,测试集,验证集,常见比例7:1:2),模型训练,模型验证,模型测试 。4: 怎么评价模型性能好坏?常见指标有哪些?我们通常使用验证集的数据测试并选择最终的模型,然后用测试数据集来测试我们模型的性能 。
得到最终模型后,我们可以使用更大的独立测试数据集来进一步评估模型的性能 。评估模型性能,我们就需要使用具体的性能指标 。根据数据集中不同类别样本的比例,我们将数据集分为均衡数据集和非均衡数据集 。均衡数据集我们可以使用准确率、损失值、马修斯系数、F1-score、ROC 曲线以及 AUC 值等指标,这类数据集的评估相对容易 。
对于非均衡数据集,我们需要谨慎的使用准确率来衡量模型性能,结合具体问题,我们一般更多的使用F1-score和ROC-AUC等指标 。5: 关于公共数据集 。现在网上有很多公开的且标注完备的数据集,包括图像的、序列的、文本的等等,为机器学习提供了良好的学习环境 。练手阶段需要充分利用这些资源!此外,机器学习不是万能的,很多情况下性能取决于数据和问题定义,不是每一个问题都能用机器学习解决 。
人工智能、机器学习、深度学习的关系是什么?
深度学习是实现机器人学习的一种方式,机器学习是实现人工智能的一种方式 。这三者属于一个从属的关系 。下面详细解释一下:深度学习,机器学习,人工智能的各类概念 。1、深度学习:相当于一种处理信息的方式 。这上面的三个概念,在理解的时候,最好类比一下人类的思维习惯 。然后就好理解这些模型和架构 。外部信息输入进来之后——机器人通过什么处理方式进行梳理这部分数据,并且能够根据这个梳理完的数据,留存下载的信息,建立新的索引基础 。
这就是深度学习的表面含义 。说通俗点就是:我们在教育孩子的时候,第一次告诉他,桌子上的是碗,头顶的是灯 。最开始小朋友学会了,只知道这这两个东西 。后来他开始类比,只要是发光的,他都叫电灯 。只要是白色的放桌上都叫碗 。这种举一反三是非常合适的,这其实就属于深度学习中的数据处理单元 。大部分人喜欢用这张图来说明,深度学习 。
这么说吧,就这张图,可以说一本书的深度学习知识 。咱们普通朋友,根本听不懂 。换一张图解释一下深度学习 。这么解释一下或许更好一些:1、当你有人第一次告诉你,桌子上的东西叫碗 。你会形成一个向上的认知:碗是白色,可以盛饭,凹进去的 。2、你闭上眼,不去看那个碗 。你在大脑中,怎么描述碗?那就是一个反过来的过程:白色的,盛饭的,凹进去的就是碗 。

推荐阅读