从机器学习谈起,机器学习方法( 二 )


得到最终模型后,我们可以使用更大的独立测试数据集来进一步评估模型的性能 。评估模型性能,我们就需要使用具体的性能指标 。根据数据集中不同类别样本的比例,我们将数据集分为均衡数据集和非均衡数据集 。均衡数据集我们可以使用准确率、损失值、马修斯系数、F1-score、ROC 曲线以及 AUC 值等指标,这类数据集的评估相对容易 。
对于非均衡数据集,我们需要谨慎的使用准确率来衡量模型性能,结合具体问题,我们一般更多的使用F1-score和ROC-AUC等指标 。5: 关于公共数据集 。现在网上有很多公开的且标注完备的数据集,包括图像的、序列的、文本的等等,为机器学习提供了良好的学习环境 。练手阶段需要充分利用这些资源!此外,机器学习不是万能的,很多情况下性能取决于数据和问题定义,不是每一个问题都能用机器学习解决 。
有没有必要把机器学习算法自己实现一遍?

从机器学习谈起,机器学习方法


如果你是个搬砖的,那不需要;如果你是个前端开发工程师,那不需要;如果你是后端开发工程师,那也不需要;如果你做人工智能或ai的应用集成工作,那实现一遍最好,不实现一遍多少会影响工作效率;如果你搞数据标注一类工作的,那也不需要;如果你做ai算法的,那必要性比较大;如果你做ai方向科研的,这应该是基本功吧 。

推荐阅读