第二周作业文本分析,文本分类算法( 六 )


然后,我们将使用metrics模块的各种功能来查看模型的准确性,准确性和召回率 。1)准确性是指我们的模型做出的完全正确的预测总数中的百分比 。2)精度描述了我们预测中真实阳性与真实阳性加假阳性的比率 。3)回忆描述了我们的预测中真实阳性与真实阳性加假阴性的比率 。上面的文档链接提供了每个术语的更多详细信息和更精确的定义,但最重要的是,所有三个指标的测量范围均为0到1,其中1完全正确地预测了所有指标 。
因此,模型的得分越接近1,就越好 。换句话说,总体而言,我们的模型在94.1%的时间内正确地识别了评论的情绪 。当它预测评论是正面的时,该评论实际上在95%的时间内是正面的 。当进行正面评价时,我们的模型将其确定为正面评价的时间为98.6%资源和后续步骤在大数据分析Python中spaCy文本分类使用教程的整个过程中,我们已经从执行一些非常简单的文本分析操作spaCy到使用来构建自己的机器学习模型scikit-learn 。

推荐阅读