supervised,半监督学习( 二 )


(2)回归分析回归分析反映了数据库中数据的属性值的特性,通过函数表达数据映射的关系来发现属性值之间的依赖关系 。比如,我们有了过去三年的销售数据,我们就可以抽象出影响销售的因素,对未来的销售数据做出预测 。(3)聚类 。聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别 。(4)关联规则关联规则是隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现 。
我们最喜欢举得例子,就是爸爸去超市购物的例子,爸爸去超市买奶粉,如果在旁边放上爸爸喜欢的啤酒起子、酒精饮料,肯定能引导消费 。(5)神经网络方法 。神经网络作为一种先进的人工智能技术,因其自身自行处理、分布存储和高度容错等特性非常适合处理非线性的以及那些以模糊、不完整、不 严密的知识或数据为特征的处理问题,它的这一特点十分适合解决数据挖掘的问题 。
目前的大数据处理,已经不是结构数据为天下,而是有大量文本、音频、视频、图像等非线性数据,所以基于神经网络的深度学习算法,目前已经蓬勃发展,不可阻挡的改变着一切 。(6)Web数据挖掘 。Web数据挖掘是一项综合性技术,指Web 从文档结构和使用的集合C 中发现隐含的模式P,如果将C看做是输入,P 看做是输出,那么Web 挖掘过程就可以看做是从输入到输出的一个映射过程 。

推荐阅读