相比传统的机器学习,大数据下的机器学习大大扩充了样本的数量,使很多问题的分类都有丰富的样本作为支撑,这是大数据的优势,但同时也会由此产生很多问题。现在随着硬件技术和编程算法的不断优化,数据的采集和量级已经不再是阻碍大数据研究的主要问题。而数据之间的关系,即数据哪些数据是有用的,哪些是冗余的甚至是对其他数据造成干扰,这些数据之间有时如何作用的才是目前大数据所面临的主要挑战。而大数据在我们社会的各个方面存在着巨大的潜在价值,从大数据中获取有价值的信息却不是一个简单的任务。要从体量巨大、结构繁多的数据中挖掘出潜藏在数据中的规律和我们所需要信息,从而使数据发挥最大化的价值,是大数据技术的一个核心目标。 一般认为传统的机器学习是浅层次的学习架构,与之相反的,深度学习则是指机器学习技术在监督或非监督的情况下自动的学习深层次的架构并且用于分类或进行数据挖掘。并且把机器学习的算法应用到各个领域中。以下是结合本系统的一些算法: 1.向量分类 Classification (SVMs)
2.聚类 Clustering (GMMs)
3.决策树 Decision Trees
4.特征选择 Feature Selection (SVMs)
5.拟合 Fitting (RANSAC)
6.回归 Regression (SVMs)
7.人工神经网络 Classification (ANNs) 8.主成分分析 Analysis (PCA) |
Copyright © 2016 Comsenz Inc. All Rights Reserved. By Discuz! X3.2 ( 京ICP备2020048381号-1(https://beian.miit.gov.cn) )