图解机器学习是一个用图文并茂的方式来阐明机器学习(Machine Learning)的规则和算法,该网站由旧金山和纽约房屋资料的数据样本,我们将会构建一个机器学习模型来将他们区分开来。
机器学习(Machine Learning)是计算机科学的一个方向。利用统计学的技巧,机器学习算法(Machine Learning Algorithms)能够自动学习并识别数据内的规律。凭着这些规律,算法便能作出高度准确的预测。
假设我们必须凭数据预测一栋房屋是位于纽约市, 我们应该怎样开始呢?在机器学习中,这是一种分类任务。 (Classification Task)。如果你到过旧金山,你可能会知道那里的地形是出了名的高低不平。所以不妨让我们从房屋的海拔入手,看看房屋的海拔信息能不能协助我们去区分它们。
在数据里寻找规律就是机器学习的基础。所有的机器学习算法都是使用统计学习去快速地找到最佳的分界。其中介绍了一种叫决策树的机器学习算法。决策树十分简单,它会逐一分析数据内的维度,从而去寻找分界线。