机器学习实战读书笔记(1)
机器学习的主要任务:
分类:将实例数据划分到合适的分类中
回归:主要用于预测数值型数据
分类和回归属于监督学习,监督学习必须知道预测什么,即目标变量的分类信息
无监督学习:数据没有类别信息,也不会给定目标值。
在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程称为聚类;
将寻找描述数据统计值的过程称之为密度估计。
监督学习的用途 |
k-近邻算法 线性回归 朴素贝叶斯算法 局部加权线性回归 支持向量机 Ridge回归 决策树 Lassso最小回归系数估计 |
无监督学习的用途 |
k-均值 最大期望算法 DBSCAN Parzen窗设计 |
1. 输入任意数组:
from numpy import * print(random.rand(4,4))
输出:
[[0.83142886 0.37192316 0.25799572 0.01936341] [0.70383839 0.10545903 0.31602348 0.26564487] [0.62372209 0.8856153 0.04425143 0.09811542] [0.03086031 0.70999438 0.50756522 0.89523833]]
2. 矩阵
from numpy import * rd=random.rand(4,4) #打印随机数组 print(rd) rm=mat(rd) #打印数组转化后的矩阵 print(rm) #打印矩阵的逆运算 print(rm.I)
输出
[[0.32618362 0.88181772 0.73023717 0.71091901] [0.75438306 0.55220343 0.21725572 0.83780348] [0.48311814 0.99230996 0.75381116 0.23627349] [0.22763927 0.70057059 0.81020161 0.88443622]] [[0.32618362 0.88181772 0.73023717 0.71091901] [0.75438306 0.55220343 0.21725572 0.83780348] [0.48311814 0.99230996 0.75381116 0.23627349] [0.22763927 0.70057059 0.81020161 0.88443622]] [[-5.21507507 1.46536287 2.26699771 2.19821216] [ 7.10337898 -0.59340981 -1.65174532 -4.70639109] [-6.54479433 -0.26247007 2.55419703 4.8270615 ] [ 1.71107913 0.33332533 -1.61493618 -0.12904628]]