更新 机器学习.md

This commit is contained in:
admin 2025-06-10 06:42:49 +00:00
parent c5e2383475
commit 297f2ee32b

View File

@ -39,7 +39,7 @@
### 聚类
- 聚合 (agglomerative) 或自下而上 (bottom-up) 聚类1. 构造 N 个类每个类只包含一个样本2. 合并类间距离最小的两个类3. 计算新类与当前各类的距离重复以上步骤,直到类的个数达到阙值。复杂度是 $O(N^3m)$: $\sum_{i=1}^N i^2$再乘以维度m.
- 聚合 (agglomerative) 或自下而上 (bottom-up) 聚类1. 构造 N 个类每个类只包含一个样本2. 合并类间距离最小的两个类3. 计算新类与当前各类的距离重复以上步骤,直到类的个数达到阙值。复杂度是 $O(N^3m)$: $\sum_{i=1}^N i^2$ 再乘以维度m.
- 分裂聚类自上而下1.将所有数据点视为一个聚类。2.选择一个聚类进行分裂。3. 将所选聚类分裂为两个或多个子聚类。4.用新子聚类更新聚类集合。5. 重复对子聚类重复步骤2-4。6.达到预定条件(如聚类数目或质量标准)后停止
- k-means: 最小化类内方差也叫类内平方和
- Lloyd 算法1. 初始化令 t = 0 选择 k 个样本点作为初始聚类中心; 2. 根据上一步的中心进行聚类E步3. 重新计算步骤2的中心M步。 缺点:不平衡即不同类中样本的数量差异很大