实验课程

THIS NAME

实验课程

当前位置: 首页 >> 实验课程 >> 正文

数据挖掘与数据仓储-数据的聚类分析综合实验

发布日期:2024-03-05    作者:王清洋     来源:     点击:

数据的聚类分析综合实验

一、实验目的

1、熟悉典型的聚类算法

2、掌握典型聚类算法的特性

二、实验设备与器件

计算机、Python语言开发环境

三、实验内容

1.利用聚类算法对Iris数据集构建聚类分析。

参考代码:

from sklearn.datasets import load_iris  

from sklearn.cluster import KMeans  

iris = load_iris()    #加载数据集

X = iris.data  

estimator = KMeans(n_clusters = 3)    #构造K-Means聚类模型

estimator.fit(X)  #数据导入模型进行训练

label_pred = estimator.labels_   #获取聚类标签

print(label_pred)

#显示各个样本所属的类别标签

2.客户价值分析,并使用聚类算法对客户进行分群。

1)数据探索

2)数据清洗RFM值计算

3)数据标注化

4)聚类分析

参考代码:

Data_view.py  数据探索

 

 

Data_clean.py   数据清洗

 

 

Data_transform.py  数据标准化

 

Data_Kmens.py   聚类分析

 

 

 

上一条:计算机通信与网络-网络命令的使用实验 下一条:数据挖掘与数据仓储-分类分析综合实验

关闭