python机器学习API介绍20: 密度聚类及其用法

python机器学习API介绍20: 密度聚类及其用法


密度聚类(DBSCAN)是scikit-learn提供的密度聚类算法模型 , 其原型为:

class sklearn.cluster.DBSCAN(eps=0.5 min_samples=5  metric='euclidean' algorithm='auto' leaf_size=30 p=None random_state=None)

参数说明:

eps:E参数 , 用于确定邻域大小 。

min_samples:MinPts参数 , 用于判断核心对象 。
metric:一个字符串或者一个可调用对象 , 用于计算距离 , 如果是字符串 , 则必须是在metircs.pairwise.caculate中指定 。

algorithm:一个字符串 , 用于计算两点间距离并找出最近邻的点 , 当值为auto的时候 , 表示由算法自动找出最合适的算法;当为ball_tree时 , 表示使用ball树来搜索;当为kd_tree的时候 , 表示使用KDTree来搜索;当为brute表示使用暴力搜索 。

推荐阅读