请问有哪些关于大数据以及hadoop好的学习课程？ spark聚类

2020-10-08知识21

聚类分析时，分类变量该怎么处理？我使用k-means对数据进行聚类分析，资料提到，分类变量不适合用k-means，提出的解决方案有用汉明距离。资…

sparkr做kmeans 聚类能指定迭代次数吗？怎么指定？我把K-mediods的matlab代码贴出来，你好2113好学习5261一下function label=kmedoids(data，k，start_data)kmedoids k中心点算法函数data 待聚类的数据4102集，每一行1653是一个样本数据点k 聚类个数start_data 聚类初始中心值，每一行为一个中心点，有cluster_n行class_idx 聚类结果，每个样本点标记的类别初始化变量n=length(data)；dist_temp1=zeros(n，k)；dist_temp2=zeros(n，k)；last=zeros(n，1)；a=0；b=0；if nargin=3centroid=start_data；elsecentroid=data(randsample(n，k)，：)；endfor a=1：ktemp1=ones(n，1)*centroid(a，：)；dist_temp1(：，a)=sum((data-temp1).^2，2)；end[~，label]=min(dist_temp1，[]，2)；while any(label~=last)for a=1：ktemp2=ones(numel(data(label=a))，1)；temp3=data(label=a)；for b=1：ntemp4=temp2*data(b，：)；temp5=sum((temp3-temp4).^2，2)；dist_temp2(b，a)=sum(temp5，1)；endend[~，centry_indx]=min(dist_temp2，[]，1)；last=label；centroid=data(centry_indx，：)；for a=1：ktemp1=ones(n，1)*centroid(a，：)；dist_temp1(：，a)=sum((data-temp1).^2，2)；end[~，label]=min(dist_temp1，[]，2)；endend

请问有哪些关于大数据以及hadoop好的学习课程？ spark聚类