然而,分类数据集

17日视图(30天)

显示旧的评论

玛丽Gh 2020年12月31日

0
链接

这个问题直接联系

//www.tatmou.com/matlabcentral/answers/706058-knn-classification-on-a-dataset

评论道: 梅林toche2023年2月16日

答:接受图像分析

toy_data_csv.zip

嗨我有这个数据集,我想资讯分类,还发现精度性能的分类和显示的数量错了,真正的分类混淆矩阵。任何一个可以帮我请。

3评论
显示2年长的评论隐藏2年长的评论

玛丽Gh 2020年12月31日

实际上我不认为它们代表什么都没有说

登录置评。

在回答这个问题。

接受的答案

图像分析 2020年12月31日

0
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/706058-knn-classification-on-a-dataset answer_588548

kNearestNeighbor.m

所以一个是火车,另一个“培训”是验证(运行它通过,看看准确预测比较已知值),第三个是一个测试集(你不知道正确的答案)。

我附上了资讯演示。看你能不能适应,你的作业问题。如果没有,回来更多的提示。

资讯的工作方式是您指定K,数据和类数,每个数据点属于(它是“真正的”类的任务)。例如如果你有100的数据训练点(100 x 100 y向量)和5类,那么你必须有一个训练向量说什么类数的100训练点。例如,如果trainingClasses = (1、3、5、2、.......3 2]然后说训练点1是定义为类的成员1,和培训2定义是3班的一员,和培训3点定义为类的成员,和训练点4定义是二班的一员,和…训练点99定义3班的一员,和训练点100定义的是二班的一员。

现在你可以叫knnsearch,它会告诉你在训练集K指标,每一个点在您的测试集是最接近

                                   % - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
                                  
                                   %现在做一个K最近邻搜索。
                                  
                                   %得到未知的类数据。
                                  
                                   %首先收集所有训练数据到一个高的数组
                                  
                                   trainingCoords = [x_Train (:), y_Train (:))
                                  
                                      trainingCoords =
                                      10×2
                                     
                                       4.0000 3.0000 5.2000 4.5000 6.0000 7.0000 6.3000 1.3000 7.0000 8.0000 9.0000 6.0000 5.0000 5.0000 11.0000 7.0000 8.0000 8.0000 10.0000 9.1000

                                   unknownCoords = [x_test (:), y_test (:))
                                  
                                      unknownCoords =
                                      10×2
                                     
                                       0.8000 1.0000 7.2000 9.0000 14.0000 4.8000 6.5000 17.0000 2.0000 5.9000 4.1000 12.0000 5.0000 14.0000 18.0000 16.0000 4.3000 3.4000 3.6000 2.9000

                                   (索引、distancesOfTheIndexes) = knnsearch (trainingCoords unknownCoords,…
                                  
                                   “NSMethod”,“详尽”,…
                                  
                                   “k”5,…% 5最近的点的索引
                                  
                                   “距离”,“欧几里得”)%定期毕达哥拉斯距离公式
                                  
                                      指数=
                                      10×5
                                     
                                       1 4 2 7 3 5 9 3 10 6 8 6 7 8 9 10 5 9 3 2 1 3 5 5 3 9 10 7 5 9 10 3 6 10 8 9 6 5 1 2 7 4 3 1 2 7 4 3

                                      distancesOfTheIndexes =
                                      10×5
                                     
                                       3.7736 5.5082 5.6223 5.8000 7.9398 1.0198 1.2806 2.3324 2.8018 3.4986 3.7202 5.1420 5.8728 6.8000 7.6968 8.6406 9.0139 9.1241 10.0125 10.9659 3.1321 3.4928 3.5228 4.1485 5.4231 4.9406 5.3488 5.5866 6.5742 7.0576 6.3246 6.7082 7.0007 7.0711 8.9443 10.5646 11.4018 12.8062 13.4536 13.6015 0.5000 1.4213 1.7464 2.9000 3.9812 0.4123 2.2627 2.5239 3.1385 4.7508

                                   %提取的类

现在你可以看到,点1的测试集是最接近点1、4、2、7和3的训练集,为了减少亲密的距离(增加)。如果我想确定5点训练的课程,我需要知道他们是什么类——“true”类,他们毫无疑问。例如如果点1、4和2都在3班,然后大部分的点附近测试点1类3所以我们现在要定义测试点1是在3班。

这是资讯。解释它吗?

与kmeans现在,你没有一个训练集,因为它是一个upsupervised分类。你是一个训练集和一个已知/所需数量的集群强迫他们。所以它将试图找出集群和分配未知点的k集群。但是没有地面真理,或者训练集,你知道真实的类的任何点。

图像分析 2023年1月6日

@merlin toche 不知道这意味着什么,但在你的个人资料,它只说你提交一个问题,一个答案。如果你有问其他问题在评论别人的问题,那就不会出现。这就是为什么最好问自己的问题在自己的线程,而不是试图在别人的线程的问题,像在这里一样 @Mary Gh 的线程。她会发邮件每次活动线程。

登录置评。

答案(1)

梅林toche 2022年12月9日

0
链接

直接链接到这个答案

//www.tatmou.com/matlabcentral/answers/706058-knn-classification-on-a-dataset answer_1123957

谢谢你先生对所有你为我做。解释和理解。请原谅我继续打扰你,我仍然学习机器学习,对我来说你是一个好老师。我有两个问题先生:

后我的第一个问题是爵士分区数据(我使用cvpartion mydata1 =兰德(150.4);

% cross-variation(火车:80%,测试:20%)

简历= cvpartition(大小(mydata1, 1),“坚持”,0.2);

idx = cv.test;

%的训练和测试数据

mydata1_train = mydata1 (~ idx:);

mydata1_test = mydata1 (idx:);

%数据评估),命令用来做这项工作你就向我解释吗?例如150年的数据分区,我还需要声明以下向量在工作之前你向我解释吗?如果不是我必须调用这个数据为了建立它吗?

x_Train = [4 5 6 7 8;5.2 - 6.3 9 11 10];

y_Train = [3 7 8 5 8; 4.5 9.1 1.3 6 7];

x_test = [0.8 14 2 5 4.3;3.6 7.2 6.5 4.1 18];

y_test = [1 2.9 4.8 5.9 14 3.4 9 17 12 16);

(“没有”,“OCF”,“自洽场”,“P”,“作为”,“OCI”)

致以最亲切的问候

4评论
显示3年长的评论隐藏3年长的评论

梅林toche 2023年2月16日

嗨 @Image分析师

有人能帮我吗?

我想使用fuzzy-KNN算法检测一系列的缺点。对于这个我有5名数据类,我写的代码,但错误出现,我希望你的帮助重读,并做出必要的修正。

我的代码和数据集

谢谢

登录置评。

在回答这个问题。

类别

人工智能,数据科学和统计数据统计和机器学习工具聚类分析最近的邻居

找到更多的在最近的邻居在帮助中心和文件交换

下载188bet金宝搏

统计和机器学习工具

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!

然而,分类数据集

3评论
显示2年长的评论隐藏2年长的评论

接受的答案

21日的评论
显示20年长的评论隐藏20年长的评论

答案(1)

4评论
显示3年长的评论隐藏3年长的评论

另请参阅

类别

标签

下载188bet金宝搏

社区寻宝

然而,分类数据集

3评论 显示2年长的评论隐藏2年长的评论

接受的答案

21日的评论 显示20年长的评论隐藏20年长的评论

答案(1)

4评论 显示3年长的评论隐藏3年长的评论

另请参阅

类别

标签

下载188bet金宝搏

社区寻宝

3评论
显示2年长的评论隐藏2年长的评论

21日的评论
显示20年长的评论隐藏20年长的评论

4评论
显示3年长的评论隐藏3年长的评论