然而,分类数据集
17日视图(30天)
显示旧的评论
接受的答案
图像分析
2020年12月31日
所以一个是火车,另一个“培训”是验证(运行它通过,看看准确预测比较已知值),第三个是一个测试集(你不知道正确的答案)。
我附上了资讯演示。看你能不能适应,你的作业问题。如果没有,回来更多的提示。
21日的评论
玛丽Gh
2021年1月2日
谢谢你的帮助确实工作但是我不得不转置培训坐标和未知坐标工作有任何问题,如果我这样做吗? ?和i need another hint please actually i also want to find accuracy of performance of this classification and showing the number of wrong and true classifications with confusion matrix And also how can i make a validation set....thanks in advance
图像分析
2021年1月2日
你必须有一组观察,你知道——类的绝对正确的答案。如果你不,你如何评估的准确性吗?然后你把已知的“地面实况”的一部分数据,80%之类和培训。然后剩下的20%是你的验证集。通过knnsearch运行那些(),看看类分配给每个观察。既然你知道真相的那些,你可以确定它有正确的百分比。
Frisda Sianipar
2021年4月29日
这是我的代码
但错误当我运行这段代码
x = readtable (“datatraining.xlsx”);
latih = x;
组= latih (: 3);
latih = [latih (: 1) latih (:, 2)];
为i = 1: 80
y = readtable (“datatesting.xlsx”);
山姆普尔= y;
山姆普尔测试=[(:1)山姆普尔(:,2)];
山姆普尔% = (2.6136 0.1284 1.3017 -0.8089 0.0441 0,2084);
hasil = knnclassify(测试、latih集团);
结束
nama =“hasil KNN.xlsx”;
山姆普尔hasil =[(: 1)山姆普尔(:,2)山姆普尔(:,3)hasil);
hasil xlswrite (nama);
图像分析
2021年5月1日
编辑:图像分析
2021年5月1日
@Frisda Sianipar
,你忘了阅读发布指导方针。
这意味着你忘了附上你的“datatraining。xlsx“因此推迟一个答案。所以,我能做什么,没有数据处理?开始一个
新
问题,这一次附加代码,截图,xlsx工作簿。
图像分析
2021年5月2日
Frisda Sianipar
2021年5月4日
@Image分析师
先生,很抱歉打扰你的时间。这个任务很快就会被收集,但直到现在我还没有找到一个解决错误,我已发布先生先生。你能帮我找到我的任务的解决方案吗?谢谢提前
梅林toche
2022年12月1日
嗨
请任何人都可以帮我做这个问题。我要计算欧氏距离的数据集使用资讯
我有例如训练和测试数据以及类。
x_Train = [4 5 6 7 8;5.2 - 6.3 9 11 10];
y_Train = [3 7 8 5 8; 4.5 9.1 1.3 6 7];
x_test = [0.8 14 2 5 4.3;3.6 7.2 6.5 4.1 18]
y_test = [14 1 4.8 5.9 3.4; 2.9 9 17 12 16)
trainingclass = [1 2 2 1 1]
谢谢你
梅林toche
2022年12月3日
编辑:图像分析
2022年12月3日
谢谢你,先生的反馈。
我的前一个问题,
x_Train = [4 5 6 7 8;5.2 - 6.3 9 11 10];
y_Train = [3 7 8 5 8; 4.5 9.1 1.3 6 7];
x_test = [0.8 14 2 5 4.3;3.6 7.2 6.5 4.1 18]
y_test = [14 1 4.8 5.9 3.4; 2.9 9 17 12 16)
我有六个类即
trainclass = [“没有”,“OCF”,“自洽场”,“P”,“作为”,“公盟”的]
k值是5。请先生我不明白你说的真正的类。
先生其他问题,请我分区使用cvpartition命令数据训练和测试数据
例如的分数
示例数据(150 x4)
mydata1 =兰德(150.4);
%交叉变异(火车:80%,测试:20%)
简历= cvpartition(大小(mydata1, 1),“坚持”,0.2);
idx = cv.test;
%的训练和测试数据
mydata1_train = mydata1 (~ idx:);
mydata1_test = mydata1 (idx:);
%的评价数据
我想知道一个可以构建这样的一个基准测试和训练点出现。
谢谢你的支持。金宝app
图像分析
2022年12月3日
我不知道这意味着什么
x_Train = [4 5 6 7 8;5.2 - 6.3 9 11 10]
x_Train =
2×5
4.0000 6.0000 7.0000 5.0000 8.0000 5.2000 6.3000 9.0000 11.0000 10.0000
y_Train = [3 7 8 5 8; 4.5 9.1 1.3 6 7]
y_Train =
2×5
3.0000 7.0000 8.0000 5.0000 8.0000 4.5000 1.3000 6.0000 7.0000 9.1000
x_test = [0.8 14 2 5 4.3;3.6 7.2 6.5 4.1 18]
x_test =
2×5
0.8000 14.0000 2.0000 5.0000 4.3000 7.2000 6.5000 4.1000 18.0000 3.6000
y_test = [14 1 4.8 5.9 3.4; 2.9 9 17 12 16)
y_test =
2×5
1.0000 4.8000 5.9000 14.0000 3.4000 9.0000 17.0000 12.0000 16.0000 2.9000
trainclass = [“没有”,“OCF”,“自洽场”,“P”,“作为”,“公盟”的]
trainclass =“NoneOCFSCFPSBDOCI”
为什么有两排在你的x和y值吗?
你认为你要和资讯kmeans困惑吗?
资讯的工作方式是您指定K,数据和类数,每个数据点属于(它是“真正的”类的任务)。例如如果你有100的数据训练点(100 x 100 y向量)和5类,那么你必须有一个训练向量说什么类数的100训练点。例如,如果trainingClasses = (1、3、5、2、.......3 2]然后说训练点1是定义为类的成员1,和培训2定义是3班的一员,和培训3点定义为类的成员,和训练点4定义是二班的一员,和…训练点99定义3班的一员,和训练点100定义的是二班的一员。
现在你可以叫knnsearch,它会告诉你在训练集K指标,每一个点在您的测试集是最接近
% - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
%现在做一个K最近邻搜索。
%得到未知的类数据。
%首先收集所有训练数据到一个高的数组
trainingCoords = [x_Train (:), y_Train (:))
trainingCoords =
10×2
4.0000 3.0000 5.2000 4.5000 6.0000 7.0000 6.3000 1.3000 7.0000 8.0000 9.0000 6.0000 5.0000 5.0000 11.0000 7.0000 8.0000 8.0000 10.0000 9.1000
unknownCoords = [x_test (:), y_test (:))
unknownCoords =
10×2
0.8000 1.0000 7.2000 9.0000 14.0000 4.8000 6.5000 17.0000 2.0000 5.9000 4.1000 12.0000 5.0000 14.0000 18.0000 16.0000 4.3000 3.4000 3.6000 2.9000
(索引、distancesOfTheIndexes) = knnsearch (trainingCoords unknownCoords,…
“NSMethod”,“详尽”,…
“k”5,…% 5最近的点的索引
“距离”,“欧几里得”)%定期毕达哥拉斯距离公式
指数=
10×5
1 4 2 7 3 5 9 3 10 6 8 6 7 8 9 10 5 9 3 2 1 3 5 5 3 9 10 7 5 9 10 3 6 10 8 9 6 5 1 2 7 4 3 1 2 7 4 3
distancesOfTheIndexes =
10×5
3.7736 5.5082 5.6223 5.8000 7.9398 1.0198 1.2806 2.3324 2.8018 3.4986 3.7202 5.1420 5.8728 6.8000 7.6968 8.6406 9.0139 9.1241 10.0125 10.9659 3.1321 3.4928 3.5228 4.1485 5.4231 4.9406 5.3488 5.5866 6.5742 7.0576 6.3246 6.7082 7.0007 7.0711 8.9443 10.5646 11.4018 12.8062 13.4536 13.6015 0.5000 1.4213 1.7464 2.9000 3.9812 0.4123 2.2627 2.5239 3.1385 4.7508
%提取的类
现在你可以看到,点1的测试集是最接近点1、4、2、7和3的训练集,为了减少亲密的距离(增加)。如果我想确定5点训练的课程,我需要知道他们是什么类——“true”类,他们毫无疑问。例如如果点1、4和2都在3班,然后大部分的点附近测试点1类3所以我们现在要定义测试点1是在3班。
这是资讯。解释它吗?
与kmeans现在,你没有一个训练集,因为它是一个upsupervised分类。你是一个训练集和一个已知/所需数量的集群强迫他们。所以它将试图找出集群和分配未知点的k集群。但是没有地面真理,或者训练集,你知道真实的类的任何点。
图像分析
2023年1月5日
我不能运行一个图像,但它说你没有相同数量的元素在trainClass x_train元素。有多少人在每个向量?他们必须有相同数量的元素。
添加这个后分配trainClass和之前你叫情节():
如果元素个数(trainClass) ~ =元素个数(x_train)
errorMessage = sprintf (“错误数量的培训课程。\ ntrainClass应该% d元素(比如x_train),而是要有% d元素。\ n”,…
元素个数(x_train),元素个数(trainClass))
uiwait (errordlg (errorMessage));
返回;
结束
图像分析
2023年1月6日
@merlin toche
不知道这意味着什么,但在你的个人资料,它只说你提交一个问题,一个答案。如果你有问其他问题在评论别人的问题,那就不会出现。这就是为什么最好问自己的问题在自己的线程,而不是试图在别人的线程的问题,像在这里一样
@Mary Gh
的线程。她会发邮件每次活动线程。
答案(1)
梅林toche
2022年12月9日
谢谢你先生对所有你为我做。解释和理解。请原谅我继续打扰你,我仍然学习机器学习,对我来说你是一个好老师。我有两个问题先生:
后我的第一个问题是爵士分区数据(我使用cvpartion mydata1 =兰德(150.4);
% cross-variation(火车:80%,测试:20%)
简历= cvpartition(大小(mydata1, 1),“坚持”,0.2);
idx = cv.test;
%的训练和测试数据
mydata1_train = mydata1 (~ idx:);
mydata1_test = mydata1 (idx:);
%数据评估),命令用来做这项工作你就向我解释吗?例如150年的数据分区,我还需要声明以下向量在工作之前你向我解释吗?如果不是我必须调用这个数据为了建立它吗?
x_Train = [4 5 6 7 8;5.2 - 6.3 9 11 10];
y_Train = [3 7 8 5 8; 4.5 9.1 1.3 6 7];
x_test = [0.8 14 2 5 4.3;3.6 7.2 6.5 4.1 18];
y_test = [1 2.9 4.8 5.9 14 3.4 9 17 12 16);
(“没有”,“OCF”,“自洽场”,“P”,“作为”,“OCI”)
致以最亲切的问候
4评论
图像分析
2023年1月4日
你有这个:
x_train = mydata1_train (: 1);% (4 5 6 7 8);
y_train = mydata1_train (:, 2);% (3 7 8 5 8);
%现在你说你的类c =(“开放,”短”、“短”、“开放”、“开放”)
%,所以让我们做这类数字。
trainClass = [1、2、2、1、1);
然而你x_train和y_train有120个元素。所以你需要定义trainClass也有120个元素。你需要知道的每一个“真实的”类训练点。现在你只有5,而不是120年。
一个错误发生
无法完成的行动,因为页面所做的更改。重新加载页面更新状态。
你也可以从下面的列表中选择一个网站
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。