|
Post by account_disabled on Apr 27, 2024 10:58:15 GMT 1
时我们摘了西红柿什么都有。有些更绿有些更成熟有些既不绿也不成熟等等爷爷告诉我“我要留几棵你奶奶喜欢的绿色的她会很高兴的。他在做什么他看着那些最绿或者几乎是绿的立刻就触碰了它们。如果西红柿很硬我就把它放在一边。如果它有点软我就把它留在盒子里。按颜色和质地分割西红柿在后台我的祖父正在实施聚类或分割算法。因为首先因为我根据两个特征观察西红柿颜色和纹理这是他的番茄分割的两个特点。一旦你的大脑收集了“这些数据……它就会对其进行分段。我将每个西红柿(观察)放入祖母的绿色西红柿组中其余的则作为更成熟的西红柿。请注意我在这里分为两组。分两群。 这正是我们可以利用数据做的事情。首先我们获得可以测量和量化的特征(西红柿的颜色和质地)然后我们将观察结果分组为具有这些相似特征的簇或组。玩法很简单。在西红柿的例子中 希腊移动的电话数字 易想到我们将获得哪些组。但在更复杂的问题(即需要考虑更多特征)中事情会变得复杂。聚类技术发挥着重要作用。在给您举例之前让我告诉您聚类技术是一种无监督技术。由于先验我们不知道数据中存在哪些组。免费统计培训了解如何成功分析您的项目数据。无需浪费数千小时来破译难以理解的统计公式。立即参加免费培训数据分割或聚类应用示例继我祖父的精彩番茄分割之后现在我们来看另一个例子有数据想象一下您是葡萄酒行业的专业人士。 您拥有不同葡萄酒的数据库您可以在其中测量各种特征酸度酒精含量镁含量……请注意它们是葡萄酒成分的特征。凭借这些特征我们可以酿造出具有相似成分的葡萄酒组。即统计上相似的群体。这就是细分。你会问我如何计算这个分段还有另一个问题。存在多少个组(簇)以及它们在统计上是否相关或者换句话说最佳簇数是多少让我们用一个例子来回答这些问题。下载中的示例我们通过使用矩阵图观察变量来开始算法变量矩阵图将帮助您理解变量之间的关系以及相关图相关图将帮助您了解变量之间存在什么类型的关系。在这张图片中我们将看到化学成分的哪些特征最相关(蓝色为正红色为负)下一步是对数据进行标准化以免出现单位问题。
|
|