如何编写 Python 脚本,介绍决策树

A widely recognized collection for machine learning tasks.
Post Reply
tanjimajha12
Posts: 194
Joined: Mon Dec 23, 2024 4:56 am

如何编写 Python 脚本,介绍决策树

Post by tanjimajha12 »

我们首先导入它,就像导入所有依赖项一样。我们将使用“-scikit-learn”中名为 tree 的特定子模块,它将让我们构建一个称为决策树的机器学习模型。决策树就像存储数据的流程图。它会向收到的每个标记数据点询问一个是或否的问题。

它是否包含 X。如果答案是肯定的,数据就向一个方向移动。如果答案是否定的,数据就向另一个方向移动。它会在树中构建每个节点,它接收的数据点越多。然后,当我们有一个新 印度手机号码列表 的未标记的数据点时,我们可以将其提供给树。它会问它一系列问题,直到它标记它。那个标签就是我们的分类。

决策路径 1
决策树
我们训练的数据越多,分类就越准确。让我们从以编程方式创建数据集开始。我们将第一个变量 X 写为列表列表,变量是一个可以更改的值,我们将在其中存储一个列表列表。列表是 Python 中的一种数据类型,可以存储一系列值。

这里每个值本身都是一个列表,其中包含三个数字,分别代表一个人的长度、宽度和鞋号。我们将忽略这些数字,因此我们的数据集大小只有 11 个人。我们将再写一个名为 Y 的变量来存储标签列表。每个标签都代表一个性别,并与上一个列表中的身体指标列表相关联。

我们将它们写为字符串,这是一种用于表示文本而不是数字的数据类型。现在我们有了数据集,我们需要定义一个变量来存储我们的决策树模型。我们称之为 CLF - Classifier 的缩写,它将存储我们的决策树分类器。

我们可以通过在此处调用它来直接引用我们的树依赖关系,并通过调用树对象上的决策树方法来初始化决策树。现在我们有了树变量,我们可以在数据集上训练它。我们将在分类器变量上调用 fit 方法,该方法接受两个参数,将我们的 x 和 y 变量存储为参数,结果将存储在更新的 CLF 变量中。fit 方法在我们的数据集上训练决策树。
Post Reply