如何编写 Python 脚本，介绍决策树

tanjimajha12 · Post by **tanjimajha12** » Sun Mar 02, 2025 10:18 am

我们首先导入它，就像导入所有依赖项一样。我们将使用“-scikit-learn”中名为 tree 的特定子模块，它将让我们构建一个称为决策树的机器学习模型。决策树就像存储数据的流程图。它会向收到的每个标记数据点询问一个是或否的问题。

它是否包含 X。如果答案是肯定的，数据就向一个方向移动。如果答案是否定的，数据就向另一个方向移动。它会在树中构建每个节点，它接收的数据点越多。然后，当我们有一个新印度手机号码列表的未标记的数据点时，我们可以将其提供给树。它会问它一系列问题，直到它标记它。那个标签就是我们的分类。

决策路径 1
决策树
我们训练的数据越多，分类就越准确。让我们从以编程方式创建数据集开始。我们将第一个变量 X 写为列表列表，变量是一个可以更改的值，我们将在其中存储一个列表列表。列表是 Python 中的一种数据类型，可以存储一系列值。

这里每个值本身都是一个列表，其中包含三个数字，分别代表一个人的长度、宽度和鞋号。我们将忽略这些数字，因此我们的数据集大小只有 11 个人。我们将再写一个名为 Y 的变量来存储标签列表。每个标签都代表一个性别，并与上一个列表中的身体指标列表相关联。

我们将它们写为字符串，这是一种用于表示文本而不是数字的数据类型。现在我们有了数据集，我们需要定义一个变量来存储我们的决策树模型。我们称之为 CLF - Classifier 的缩写，它将存储我们的决策树分类器。

我们可以通过在此处调用它来直接引用我们的树依赖关系，并通过调用树对象上的决策树方法来初始化决策树。现在我们有了树变量，我们可以在数据集上训练它。我们将在分类器变量上调用 fit 方法，该方法接受两个参数，将我们的 x 和 y 变量存储为参数，结果将存储在更新的 CLF 变量中。fit 方法在我们的数据集上训练决策树。