2025年argparser（argparse模块有什么用）

科技前沿 • 2025-06-08 16:30 • 阅读 42

大家好，我是讯享网，很高兴认识大家。

注：本文仅用于记录学习过程和展示实现方法，不展开机器学习的原理

首先是环境配置，以Python为例。如果只是想要体验一下机器学习，可以直接安装官方版本（https://www.python.org/downloads/）。但要注意版本号不宜太高，因为并非所有第三方模块都有良好的向上兼容性（比如之前直播时有同学推荐用autogluon实现机器学习模型的自动化调参，但autogluon 0.8.2对Python的版本要求为“Python >=3.8, <3.11”）。如果想要正经学一下编程，可以安装集成度更高的发行版，如Anaconda，省去常用第三方模块的安装。

本文以安装官方版本的情况为例，安装后请运行“命令提示符”，安装sklearn模块，命令为：

pip install scikit-learn

输入命令后按回车并等待安装结束即可。我这里因为安装过了，所以直接提示already satisfied。正常来说会同时将其依赖的其他模块一并安装（比如后面要用的numpy）。

然后开始借（chao）鉴（xi）代码，我参考的资料是这篇博文“决策树鸢尾花算法讲解”（https://blog.csdn.net/godnightshao/article/details/）

打开IDLE，新建文件，把以上代码复制粘贴进去，保存，按F5运行即可，样子如下：

讯享网

构造模型时（即clf = DecisionTreeClassifier(random_state=0)这一行）的参数设置都是默认的，可能需要调节的参数有很多，比如分支准则（criterion）、分支选择策略（splitter）、最大深度（max_depth）、最大特征数量（max_features），这里不做展开，请自行按需学习~

测试发现，score()命令返回的是micro口径的F1 score。测试比较粗糙，也可能结论不对，保险起见还是推荐用sklearn.metrics中的f1_score()命令。

这里还有一个问题，如果我想用自己的数据来训练，要怎么办呢。在运行结果窗口中分别用type()命令和print()命令看看数据集到底长什么样子。为了能显示的下，这里只打印了数据集的前5条内容。特征和标签都是numpy的N维数组（ndarray），特征数据集在形式上是：一个样本的N维特征为1个列表，所有样本外层再套1个列表。标签数据集在形式上直接就是1个列表，内容依次为每个样本对应的标签（鸢尾花的类别，一共3种，用0、1、2表示）。这就是用于构造自己的数据集的格式要求了。

2025年argparser（argparse模块有什么用）

相关推荐