scikit-learn库如何用于在Python中加载数据?

Scikit-learn,通常称为sklearn,是Python中的一个开源库,用于实现机器学习算法。

在Python强大而稳定的界面的帮助下,这包括分类,回归,聚类,降维等等。该库基于Numpy,SciPy和Matplotlib库构建。

让我们看一个加载数据的例子-

示例

from sklearn.datasets import load_iris
my_data = load_iris()
X = my_data.data
y = my_data.target
feature_name = my_data.feature_names
target_name = my_data.target_names
print("函数名称是: ", feature_name)
print("目标名称是: ", target_name)
print("\n数据集的前8行是: \n", X[:8])

输出结果

函数名称是: ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
目标名称是: ['setosa' 'versicolor' 'virginica']
数据集的前8行是:
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]]


说明

  • 将导入所需的包。

  • 也需要将其加载到环境中。

  • 特征和目标值与数据集分离。

  • 这些特征和目标都打印在控制台上。

  • 另外,要查看数据示例,前8行数据将打印在控制台上。