如何使用TensorFlow清理数据以预测Auto MPG数据的燃油效率?

Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架,与Python结合使用以实现算法,深度学习应用程序等等。

可以使用下面的代码行在Windows上安装'tensorflow'软件包-

pip install tensorflow

Tensor是TensorFlow中使用的数据结构。它有助于连接流程图中的边缘。该流程图称为“数据流程图”。张量不过是多维数组或列表。

回归问题背后的目的是预测连续或离散变量的输出,例如价格,概率,是否下雨等等。

我们使用的数据集称为“自动MPG”数据集。它包含了1970年代和1980年代汽车的燃油效率。它包括诸如重量,马力,位移等属性。因此,我们需要预测特定车辆的燃油效率。

我们正在使用Google合作实验室来运行以下代码。Google Colab或Colaboratory可以帮助通过浏览器运行Python代码,并且需要零配置和对GPU(图形处理单元)的免费访问。合作已建立在Jupyter Notebook的基础上。

以下是代码片段,我们将看到如何使用TensorFlow使用Auto MPG数据集清洁数据以预测燃油效率-

示例

print("Data cleaning has begun")
dataset.isna().sum()
dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})

print("Data cleaning complete!")
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')

print("A sample of dataset after data cleaning :")
dataset.head(4)

代码信用-https ://www.tensorflow.org/tutorials/keras/regression

输出结果

Data cleaning has begun
Data cleaning complete!
A sample of dataset after data cleaning −


手脉气瓶移位马力重量加速模特年欧洲日本美国
018.08307.0130.03504.012.070001
115.08350.0165.03693.011.570001
2个18.08318.0150.03436.011.070001
316.08304.0150.03433.012.070001

解释

  • 数据清除首先删除数据集中存在的“ nan”。

  • “映射”功能用于将标签映射到列名。

  • 控制台上显示数据清理后的数据集样本。

猜你喜欢