Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架,与Python结合使用以实现算法,深度学习应用程序等等。它用于研究和生产目的。它具有优化技术,可帮助快速执行复杂的数学运算。这是因为它使用NumPy和多维数组。这些多维数组也称为“张量”。
该框架支持使用深度神经网络。它具有高度的可扩展性,并带有许多流行的数据集。它使用GPU计算并自动管理资源。它附带了大量的机器学习库,并且有很好的支持和文档记录。该框架能够运行深度神经网络模型,对其进行训练,并创建预测相应数据集相关特征的应用程序。
“ tensorflow”包可以使用下面的代码行安装在 Windows 上
pip install tensorflow
Tensor是TensorFlow中使用的一种数据结构。它有助于连接流程图中的边。这个流程图被称为“数据流图”。张量只不过是一个多维数组或一个列表。可以使用三个主要属性来识别它们-
Rank-讲述张量的维数。可以理解为张量的顺序或已定义的张量中的维数。
Type-它告诉与张量元素关联的数据类型。它可以是一维,二维或n维张量。
Shape -它是行和列的总数。
我们正在使用Google合作实验室来运行以下代码。Google Colab或Colaboratory可帮助在浏览器上运行Python代码,并且需要零配置并免费访问GPU(图形处理单元)。合作已建立在Jupyter Notebook的基础上。
以下是代码片段-
AUTOTUNE = tf.data.experimental.AUTOTUNE print("定义了configure_dataset方法") def configure_dataset(dataset): return dataset.cache().prefetch(buffer_size=AUTOTUNE) print("在训练数据集上调用该函数") binary_train_ds = configure_dataset(binary_train_ds) print("在验证数据集上调用该函数") binary_val_ds = configure_dataset(binary_val_ds) print("在测试数据集上调用该函数") binary_test_ds = configure_dataset(binary_test_ds) int_train_ds = configure_dataset(int_train_ds) int_val_ds = configure_dataset(int_val_ds) int_test_ds = configure_dataset(int_test_ds)
代码-https://www.tensorflow.org/tutorials/load_data/text
输出结果
定义了configure_dataset方法 在训练数据集上调用该函数 在验证数据集上调用该函数 在测试数据集上调用该函数
定义两种方法以确保在加载数据时输入或输出不会阻塞,这一点很重要。
“cache”方法将数据保存在内存中,即使数据已从磁盘加载。
这样可以确保数据在培训期间不会成为障碍。
“预取”方法在训练过程中重载数据预处理和模型执行。