如何对定制模型进行预训练?

可以使用Keras顺序API构建顺序模型,该API用于与普通的图层堆栈一起使用。在这里,每一层都只有一个输入张量和一个输出张量。

可以将预训练的模型用作特定数据集的基础模型。这节省了必须在特定数据集上再次训练模型的时间和资源。

预先训练的模型是一个保存的网络,该网络先前会在大型数据集上进行训练。这个大数据集将是大规模的图像分类任务。可以按需使用预训练的模型,也可以根据需求和模型对它进行定制,并进行迁移学习。

定制模型可以通过两种方式进行预训练:

特征提取

先前网络学习到的表示可用于从新样本中提取有意义的特征。可以添加一个新的分类器,该分类器将在预训练模型的基础上从头开始进行训练。这可用于重新调整先前为数据集学习的特征图的用途。

整个模型不需要重新训练。基本卷积网络将已经具有通常用于对图片进行分类的功能。

但是,预训练模型的最终分类部分相对于原始分类任务而言是特定的。这意味着它特定于训练模型的一组课程。

微调

解冻冻结模型基础的某些顶层,并将新添加的分类器层以及基础模型的最后一层一起训练。这将允许用户“微调”基本模型中的高阶特征表示。这有助于使模型与特定任务更加相关。