模型构建
1 2 3 4 5 6 7 8 9 10 11 12
| import tensorflow as tf from tensorflow.keras import layers print(tf.__version__) print(tf.keras.__version__)
model = tf.keras.Sequential() # 往模型中添加一个有64个神经元组成的层,激活函数为relu: model.add(layers.Dense(64, activation='relu')) # 再添加一个: model.add(layers.Dense(64, activation='relu')) # 添加一个有10个神经元的softmax层作为输出层: model.add(layers.Dense(10, activation='softmax'))
|
等价于:
1 2 3 4 5
| model = tf.keras.Sequential([ layers.Dense(64, activation='relu'), layers.Dense(64, activation='relu'), layers.Dense(10, activation='softmax')] )
|
定义神经网络层通过tf.keras.layers模块中的Dense类实现,Dense类构造参数如下:
- units:指定神经元个数,必须是一个正整数。
- activation:激活函数,可以是可以是一个可调用对象或标识一个对象的字符串
- use_bias:布尔型,是否使用是否使用偏置项
- kernel_initializer和bias_initializer:权值、偏置初始化方法,可以是一个可调用对象或标识一个对象的字符串
- kernel_regularizer和bias_regularizer:对权值、偏置进行正则化的方法,可以是一个可调用对象或标识一个对象的字符串
- activity_regularizer:对层的输出进行正则化的方法,可以是一个可调用对象或标识一个对象的字符串
- kernel_constraint和bias_constraint:对权值矩阵、偏置矩阵的约束方法,可以是一个可调用对象或标识一个对象的字符串
训练模型
建立好模型之后,接下来当然是要进行训练模型了。不过,在训练前还需要做一些配置工作,例如指定优化器、损失函数、评估指标等,这些配置参数的过程一般通过tf.keras.Model.compile方法进行,先来熟悉一下tf.keras.Model.compile方法的三个常用参数:
- optimizer:tf.keras.optimizers模块中的优化器实例化对象,例如 tf.keras.optimizers.Adam或 tf.keras.optimizers.SGD的实例化对象,当然也可以使用字符串来指代优化器,例如’adam’和’sgd’。
- loss:损失函数,例如交叉熵、均方差等,通常是tf.keras.losses模块中定义的可调用对象,也可以用用于指代损失函数的字符串。
- metrics:元素为评估方法的list,通常是定义在tf.keras.metrics模块中定义的可调用对象,也可以用于指代评估方法的字符串。
在知道怎么配置模型训练参数后,就可以根据实际应用情况合理选择优化器、损失函数、评估方法等:
1 2 3 4 5 6 7 8 9
| # 回归模型 model.compile(optimizer=tf.keras.optimizers.Adam(0.01), # 指定优化器,学习率为0.01 loss='mse', # 指定均方差作为损失函数 metrics=['mae']) # 添加绝对值误差作为评估方法
# 分类模型 model.compile(optimizer=tf.keras.optimizers.RMSprop(0.01), loss=tf.keras.losses.CategoricalCrossentropy(), # 分类模型多用交叉熵作为损失函数 metrics=[tf.keras.metrics.CategoricalAccuracy()])
|
通过compile()配置好模型后,就可以开始训练了。tf.keras中提供了fit()方法对模型进行训练,先来看看fit()方法的主要参数:
- x和y:训练数据和目标数据
- epochs:训练周期数,每一个周期都是对训练数据集的一次完整迭代
- batch_size:簇的大小,一般在数据集是numpy数组类型时使用
- validation_data:验证数据集,模型训练时,如果你想通过一个额外的验证数据集来监测模型的性能变换,就可以通过这个参数传入验证数据集
- verbose:日志显示方式,verbose=0为不在标准输出流输出日志信息,verbose=1为输出进度条记录,verbose=2为每个epoch输出一行记录
- callbacks:回调方法组成的列表,一般是定义在tf.keras.callbacks中的方法
- validation_split:从训练数据集抽取部分数据作为验证数据集的比例,是一个0到1之间的浮点数。这一参数在输入数据为dataset对象、生成器、keras.utils.Sequence对象是无效。
- shuffle:是否在每一个周期开始前打乱数据
下面分别说说如何使用fit()方法结合numpy数据和tf.data.Dataset数据进行模型训练。
1 2 3 4 5 6
| import numpy as np
data = np.random.random((1000, 32)) labels = np.random.random((1000, 10))
model.fit(data, labels, epochs=10, batch_size=32)
|
评估与预测
训练好的模型性能如何,评估测试一下就知道了。可以使用模型自带的evaluate()方法和predict()方法对模型进行评估和预测。
1 2 3 4 5
| # 如果是numpy数据,可以这么使用 data = np.random.random((1000, 32)) labels = np.random.random((1000, 10))
model.evaluate(data, labels, batch_size=32)
|
1 2 3 4 5
| # 如果数Dataset对象,可以这么使用 dataset = tf.data.Dataset.from_tensor_slices((data, labels)) dataset = dataset.batch(32)
model.evaluate(dataset)
|
使用predict()方法进行预测:
1 2 3
| # numpy数据 result = model.predict(data, batch_size=32) print(result.shape)
|
1 2 3
| # dataset数据 result = model.predict(dataset) print(result.shape)
|