TensorFlow数据集-Dataset-API
TensorFlow在学习的时候, 它是有一个mnist数据集让我们学习的. 通过batch_size来每轮数据训练的大小, 现在打算将一个我们实际的数据转换为跟mnist数据集一样的效果
内存中自定义数据
Dataset-API是1.3版引入的, 支持从内存中/硬盘中生成数据集.
- 一维数组
直接就是给到一维数组, 生成数据集
dataset = tf.data.Dataset.from_tensor_slices(
(np.array([1.0, 2.0, 3.0, 4.0, 5.0]), np.random.uniform(size=(5, 2)))
)
out_put="""
元组的形式:
(1.0, array([ 0.41459922, 0.75492457]))
(2.0, array([ 0.47954237, 0.93916116]))
(3.0, array([ 0.70576017, 0.58064858]))
(4.0, array([ 0.8239234 , 0.92814029]))
(5.0, array([ 0.03073594, 0.16718188]))
"""
- 字典
字典的格式给到,结果也是字典, 按照key索引(这种用的比较多一些)
dataset = tf.data.Dataset.from_tensor_slices(
{
"a": np.array([1.0, 2.0, 3.0, 4.0, 5.0]),
"b": np.random.uniform(size=(5, 2))
}
)
out_put="""
字典的形式:
{'a': 1.0, 'b': array([ 0.15337225, 0.97730736])}
{'a': 2.0, 'b': array([ 0.89860896, 0.95473649])}
{'a': 3.0, 'b': array([ 0.79198725, 0.84507321])}
{'a': 4.0, 'b': array([ 0.27289686, 0.56223038])}
{'a': 5.0, 'b': array([ 0.19825011, 0.44183586])}
"""
两种输出验证方式
当内存中数据生成后, 我们通过这两种方式来验证下
dataset来自上方代码













十分意外第一个方法,很明显这个方法应该是展示注册这个View的,而且还待会参数时间.



















