【caffe】mnist训练日志

@tags caffe
前面根据train_lenet.sh改写了train_lenet.py后，在根目录下执行它，得到一系列输出，内容如下：
I1013 10:05:16.721294  1684 caffe.cpp:218] Using GPUs 0
I1013 10:05:17.525264  1684 caffe.cpp:223] GPU 0: GeForce GTX 970M
I1013 10:05:17.790920  1684 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:17.806543  1684 solver.cpp:48] Initializing solver from parameters:
test_iter: 100
test_interval: 500
base_lr: 0.01
display: 100
max_iter: 10000
lr_policy: "inv"
gamma: 0.0001
power: 0.75
momentum: 0.9
weight_decay: 0.0005
snapshot: 5000
snapshot_prefix: "examples/mnist/lenet"
solver_mode: GPU
device_id: 0
net: "examples/mnist/lenet_train_test.prototxt"
train_state {
  level: 0
  stage: ""
}
I1013 10:05:17.806543  1684 solver.cpp:91] Creating training net from net file: examples/mnist/lenet_train_test.prototxt
I1013 10:05:17.806543  1684 net.cpp:332] The NetState phase (0) differed from the phase (1) specified by a rule in layer mnist
I1013 10:05:17.806543  1684 net.cpp:332] The NetState phase (0) differed from the phase (1) specified by a rule in layer accuracy
I1013 10:05:17.806543  1684 net.cpp:58] Initializing net from parameters:
name: "LeNet"
state {
  phase: TRAIN
  level: 0
  stage: ""
}
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_train_lmdb"
    batch_size: 64
    backend: LMDB
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 20
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}
I1013 10:05:17.822134  1684 layer_factory.hpp:77] Creating layer mnist
I1013 10:05:17.853427  1684 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:17.853427  1684 net.cpp:100] Creating Layer mnist
I1013 10:05:17.853427  1684 net.cpp:418] mnist -> data
I1013 10:05:17.853427  1684 net.cpp:418] mnist -> label
I1013 10:05:17.853427 10084 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:17.900490 10084 db_lmdb.cpp:40] Opened lmdb examples/mnist/mnist_train_lmdb
I1013 10:05:17.978623  1684 data_layer.cpp:41] output data size: 64,1,28,28
I1013 10:05:17.978623  1684 net.cpp:150] Setting up mnist
I1013 10:05:17.978623  1684 net.cpp:157] Top shape: 64 1 28 28 (50176)
I1013 10:05:17.978623   824 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:17.978623  1684 net.cpp:157] Top shape: 64 (64)
I1013 10:05:17.978623  1684 net.cpp:165] Memory required for data: 200960
I1013 10:05:17.978623  1684 layer_factory.hpp:77] Creating layer conv1
I1013 10:05:17.978623  1684 net.cpp:100] Creating Layer conv1
I1013 10:05:17.978623  1684 net.cpp:444] conv1 <- data
I1013 10:05:17.978623  1684 net.cpp:418] conv1 -> conv1
I1013 10:05:17.994026  1684 net.cpp:150] Setting up conv1
I1013 10:05:17.994026  1684 net.cpp:157] Top shape: 64 20 24 24 (737280)
I1013 10:05:17.994026  1684 net.cpp:165] Memory required for data: 3150080
I1013 10:05:17.994026  1684 layer_factory.hpp:77] Creating layer pool1
I1013 10:05:17.994026  1684 net.cpp:100] Creating Layer pool1
I1013 10:05:17.994026  1684 net.cpp:444] pool1 <- conv1
I1013 10:05:17.994026  1684 net.cpp:418] pool1 -> pool1
I1013 10:05:17.994026  1684 net.cpp:150] Setting up pool1
I1013 10:05:17.994026  1684 net.cpp:157] Top shape: 64 20 12 12 (184320)
I1013 10:05:17.994026  1684 net.cpp:165] Memory required for data: 3887360
I1013 10:05:18.009652  1684 layer_factory.hpp:77] Creating layer conv2
I1013 10:05:18.009652  1684 net.cpp:100] Creating Layer conv2
I1013 10:05:18.009652  1684 net.cpp:444] conv2 <- pool1
I1013 10:05:18.025316  1684 net.cpp:418] conv2 -> conv2
I1013 10:05:18.025316  1684 net.cpp:150] Setting up conv2
I1013 10:05:18.025316  1684 net.cpp:157] Top shape: 64 50 8 8 (204800)
I1013 10:05:18.025316  1684 net.cpp:165] Memory required for data: 4706560
I1013 10:05:18.025316  1684 layer_factory.hpp:77] Creating layer pool2
I1013 10:05:18.040946  1684 net.cpp:100] Creating Layer pool2
I1013 10:05:18.040946  1684 net.cpp:444] pool2 <- conv2
I1013 10:05:18.040946  1684 net.cpp:418] pool2 -> pool2
I1013 10:05:18.040946  1684 net.cpp:150] Setting up pool2
I1013 10:05:18.040946  1684 net.cpp:157] Top shape: 64 50 4 4 (51200)
I1013 10:05:18.040946  1684 net.cpp:165] Memory required for data: 4911360
I1013 10:05:18.056536  1684 layer_factory.hpp:77] Creating layer ip1
I1013 10:05:18.056536  1684 net.cpp:100] Creating Layer ip1
I1013 10:05:18.056536  1684 net.cpp:444] ip1 <- pool2
I1013 10:05:18.056536  1684 net.cpp:418] ip1 -> ip1
I1013 10:05:18.087842  1684 net.cpp:150] Setting up ip1
I1013 10:05:18.087842  1684 net.cpp:157] Top shape: 64 500 (32000)
I1013 10:05:18.087842  1684 net.cpp:165] Memory required for data: 5039360
I1013 10:05:18.087842  1684 layer_factory.hpp:77] Creating layer relu1
I1013 10:05:18.087842  1684 net.cpp:100] Creating Layer relu1
I1013 10:05:18.103415  1684 net.cpp:444] relu1 <- ip1
I1013 10:05:18.103415  1684 net.cpp:405] relu1 -> ip1 (in-place)
I1013 10:05:18.103415  1684 net.cpp:150] Setting up relu1
I1013 10:05:18.103415  1684 net.cpp:157] Top shape: 64 500 (32000)
I1013 10:05:18.103415  1684 net.cpp:165] Memory required for data: 5167360
I1013 10:05:18.119084  1684 layer_factory.hpp:77] Creating layer ip2
I1013 10:05:18.119084  1684 net.cpp:100] Creating Layer ip2
I1013 10:05:18.119084  1684 net.cpp:444] ip2 <- ip1
I1013 10:05:18.119084  1684 net.cpp:418] ip2 -> ip2
I1013 10:05:18.134666  1684 net.cpp:150] Setting up ip2
I1013 10:05:18.134666  1684 net.cpp:157] Top shape: 64 10 (640)
I1013 10:05:18.134666  1684 net.cpp:165] Memory required for data: 5169920
I1013 10:05:18.134666  1684 layer_factory.hpp:77] Creating layer loss
I1013 10:05:18.134666  1684 net.cpp:100] Creating Layer loss
I1013 10:05:18.150292  1684 net.cpp:444] loss <- ip2
I1013 10:05:18.150292  1684 net.cpp:444] loss <- label
I1013 10:05:18.150292  1684 net.cpp:418] loss -> loss
I1013 10:05:18.150292  1684 layer_factory.hpp:77] Creating layer loss
I1013 10:05:18.150292  1684 net.cpp:150] Setting up loss
I1013 10:05:18.165921  1684 net.cpp:157] Top shape: (1)
I1013 10:05:18.165921  1684 net.cpp:160]     with loss weight 1
I1013 10:05:18.165921  1684 net.cpp:165] Memory required for data: 5169924
I1013 10:05:18.165921  1684 net.cpp:226] loss needs backward computation.
I1013 10:05:18.181591  1684 net.cpp:226] ip2 needs backward computation.
I1013 10:05:18.181591  1684 net.cpp:226] relu1 needs backward computation.
I1013 10:05:18.181591  1684 net.cpp:226] ip1 needs backward computation.
I1013 10:05:18.181591  1684 net.cpp:226] pool2 needs backward computation.
I1013 10:05:18.197201  1684 net.cpp:226] conv2 needs backward computation.
I1013 10:05:18.197201  1684 net.cpp:226] pool1 needs backward computation.
I1013 10:05:18.197201  1684 net.cpp:226] conv1 needs backward computation.
I1013 10:05:18.197201  1684 net.cpp:228] mnist does not need backward computation.
I1013 10:05:18.212836  1684 net.cpp:270] This network produces output loss
I1013 10:05:18.212836  1684 net.cpp:283] Network initialization done.
I1013 10:05:18.212836  1684 solver.cpp:181] Creating test net (#0) specified by net file: examples/mnist/lenet_train_test.prototxt
I1013 10:05:18.228471  1684 net.cpp:332] The NetState phase (1) differed from the phase (0) specified by a rule in layer mnist
I1013 10:05:18.228471  1684 net.cpp:58] Initializing net from parameters:
name: "LeNet"
state {
  phase: TEST
}
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TEST
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_test_lmdb"
    batch_size: 100
    backend: LMDB
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 20
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "ip2"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}
layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}
I1013 10:05:18.275310  1684 layer_factory.hpp:77] Creating layer mnist
I1013 10:05:18.291010  1684 net.cpp:100] Creating Layer mnist
I1013 10:05:18.291010  1684 net.cpp:418] mnist -> data
I1013 10:05:18.291010  1684 net.cpp:418] mnist -> label
I1013 10:05:18.291010  7500 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:18.369072  7500 db_lmdb.cpp:40] Opened lmdb examples/mnist/mnist_test_lmdb
I1013 10:05:18.369072  1684 data_layer.cpp:41] output data size: 100,1,28,28
I1013 10:05:18.384691  1684 net.cpp:150] Setting up mnist
I1013 10:05:18.384691  1684 net.cpp:157] Top shape: 100 1 28 28 (78400)
I1013 10:05:18.384691  1684 net.cpp:157] Top shape: 100 (100)
I1013 10:05:18.384691  1684 net.cpp:165] Memory required for data: 314000
I1013 10:05:18.384691  1684 layer_factory.hpp:77] Creating layer label_mnist_1_split
I1013 10:05:18.384691  2420 common.cpp:36] System entropy source not available, using fallback algorithm to generate seed instead.
I1013 10:05:18.384691  1684 net.cpp:100] Creating Layer label_mnist_1_split
I1013 10:05:18.384691  1684 net.cpp:444] label_mnist_1_split <- label
I1013 10:05:18.400321  1684 net.cpp:418] label_mnist_1_split -> label_mnist_1_split_0
I1013 10:05:18.400321  1684 net.cpp:418] label_mnist_1_split -> label_mnist_1_split_1
I1013 10:05:18.400321  1684 net.cpp:150] Setting up label_mnist_1_split
I1013 10:05:18.400321  1684 net.cpp:157] Top shape: 100 (100)
I1013 10:05:18.400321  1684 net.cpp:157] Top shape: 100 (100)
I1013 10:05:18.400321  1684 net.cpp:165] Memory required for data: 314800
I1013 10:05:18.400321  1684 layer_factory.hpp:77] Creating layer conv1
I1013 10:05:18.400321  1684 net.cpp:100] Creating Layer conv1
I1013 10:05:18.400321  1684 net.cpp:444] conv1 <- data
I1013 10:05:18.415946  1684 net.cpp:418] conv1 -> conv1
I1013 10:05:18.415946  1684 net.cpp:150] Setting up conv1
I1013 10:05:18.415946  1684 net.cpp:157] Top shape: 100 20 24 24 (1152000)
I1013 10:05:18.415946  1684 net.cpp:165] Memory required for data: 4922800
I1013 10:05:18.415946  1684 layer_factory.hpp:77] Creating layer pool1
I1013 10:05:18.415946  1684 net.cpp:100] Creating Layer pool1
I1013 10:05:18.415946  1684 net.cpp:444] pool1 <- conv1
I1013 10:05:18.415946  1684 net.cpp:418] pool1 -> pool1
I1013 10:05:18.415946  1684 net.cpp:150] Setting up pool1
I1013 10:05:18.415946  1684 net.cpp:157] Top shape: 100 20 12 12 (288000)
I1013 10:05:18.431571  1684 net.cpp:165] Memory required for data: 6074800
I1013 10:05:18.431571  1684 layer_factory.hpp:77] Creating layer conv2
I1013 10:05:18.431571  1684 net.cpp:100] Creating Layer conv2
I1013 10:05:18.431571  1684 net.cpp:444] conv2 <- pool1
I1013 10:05:18.431571  1684 net.cpp:418] conv2 -> conv2
I1013 10:05:18.431571  1684 net.cpp:150] Setting up conv2
I1013 10:05:18.431571  1684 net.cpp:157] Top shape: 100 50 8 8 (320000)
I1013 10:05:18.431571  1684 net.cpp:165] Memory required for data: 7354800
I1013 10:05:18.431571  1684 layer_factory.hpp:77] Creating layer pool2
I1013 10:05:18.431571  1684 net.cpp:100] Creating Layer pool2
I1013 10:05:18.431571  1684 net.cpp:444] pool2 <- conv2
I1013 10:05:18.447198  1684 net.cpp:418] pool2 -> pool2
I1013 10:05:18.447198  1684 net.cpp:150] Setting up pool2
I1013 10:05:18.447198  1684 net.cpp:157] Top shape: 100 50 4 4 (80000)
I1013 10:05:18.447198  1684 net.cpp:165] Memory required for data: 7674800
I1013 10:05:18.447198  1684 layer_factory.hpp:77] Creating layer ip1
I1013 10:05:18.447198  1684 net.cpp:100] Creating Layer ip1
I1013 10:05:18.447198  1684 net.cpp:444] ip1 <- pool2
I1013 10:05:18.447198  1684 net.cpp:418] ip1 -> ip1
I1013 10:05:18.462826  1684 net.cpp:150] Setting up ip1
I1013 10:05:18.462826  1684 net.cpp:157] Top shape: 100 500 (50000)
I1013 10:05:18.462826  1684 net.cpp:165] Memory required for data: 7874800
I1013 10:05:18.462826  1684 layer_factory.hpp:77] Creating layer relu1
I1013 10:05:18.462826  1684 net.cpp:100] Creating Layer relu1
I1013 10:05:18.462826  1684 net.cpp:444] relu1 <- ip1
I1013 10:05:18.462826  1684 net.cpp:405] relu1 -> ip1 (in-place)
I1013 10:05:18.462826  1684 net.cpp:150] Setting up relu1
I1013 10:05:18.462826  1684 net.cpp:157] Top shape: 100 500 (50000)
I1013 10:05:18.462826  1684 net.cpp:165] Memory required for data: 8074800
I1013 10:05:18.462826  1684 layer_factory.hpp:77] Creating layer ip2
I1013 10:05:18.478452  1684 net.cpp:100] Creating Layer ip2
I1013 10:05:18.478452  1684 net.cpp:444] ip2 <- ip1
I1013 10:05:18.478452  1684 net.cpp:418] ip2 -> ip2
I1013 10:05:18.478452  1684 net.cpp:150] Setting up ip2
I1013 10:05:18.478452  1684 net.cpp:157] Top shape: 100 10 (1000)
I1013 10:05:18.478452  1684 net.cpp:165] Memory required for data: 8078800
I1013 10:05:18.478452  1684 layer_factory.hpp:77] Creating layer ip2_ip2_0_split
I1013 10:05:18.494081  1684 net.cpp:100] Creating Layer ip2_ip2_0_split
I1013 10:05:18.494081  1684 net.cpp:444] ip2_ip2_0_split <- ip2
I1013 10:05:18.494081  1684 net.cpp:418] ip2_ip2_0_split -> ip2_ip2_0_split_0
I1013 10:05:18.494081  1684 net.cpp:418] ip2_ip2_0_split -> ip2_ip2_0_split_1
I1013 10:05:18.494081  1684 net.cpp:150] Setting up ip2_ip2_0_split
I1013 10:05:18.494081  1684 net.cpp:157] Top shape: 100 10 (1000)
I1013 10:05:18.494081  1684 net.cpp:157] Top shape: 100 10 (1000)
I1013 10:05:18.494081  1684 net.cpp:165] Memory required for data: 8086800
I1013 10:05:18.509729  1684 layer_factory.hpp:77] Creating layer accuracy
I1013 10:05:18.509729  1684 net.cpp:100] Creating Layer accuracy
I1013 10:05:18.509729  1684 net.cpp:444] accuracy <- ip2_ip2_0_split_0
I1013 10:05:18.509729  1684 net.cpp:444] accuracy <- label_mnist_1_split_0
I1013 10:05:18.509729  1684 net.cpp:418] accuracy -> accuracy
I1013 10:05:18.509729  1684 net.cpp:150] Setting up accuracy
I1013 10:05:18.509729  1684 net.cpp:157] Top shape: (1)
I1013 10:05:18.509729  1684 net.cpp:165] Memory required for data: 8086804
I1013 10:05:18.509729  1684 layer_factory.hpp:77] Creating layer loss
I1013 10:05:18.509729  1684 net.cpp:100] Creating Layer loss
I1013 10:05:18.509729  1684 net.cpp:444] loss <- ip2_ip2_0_split_1
I1013 10:05:18.525331  1684 net.cpp:444] loss <- label_mnist_1_split_1
I1013 10:05:18.525331  1684 net.cpp:418] loss -> loss
I1013 10:05:18.525331  1684 layer_factory.hpp:77] Creating layer loss
I1013 10:05:18.525331  1684 net.cpp:150] Setting up loss
I1013 10:05:18.525331  1684 net.cpp:157] Top shape: (1)
I1013 10:05:18.525331  1684 net.cpp:160]     with loss weight 1
I1013 10:05:18.525331  1684 net.cpp:165] Memory required for data: 8086808
I1013 10:05:18.525331  1684 net.cpp:226] loss needs backward computation.
I1013 10:05:18.525331  1684 net.cpp:228] accuracy does not need backward computation.
I1013 10:05:18.525331  1684 net.cpp:226] ip2_ip2_0_split needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] ip2 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] relu1 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] ip1 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] pool2 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] conv2 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] pool1 needs backward computation.
I1013 10:05:18.540958  1684 net.cpp:226] conv1 needs backward computation.
I1013 10:05:18.556589  1684 net.cpp:228] label_mnist_1_split does not need backward computation.
I1013 10:05:18.556589  1684 net.cpp:228] mnist does not need backward computation.
I1013 10:05:18.556589  1684 net.cpp:270] This network produces output accuracy
I1013 10:05:18.556589  1684 net.cpp:270] This network produces output loss
I1013 10:05:18.556589  1684 net.cpp:283] Network initialization done.
I1013 10:05:18.572244  1684 solver.cpp:60] Solver scaffolding done.
I1013 10:05:18.572244  1684 caffe.cpp:252] Starting Optimization
I1013 10:05:18.572244  1684 solver.cpp:279] Solving LeNet
I1013 10:05:18.572244  1684 solver.cpp:280] Learning Rate Policy: inv
I1013 10:05:18.572244  1684 solver.cpp:337] Iteration 0, Testing net (#0)
I1013 10:05:19.978624  1684 solver.cpp:404]     Test net output #0: accuracy = 0.0789
I1013 10:05:19.978624  1684 solver.cpp:404]     Test net output #1: loss = 2.36376 (* 1 = 2.36376 loss)
I1013 10:05:20.009863  1684 solver.cpp:228] Iteration 0, loss = 2.34559
I1013 10:05:20.009863  1684 solver.cpp:244]     Train net output #0: loss = 2.34559 (* 1 = 2.34559 loss)
I1013 10:05:20.009863  1684 sgd_solver.cpp:106] Iteration 0, lr = 0.01
I1013 10:05:22.134766  1684 solver.cpp:228] Iteration 100, loss = 0.226693
I1013 10:05:22.136801  1684 solver.cpp:244]     Train net output #0: loss = 0.226693 (* 1 = 0.226693 loss)
I1013 10:05:22.137765  1684 sgd_solver.cpp:106] Iteration 100, lr = 0.00992565
I1013 10:05:24.268718  1684 solver.cpp:228] Iteration 200, loss = 0.142792
I1013 10:05:24.270691  1684 solver.cpp:244]     Train net output #0: loss = 0.142792 (* 1 = 0.142792 loss)
I1013 10:05:24.272729  1684 sgd_solver.cpp:106] Iteration 200, lr = 0.00985258
I1013 10:05:26.396376  1684 solver.cpp:228] Iteration 300, loss = 0.192766
I1013 10:05:26.399351  1684 solver.cpp:244]     Train net output #0: loss = 0.192766 (* 1 = 0.192766 loss)
I1013 10:05:26.400354  1684 sgd_solver.cpp:106] Iteration 300, lr = 0.00978075
I1013 10:05:28.526006  1684 solver.cpp:228] Iteration 400, loss = 0.0834785
I1013 10:05:28.528012  1684 solver.cpp:244]     Train net output #0: loss = 0.0834785 (* 1 = 0.0834785 loss)
I1013 10:05:28.531019  1684 sgd_solver.cpp:106] Iteration 400, lr = 0.00971013
I1013 10:05:30.658334  1684 solver.cpp:337] Iteration 500, Testing net (#0)
I1013 10:05:32.030649  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9678
I1013 10:05:32.031683  1684 solver.cpp:404]     Test net output #1: loss = 0.0990599 (* 1 = 0.0990599 loss)
I1013 10:05:32.044724  1684 solver.cpp:228] Iteration 500, loss = 0.112297
I1013 10:05:32.045688  1684 solver.cpp:244]     Train net output #0: loss = 0.112297 (* 1 = 0.112297 loss)
I1013 10:05:32.049700  1684 sgd_solver.cpp:106] Iteration 500, lr = 0.00964069
I1013 10:05:34.181881  1684 solver.cpp:228] Iteration 600, loss = 0.101184
I1013 10:05:34.182885  1684 solver.cpp:244]     Train net output #0: loss = 0.101184 (* 1 = 0.101184 loss)
I1013 10:05:34.183862  1684 sgd_solver.cpp:106] Iteration 600, lr = 0.0095724
I1013 10:05:36.311400  1684 solver.cpp:228] Iteration 700, loss = 0.179369
I1013 10:05:36.312403  1684 solver.cpp:244]     Train net output #0: loss = 0.179369 (* 1 = 0.179369 loss)
I1013 10:05:36.314407  1684 sgd_solver.cpp:106] Iteration 700, lr = 0.00950522
I1013 10:05:38.447108  1684 solver.cpp:228] Iteration 800, loss = 0.209864
I1013 10:05:38.449084  1684 solver.cpp:244]     Train net output #0: loss = 0.209864 (* 1 = 0.209864 loss)
I1013 10:05:38.450114  1684 sgd_solver.cpp:106] Iteration 800, lr = 0.00943913
I1013 10:05:40.575814  1684 solver.cpp:228] Iteration 900, loss = 0.142768
I1013 10:05:40.575814  1684 solver.cpp:244]     Train net output #0: loss = 0.142768 (* 1 = 0.142768 loss)
I1013 10:05:40.575814  1684 sgd_solver.cpp:106] Iteration 900, lr = 0.00937411
I1013 10:05:42.700186  1684 solver.cpp:337] Iteration 1000, Testing net (#0)
I1013 10:05:44.075335  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9808
I1013 10:05:44.075335  1684 solver.cpp:404]     Test net output #1: loss = 0.0613375 (* 1 = 0.0613375 loss)
I1013 10:05:44.090960  1684 solver.cpp:228] Iteration 1000, loss = 0.0704594
I1013 10:05:44.090960  1684 solver.cpp:244]     Train net output #0: loss = 0.0704594 (* 1 = 0.0704594 loss)
I1013 10:05:44.090960  1684 sgd_solver.cpp:106] Iteration 1000, lr = 0.00931012
I1013 10:05:46.231811  1684 solver.cpp:228] Iteration 1100, loss = 0.00886345
I1013 10:05:46.231811  1684 solver.cpp:244]     Train net output #0: loss = 0.00886345 (* 1 = 0.00886345 loss)
I1013 10:05:46.231811  1684 sgd_solver.cpp:106] Iteration 1100, lr = 0.00924715
I1013 10:05:48.372705  1684 solver.cpp:228] Iteration 1200, loss = 0.0159409
I1013 10:05:48.372705  1684 solver.cpp:244]     Train net output #0: loss = 0.0159409 (* 1 = 0.0159409 loss)
I1013 10:05:48.372705  1684 sgd_solver.cpp:106] Iteration 1200, lr = 0.00918515
I1013 10:05:50.513516  1684 solver.cpp:228] Iteration 1300, loss = 0.0102466
I1013 10:05:50.513516  1684 solver.cpp:244]     Train net output #0: loss = 0.0102465 (* 1 = 0.0102465 loss)
I1013 10:05:50.513516  1684 sgd_solver.cpp:106] Iteration 1300, lr = 0.00912412
I1013 10:05:52.639024  1684 solver.cpp:228] Iteration 1400, loss = 0.00691616
I1013 10:05:52.639024  1684 solver.cpp:244]     Train net output #0: loss = 0.00691615 (* 1 = 0.00691615 loss)
I1013 10:05:52.639024  1684 sgd_solver.cpp:106] Iteration 1400, lr = 0.00906403
I1013 10:05:54.748378  1684 solver.cpp:337] Iteration 1500, Testing net (#0)
I1013 10:05:56.123487  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9824
I1013 10:05:56.123487  1684 solver.cpp:404]     Test net output #1: loss = 0.0558028 (* 1 = 0.0558028 loss)
I1013 10:05:56.139156  1684 solver.cpp:228] Iteration 1500, loss = 0.0770894
I1013 10:05:56.139156  1684 solver.cpp:244]     Train net output #0: loss = 0.0770894 (* 1 = 0.0770894 loss)
I1013 10:05:56.139156  1684 sgd_solver.cpp:106] Iteration 1500, lr = 0.00900485
I1013 10:05:58.279999  1684 solver.cpp:228] Iteration 1600, loss = 0.08424
I1013 10:05:58.279999  1684 solver.cpp:244]     Train net output #0: loss = 0.0842399 (* 1 = 0.0842399 loss)
I1013 10:05:58.279999  1684 sgd_solver.cpp:106] Iteration 1600, lr = 0.00894657
I1013 10:06:00.405194  1684 solver.cpp:228] Iteration 1700, loss = 0.0452077
I1013 10:06:00.405194  1684 solver.cpp:244]     Train net output #0: loss = 0.0452077 (* 1 = 0.0452077 loss)
I1013 10:06:00.405194  1684 sgd_solver.cpp:106] Iteration 1700, lr = 0.00888916
I1013 10:06:02.546080  1684 solver.cpp:228] Iteration 1800, loss = 0.0248114
I1013 10:06:02.546080  1684 solver.cpp:244]     Train net output #0: loss = 0.0248114 (* 1 = 0.0248114 loss)
I1013 10:06:02.546080  1684 sgd_solver.cpp:106] Iteration 1800, lr = 0.0088326
I1013 10:06:04.671310  1684 solver.cpp:228] Iteration 1900, loss = 0.114547
I1013 10:06:04.671310  1684 solver.cpp:244]     Train net output #0: loss = 0.114547 (* 1 = 0.114547 loss)
I1013 10:06:04.686897  1684 sgd_solver.cpp:106] Iteration 1900, lr = 0.00877687
I1013 10:06:06.796535  1684 solver.cpp:337] Iteration 2000, Testing net (#0)
I1013 10:06:08.171643  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9841
I1013 10:06:08.187270  1684 solver.cpp:404]     Test net output #1: loss = 0.0490052 (* 1 = 0.0490052 loss)
I1013 10:06:08.187270  1684 solver.cpp:228] Iteration 2000, loss = 0.00911095
I1013 10:06:08.202911  1684 solver.cpp:244]     Train net output #0: loss = 0.0091109 (* 1 = 0.0091109 loss)
I1013 10:06:08.202911  1684 sgd_solver.cpp:106] Iteration 2000, lr = 0.00872196
I1013 10:06:10.328163  1684 solver.cpp:228] Iteration 2100, loss = 0.0175512
I1013 10:06:10.328163  1684 solver.cpp:244]     Train net output #0: loss = 0.0175512 (* 1 = 0.0175512 loss)
I1013 10:06:10.328163  1684 sgd_solver.cpp:106] Iteration 2100, lr = 0.00866784
I1013 10:06:12.456619  1684 solver.cpp:228] Iteration 2200, loss = 0.0182508
I1013 10:06:12.456619  1684 solver.cpp:244]     Train net output #0: loss = 0.0182508 (* 1 = 0.0182508 loss)
I1013 10:06:12.472260  1684 sgd_solver.cpp:106] Iteration 2200, lr = 0.0086145
I1013 10:06:14.597468  1684 solver.cpp:228] Iteration 2300, loss = 0.0929874
I1013 10:06:14.597468  1684 solver.cpp:244]     Train net output #0: loss = 0.0929874 (* 1 = 0.0929874 loss)
I1013 10:06:14.597468  1684 sgd_solver.cpp:106] Iteration 2300, lr = 0.00856192
I1013 10:06:16.738363  1684 solver.cpp:228] Iteration 2400, loss = 0.0156817
I1013 10:06:16.738363  1684 solver.cpp:244]     Train net output #0: loss = 0.0156816 (* 1 = 0.0156816 loss)
I1013 10:06:16.738363  1684 sgd_solver.cpp:106] Iteration 2400, lr = 0.00851008
I1013 10:06:18.847921  1684 solver.cpp:337] Iteration 2500, Testing net (#0)
I1013 10:06:20.223072  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9853
I1013 10:06:20.223072  1684 solver.cpp:404]     Test net output #1: loss = 0.0476141 (* 1 = 0.0476141 loss)
I1013 10:06:20.238706  1684 solver.cpp:228] Iteration 2500, loss = 0.0254326
I1013 10:06:20.238706  1684 solver.cpp:244]     Train net output #0: loss = 0.0254326 (* 1 = 0.0254326 loss)
I1013 10:06:20.238706  1684 sgd_solver.cpp:106] Iteration 2500, lr = 0.00845897
I1013 10:06:22.379546  1684 solver.cpp:228] Iteration 2600, loss = 0.0614191
I1013 10:06:22.379546  1684 solver.cpp:244]     Train net output #0: loss = 0.061419 (* 1 = 0.061419 loss)
I1013 10:06:22.379546  1684 sgd_solver.cpp:106] Iteration 2600, lr = 0.00840857
I1013 10:06:24.520401  1684 solver.cpp:228] Iteration 2700, loss = 0.0625541
I1013 10:06:24.520401  1684 solver.cpp:244]     Train net output #0: loss = 0.062554 (* 1 = 0.062554 loss)
I1013 10:06:24.520401  1684 sgd_solver.cpp:106] Iteration 2700, lr = 0.00835886
I1013 10:06:26.645644  1684 solver.cpp:228] Iteration 2800, loss = 0.00305949
I1013 10:06:26.645644  1684 solver.cpp:244]     Train net output #0: loss = 0.00305946 (* 1 = 0.00305946 loss)
I1013 10:06:26.645644  1684 sgd_solver.cpp:106] Iteration 2800, lr = 0.00830984
I1013 10:06:28.786510  1684 solver.cpp:228] Iteration 2900, loss = 0.0252702
I1013 10:06:28.786510  1684 solver.cpp:244]     Train net output #0: loss = 0.0252702 (* 1 = 0.0252702 loss)
I1013 10:06:28.786510  1684 sgd_solver.cpp:106] Iteration 2900, lr = 0.00826148
I1013 10:06:30.896109  1684 solver.cpp:337] Iteration 3000, Testing net (#0)
I1013 10:06:32.271224  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9861
I1013 10:06:32.271224  1684 solver.cpp:404]     Test net output #1: loss = 0.0419692 (* 1 = 0.0419692 loss)
I1013 10:06:32.286850  1684 solver.cpp:228] Iteration 3000, loss = 0.00504212
I1013 10:06:32.286850  1684 solver.cpp:244]     Train net output #0: loss = 0.00504212 (* 1 = 0.00504212 loss)
I1013 10:06:32.286850  1684 sgd_solver.cpp:106] Iteration 3000, lr = 0.00821377
I1013 10:06:34.412075  1684 solver.cpp:228] Iteration 3100, loss = 0.0165952
I1013 10:06:34.412075  1684 solver.cpp:244]     Train net output #0: loss = 0.0165953 (* 1 = 0.0165953 loss)
I1013 10:06:34.427702  1684 sgd_solver.cpp:106] Iteration 3100, lr = 0.0081667
I1013 10:06:36.552963  1684 solver.cpp:228] Iteration 3200, loss = 0.0144548
I1013 10:06:36.552963  1684 solver.cpp:244]     Train net output #0: loss = 0.0144548 (* 1 = 0.0144548 loss)
I1013 10:06:36.552963  1684 sgd_solver.cpp:106] Iteration 3200, lr = 0.00812025
I1013 10:06:38.693781  1684 solver.cpp:228] Iteration 3300, loss = 0.0481921
I1013 10:06:38.693781  1684 solver.cpp:244]     Train net output #0: loss = 0.0481921 (* 1 = 0.0481921 loss)
I1013 10:06:38.693781  1684 sgd_solver.cpp:106] Iteration 3300, lr = 0.00807442
I1013 10:06:40.834671  1684 solver.cpp:228] Iteration 3400, loss = 0.0168258
I1013 10:06:40.834671  1684 solver.cpp:244]     Train net output #0: loss = 0.0168259 (* 1 = 0.0168259 loss)
I1013 10:06:40.834671  1684 sgd_solver.cpp:106] Iteration 3400, lr = 0.00802918
I1013 10:06:42.944270  1684 solver.cpp:337] Iteration 3500, Testing net (#0)
I1013 10:06:44.303789  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9863
I1013 10:06:44.319380  1684 solver.cpp:404]     Test net output #1: loss = 0.043148 (* 1 = 0.043148 loss)
I1013 10:06:44.335008  1684 solver.cpp:228] Iteration 3500, loss = 0.00682415
I1013 10:06:44.335008  1684 solver.cpp:244]     Train net output #0: loss = 0.00682418 (* 1 = 0.00682418 loss)
I1013 10:06:44.335008  1684 sgd_solver.cpp:106] Iteration 3500, lr = 0.00798454
I1013 10:06:46.460263  1684 solver.cpp:228] Iteration 3600, loss = 0.0317525
I1013 10:06:46.460263  1684 solver.cpp:244]     Train net output #0: loss = 0.0317526 (* 1 = 0.0317526 loss)
I1013 10:06:46.460263  1684 sgd_solver.cpp:106] Iteration 3600, lr = 0.00794046
I1013 10:06:48.601121  1684 solver.cpp:228] Iteration 3700, loss = 0.0246315
I1013 10:06:48.601121  1684 solver.cpp:244]     Train net output #0: loss = 0.0246315 (* 1 = 0.0246315 loss)
I1013 10:06:48.601121  1684 sgd_solver.cpp:106] Iteration 3700, lr = 0.00789695
I1013 10:06:50.726347  1684 solver.cpp:228] Iteration 3800, loss = 0.00837651
I1013 10:06:50.726347  1684 solver.cpp:244]     Train net output #0: loss = 0.00837653 (* 1 = 0.00837653 loss)
I1013 10:06:50.726347  1684 sgd_solver.cpp:106] Iteration 3800, lr = 0.007854
I1013 10:06:52.871928  1684 solver.cpp:228] Iteration 3900, loss = 0.0320845
I1013 10:06:52.874935  1684 solver.cpp:244]     Train net output #0: loss = 0.0320845 (* 1 = 0.0320845 loss)
I1013 10:06:52.876941  1684 sgd_solver.cpp:106] Iteration 3900, lr = 0.00781158
I1013 10:06:54.979713  1684 solver.cpp:337] Iteration 4000, Testing net (#0)
I1013 10:06:56.354836  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9875
I1013 10:06:56.354836  1684 solver.cpp:404]     Test net output #1: loss = 0.0353671 (* 1 = 0.0353671 loss)
I1013 10:06:56.370452  1684 solver.cpp:228] Iteration 4000, loss = 0.0140691
I1013 10:06:56.370452  1684 solver.cpp:244]     Train net output #0: loss = 0.0140691 (* 1 = 0.0140691 loss)
I1013 10:06:56.370452  1684 sgd_solver.cpp:106] Iteration 4000, lr = 0.00776969
I1013 10:06:58.511303  1684 solver.cpp:228] Iteration 4100, loss = 0.0263123
I1013 10:06:58.511303  1684 solver.cpp:244]     Train net output #0: loss = 0.0263123 (* 1 = 0.0263123 loss)
I1013 10:06:58.511303  1684 sgd_solver.cpp:106] Iteration 4100, lr = 0.00772833
I1013 10:07:00.652200  1684 solver.cpp:228] Iteration 4200, loss = 0.0117368
I1013 10:07:00.652200  1684 solver.cpp:244]     Train net output #0: loss = 0.0117368 (* 1 = 0.0117368 loss)
I1013 10:07:00.652200  1684 sgd_solver.cpp:106] Iteration 4200, lr = 0.00768748
I1013 10:07:02.793052  1684 solver.cpp:228] Iteration 4300, loss = 0.0490961
I1013 10:07:02.793052  1684 solver.cpp:244]     Train net output #0: loss = 0.0490961 (* 1 = 0.0490961 loss)
I1013 10:07:02.793052  1684 sgd_solver.cpp:106] Iteration 4300, lr = 0.00764712
I1013 10:07:04.933894  1684 solver.cpp:228] Iteration 4400, loss = 0.0143547
I1013 10:07:04.933894  1684 solver.cpp:244]     Train net output #0: loss = 0.0143547 (* 1 = 0.0143547 loss)
I1013 10:07:04.933894  1684 sgd_solver.cpp:106] Iteration 4400, lr = 0.00760726
I1013 10:07:07.043498  1684 solver.cpp:337] Iteration 4500, Testing net (#0)
I1013 10:07:08.418617  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9875
I1013 10:07:08.418617  1684 solver.cpp:404]     Test net output #1: loss = 0.039773 (* 1 = 0.039773 loss)
I1013 10:07:08.434267  1684 solver.cpp:228] Iteration 4500, loss = 0.00660795
I1013 10:07:08.434267  1684 solver.cpp:244]     Train net output #0: loss = 0.00660791 (* 1 = 0.00660791 loss)
I1013 10:07:08.434267  1684 sgd_solver.cpp:106] Iteration 4500, lr = 0.00756788
I1013 10:07:10.575119  1684 solver.cpp:228] Iteration 4600, loss = 0.0135348
I1013 10:07:10.575119  1684 solver.cpp:244]     Train net output #0: loss = 0.0135347 (* 1 = 0.0135347 loss)
I1013 10:07:10.575119  1684 sgd_solver.cpp:106] Iteration 4600, lr = 0.00752897
I1013 10:07:12.715939  1684 solver.cpp:228] Iteration 4700, loss = 0.00858051
I1013 10:07:12.715939  1684 solver.cpp:244]     Train net output #0: loss = 0.00858048 (* 1 = 0.00858048 loss)
I1013 10:07:12.715939  1684 sgd_solver.cpp:106] Iteration 4700, lr = 0.00749052
I1013 10:07:14.856828  1684 solver.cpp:228] Iteration 4800, loss = 0.013837
I1013 10:07:14.856828  1684 solver.cpp:244]     Train net output #0: loss = 0.013837 (* 1 = 0.013837 loss)
I1013 10:07:14.856828  1684 sgd_solver.cpp:106] Iteration 4800, lr = 0.00745253
I1013 10:07:16.997676  1684 solver.cpp:228] Iteration 4900, loss = 0.00716435
I1013 10:07:16.997676  1684 solver.cpp:244]     Train net output #0: loss = 0.00716432 (* 1 = 0.00716432 loss)
I1013 10:07:16.997676  1684 sgd_solver.cpp:106] Iteration 4900, lr = 0.00741498
I1013 10:07:19.107244  1684 solver.cpp:454] Snapshotting to binary proto file examples/mnist/lenet_iter_5000.caffemodel
I1013 10:07:19.138531  1684 sgd_solver.cpp:273] Snapshotting solver state to binary proto file examples/mnist/lenet_iter_5000.solverstate
I1013 10:07:19.154156  1684 solver.cpp:337] Iteration 5000, Testing net (#0)
I1013 10:07:20.529271  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9886
I1013 10:07:20.529271  1684 solver.cpp:404]     Test net output #1: loss = 0.0343976 (* 1 = 0.0343976 loss)
I1013 10:07:20.544936  1684 solver.cpp:228] Iteration 5000, loss = 0.046033
I1013 10:07:20.544936  1684 solver.cpp:244]     Train net output #0: loss = 0.0460329 (* 1 = 0.0460329 loss)
I1013 10:07:20.544936  1684 sgd_solver.cpp:106] Iteration 5000, lr = 0.00737788
I1013 10:07:22.670121  1684 solver.cpp:228] Iteration 5100, loss = 0.0231957
I1013 10:07:22.670121  1684 solver.cpp:244]     Train net output #0: loss = 0.0231957 (* 1 = 0.0231957 loss)
I1013 10:07:22.670121  1684 sgd_solver.cpp:106] Iteration 5100, lr = 0.0073412
I1013 10:07:24.810972  1684 solver.cpp:228] Iteration 5200, loss = 0.00935967
I1013 10:07:24.810972  1684 solver.cpp:244]     Train net output #0: loss = 0.00935963 (* 1 = 0.00935963 loss)
I1013 10:07:24.826604  1684 sgd_solver.cpp:106] Iteration 5200, lr = 0.00730495
I1013 10:07:26.951828  1684 solver.cpp:228] Iteration 5300, loss = 0.00283169
I1013 10:07:26.951828  1684 solver.cpp:244]     Train net output #0: loss = 0.00283165 (* 1 = 0.00283165 loss)
I1013 10:07:26.951828  1684 sgd_solver.cpp:106] Iteration 5300, lr = 0.00726911
I1013 10:07:29.092718  1684 solver.cpp:228] Iteration 5400, loss = 0.00842249
I1013 10:07:29.092718  1684 solver.cpp:244]     Train net output #0: loss = 0.00842245 (* 1 = 0.00842245 loss)
I1013 10:07:29.092718  1684 sgd_solver.cpp:106] Iteration 5400, lr = 0.00723368
I1013 10:07:31.202320  1684 solver.cpp:337] Iteration 5500, Testing net (#0)
I1013 10:07:32.577424  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9883
I1013 10:07:32.577424  1684 solver.cpp:404]     Test net output #1: loss = 0.0350875 (* 1 = 0.0350875 loss)
I1013 10:07:32.593072  1684 solver.cpp:228] Iteration 5500, loss = 0.00971781
I1013 10:07:32.593072  1684 solver.cpp:244]     Train net output #0: loss = 0.00971777 (* 1 = 0.00971777 loss)
I1013 10:07:32.593072  1684 sgd_solver.cpp:106] Iteration 5500, lr = 0.00719865
I1013 10:07:34.733940  1684 solver.cpp:228] Iteration 5600, loss = 0.000905203
I1013 10:07:34.733940  1684 solver.cpp:244]     Train net output #0: loss = 0.000905167 (* 1 = 0.000905167 loss)
I1013 10:07:34.733940  1684 sgd_solver.cpp:106] Iteration 5600, lr = 0.00716402
I1013 10:07:36.874794  1684 solver.cpp:228] Iteration 5700, loss = 0.00458089
I1013 10:07:36.874794  1684 solver.cpp:244]     Train net output #0: loss = 0.00458086 (* 1 = 0.00458086 loss)
I1013 10:07:36.874794  1684 sgd_solver.cpp:106] Iteration 5700, lr = 0.00712977
I1013 10:07:39.000007  1684 solver.cpp:228] Iteration 5800, loss = 0.0429197
I1013 10:07:39.015626  1684 solver.cpp:244]     Train net output #0: loss = 0.0429196 (* 1 = 0.0429196 loss)
I1013 10:07:39.015626  1684 sgd_solver.cpp:106] Iteration 5800, lr = 0.0070959
I1013 10:07:41.140871  1684 solver.cpp:228] Iteration 5900, loss = 0.00847424
I1013 10:07:41.140871  1684 solver.cpp:244]     Train net output #0: loss = 0.0084742 (* 1 = 0.0084742 loss)
I1013 10:07:41.140871  1684 sgd_solver.cpp:106] Iteration 5900, lr = 0.0070624
I1013 10:07:43.280727  1684 solver.cpp:337] Iteration 6000, Testing net (#0)
I1013 10:07:44.657387  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9892
I1013 10:07:44.658390  1684 solver.cpp:404]     Test net output #1: loss = 0.0333308 (* 1 = 0.0333308 loss)
I1013 10:07:44.672427  1684 solver.cpp:228] Iteration 6000, loss = 0.00297941
I1013 10:07:44.673431  1684 solver.cpp:244]     Train net output #0: loss = 0.00297938 (* 1 = 0.00297938 loss)
I1013 10:07:44.675467  1684 sgd_solver.cpp:106] Iteration 6000, lr = 0.00702927
I1013 10:07:46.812116  1684 solver.cpp:228] Iteration 6100, loss = 0.00404553
I1013 10:07:46.814121  1684 solver.cpp:244]     Train net output #0: loss = 0.0040455 (* 1 = 0.0040455 loss)
I1013 10:07:46.815125  1684 sgd_solver.cpp:106] Iteration 6100, lr = 0.0069965
I1013 10:07:48.949837  1684 solver.cpp:228] Iteration 6200, loss = 0.00796121
I1013 10:07:48.951807  1684 solver.cpp:244]     Train net output #0: loss = 0.00796118 (* 1 = 0.00796118 loss)
I1013 10:07:48.953860  1684 sgd_solver.cpp:106] Iteration 6200, lr = 0.00696408
I1013 10:07:51.083505  1684 solver.cpp:228] Iteration 6300, loss = 0.00927992
I1013 10:07:51.085481  1684 solver.cpp:244]     Train net output #0: loss = 0.0092799 (* 1 = 0.0092799 loss)
I1013 10:07:51.086510  1684 sgd_solver.cpp:106] Iteration 6300, lr = 0.00693201
I1013 10:07:53.220190  1684 solver.cpp:228] Iteration 6400, loss = 0.00616177
I1013 10:07:53.222162  1684 solver.cpp:244]     Train net output #0: loss = 0.00616174 (* 1 = 0.00616174 loss)
I1013 10:07:53.224195  1684 sgd_solver.cpp:106] Iteration 6400, lr = 0.00690029
I1013 10:07:55.335819  1684 solver.cpp:337] Iteration 6500, Testing net (#0)
I1013 10:07:56.705461  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9892
I1013 10:07:56.707448  1684 solver.cpp:404]     Test net output #1: loss = 0.0342351 (* 1 = 0.0342351 loss)
I1013 10:07:56.721467  1684 solver.cpp:228] Iteration 6500, loss = 0.00857477
I1013 10:07:56.722470  1684 solver.cpp:244]     Train net output #0: loss = 0.00857473 (* 1 = 0.00857473 loss)
I1013 10:07:56.723474  1684 sgd_solver.cpp:106] Iteration 6500, lr = 0.0068689
I1013 10:07:58.860191  1684 solver.cpp:228] Iteration 6600, loss = 0.0264124
I1013 10:07:58.861191  1684 solver.cpp:244]     Train net output #0: loss = 0.0264124 (* 1 = 0.0264124 loss)
I1013 10:07:58.863162  1684 sgd_solver.cpp:106] Iteration 6600, lr = 0.00683784
I1013 10:08:00.991823  1684 solver.cpp:228] Iteration 6700, loss = 0.00683724
I1013 10:08:00.993829  1684 solver.cpp:244]     Train net output #0: loss = 0.00683721 (* 1 = 0.00683721 loss)
I1013 10:08:00.995842  1684 sgd_solver.cpp:106] Iteration 6700, lr = 0.00680711
I1013 10:08:03.131726  1684 solver.cpp:228] Iteration 6800, loss = 0.00408112
I1013 10:08:03.133730  1684 solver.cpp:244]     Train net output #0: loss = 0.0040811 (* 1 = 0.0040811 loss)
I1013 10:08:03.135735  1684 sgd_solver.cpp:106] Iteration 6800, lr = 0.0067767
I1013 10:08:05.266402  1684 solver.cpp:228] Iteration 6900, loss = 0.00522403
I1013 10:08:05.268406  1684 solver.cpp:244]     Train net output #0: loss = 0.00522401 (* 1 = 0.00522401 loss)
I1013 10:08:05.269409  1684 sgd_solver.cpp:106] Iteration 6900, lr = 0.0067466
I1013 10:08:07.395082  1684 solver.cpp:337] Iteration 7000, Testing net (#0)
I1013 10:08:08.769718  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9888
I1013 10:08:08.771723  1684 solver.cpp:404]     Test net output #1: loss = 0.035025 (* 1 = 0.035025 loss)
I1013 10:08:08.784770  1684 solver.cpp:228] Iteration 7000, loss = 0.00657448
I1013 10:08:08.785768  1684 solver.cpp:244]     Train net output #0: loss = 0.00657445 (* 1 = 0.00657445 loss)
I1013 10:08:08.787765  1684 sgd_solver.cpp:106] Iteration 7000, lr = 0.00671681
I1013 10:08:10.924448  1684 solver.cpp:228] Iteration 7100, loss = 0.0121463
I1013 10:08:10.926453  1684 solver.cpp:244]     Train net output #0: loss = 0.0121463 (* 1 = 0.0121463 loss)
I1013 10:08:10.928458  1684 sgd_solver.cpp:106] Iteration 7100, lr = 0.00668733
I1013 10:08:13.061159  1684 solver.cpp:228] Iteration 7200, loss = 0.00267776
I1013 10:08:13.063134  1684 solver.cpp:244]     Train net output #0: loss = 0.00267773 (* 1 = 0.00267773 loss)
I1013 10:08:13.064137  1684 sgd_solver.cpp:106] Iteration 7200, lr = 0.00665815
I1013 10:08:15.199861  1684 solver.cpp:228] Iteration 7300, loss = 0.0185436
I1013 10:08:15.201831  1684 solver.cpp:244]     Train net output #0: loss = 0.0185435 (* 1 = 0.0185435 loss)
I1013 10:08:15.203866  1684 sgd_solver.cpp:106] Iteration 7300, lr = 0.00662927
I1013 10:08:17.338510  1684 solver.cpp:228] Iteration 7400, loss = 0.0036527
I1013 10:08:17.341522  1684 solver.cpp:244]     Train net output #0: loss = 0.00365268 (* 1 = 0.00365268 loss)
I1013 10:08:17.343523  1684 sgd_solver.cpp:106] Iteration 7400, lr = 0.00660067
I1013 10:08:19.459148  1684 solver.cpp:337] Iteration 7500, Testing net (#0)
I1013 10:08:20.831836  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9892
I1013 10:08:20.832801  1684 solver.cpp:404]     Test net output #1: loss = 0.0364178 (* 1 = 0.0364178 loss)
I1013 10:08:20.845861  1684 solver.cpp:228] Iteration 7500, loss = 0.00223585
I1013 10:08:20.846865  1684 solver.cpp:244]     Train net output #0: loss = 0.00223582 (* 1 = 0.00223582 loss)
I1013 10:08:20.847841  1684 sgd_solver.cpp:106] Iteration 7500, lr = 0.00657236
I1013 10:08:22.981528  1684 solver.cpp:228] Iteration 7600, loss = 0.00394381
I1013 10:08:22.983520  1684 solver.cpp:244]     Train net output #0: loss = 0.00394378 (* 1 = 0.00394378 loss)
I1013 10:08:22.985527  1684 sgd_solver.cpp:106] Iteration 7600, lr = 0.00654433
I1013 10:08:25.115223  1684 solver.cpp:228] Iteration 7700, loss = 0.0196834
I1013 10:08:25.117230  1684 solver.cpp:244]     Train net output #0: loss = 0.0196834 (* 1 = 0.0196834 loss)
I1013 10:08:25.118197  1684 sgd_solver.cpp:106] Iteration 7700, lr = 0.00651658
I1013 10:08:27.252872  1684 solver.cpp:228] Iteration 7800, loss = 0.00327404
I1013 10:08:27.254878  1684 solver.cpp:244]     Train net output #0: loss = 0.00327401 (* 1 = 0.00327401 loss)
I1013 10:08:27.255897  1684 sgd_solver.cpp:106] Iteration 7800, lr = 0.00648911
I1013 10:08:29.388586  1684 solver.cpp:228] Iteration 7900, loss = 0.00185404
I1013 10:08:29.390593  1684 solver.cpp:244]     Train net output #0: loss = 0.001854 (* 1 = 0.001854 loss)
I1013 10:08:29.392597  1684 sgd_solver.cpp:106] Iteration 7900, lr = 0.0064619
I1013 10:08:31.501201  1684 solver.cpp:337] Iteration 8000, Testing net (#0)
I1013 10:08:32.873819  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9892
I1013 10:08:32.875864  1684 solver.cpp:404]     Test net output #1: loss = 0.0335527 (* 1 = 0.0335527 loss)
I1013 10:08:32.889863  1684 solver.cpp:228] Iteration 8000, loss = 0.00614705
I1013 10:08:32.889863  1684 solver.cpp:244]     Train net output #0: loss = 0.00614701 (* 1 = 0.00614701 loss)
I1013 10:08:32.890882  1684 sgd_solver.cpp:106] Iteration 8000, lr = 0.00643496
I1013 10:08:35.023572  1684 solver.cpp:228] Iteration 8100, loss = 0.0192059
I1013 10:08:35.024581  1684 solver.cpp:244]     Train net output #0: loss = 0.0192059 (* 1 = 0.0192059 loss)
I1013 10:08:35.025543  1684 sgd_solver.cpp:106] Iteration 8100, lr = 0.00640827
I1013 10:08:37.159255  1684 solver.cpp:228] Iteration 8200, loss = 0.00787218
I1013 10:08:37.161262  1684 solver.cpp:244]     Train net output #0: loss = 0.00787215 (* 1 = 0.00787215 loss)
I1013 10:08:37.162261  1684 sgd_solver.cpp:106] Iteration 8200, lr = 0.00638185
I1013 10:08:39.295898  1684 solver.cpp:228] Iteration 8300, loss = 0.0265738
I1013 10:08:39.296929  1684 solver.cpp:244]     Train net output #0: loss = 0.0265737 (* 1 = 0.0265737 loss)
I1013 10:08:39.299909  1684 sgd_solver.cpp:106] Iteration 8300, lr = 0.00635568
I1013 10:08:41.430843  1684 solver.cpp:228] Iteration 8400, loss = 0.00670668
I1013 10:08:41.434828  1684 solver.cpp:244]     Train net output #0: loss = 0.00670665 (* 1 = 0.00670665 loss)
I1013 10:08:41.436877  1684 sgd_solver.cpp:106] Iteration 8400, lr = 0.00632975
I1013 10:08:43.540426  1684 solver.cpp:337] Iteration 8500, Testing net (#0)
I1013 10:08:44.918090  1684 solver.cpp:404]     Test net output #0: accuracy = 0.99
I1013 10:08:44.919092  1684 solver.cpp:404]     Test net output #1: loss = 0.0330528 (* 1 = 0.0330528 loss)
I1013 10:08:44.933130  1684 solver.cpp:228] Iteration 8500, loss = 0.00646596
I1013 10:08:44.934134  1684 solver.cpp:244]     Train net output #0: loss = 0.00646593 (* 1 = 0.00646593 loss)
I1013 10:08:44.936137  1684 sgd_solver.cpp:106] Iteration 8500, lr = 0.00630407
I1013 10:08:47.070852  1684 solver.cpp:228] Iteration 8600, loss = 0.000641635
I1013 10:08:47.072856  1684 solver.cpp:244]     Train net output #0: loss = 0.000641601 (* 1 = 0.000641601 loss)
I1013 10:08:47.074916  1684 sgd_solver.cpp:106] Iteration 8600, lr = 0.00627864
I1013 10:08:49.204524  1684 solver.cpp:228] Iteration 8700, loss = 0.00248919
I1013 10:08:49.206532  1684 solver.cpp:244]     Train net output #0: loss = 0.00248916 (* 1 = 0.00248916 loss)
I1013 10:08:49.207542  1684 sgd_solver.cpp:106] Iteration 8700, lr = 0.00625344
I1013 10:08:51.339238  1684 solver.cpp:228] Iteration 8800, loss = 0.00115433
I1013 10:08:51.341305  1684 solver.cpp:244]     Train net output #0: loss = 0.0011543 (* 1 = 0.0011543 loss)
I1013 10:08:51.343212  1684 sgd_solver.cpp:106] Iteration 8800, lr = 0.00622847
I1013 10:08:53.474915  1684 solver.cpp:228] Iteration 8900, loss = 0.00148415
I1013 10:08:53.475916  1684 solver.cpp:244]     Train net output #0: loss = 0.00148413 (* 1 = 0.00148413 loss)
I1013 10:08:53.477922  1684 sgd_solver.cpp:106] Iteration 8900, lr = 0.00620374
I1013 10:08:55.589537  1684 solver.cpp:337] Iteration 9000, Testing net (#0)
I1013 10:08:56.966166  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9886
I1013 10:08:56.968189  1684 solver.cpp:404]     Test net output #1: loss = 0.0339002 (* 1 = 0.0339002 loss)
I1013 10:08:56.981241  1684 solver.cpp:228] Iteration 9000, loss = 0.0147503
I1013 10:08:56.982228  1684 solver.cpp:244]     Train net output #0: loss = 0.0147502 (* 1 = 0.0147502 loss)
I1013 10:08:56.983245  1684 sgd_solver.cpp:106] Iteration 9000, lr = 0.00617924
I1013 10:08:59.115936  1684 solver.cpp:228] Iteration 9100, loss = 0.00737076
I1013 10:08:59.117923  1684 solver.cpp:244]     Train net output #0: loss = 0.00737073 (* 1 = 0.00737073 loss)
I1013 10:08:59.119928  1684 sgd_solver.cpp:106] Iteration 9100, lr = 0.00615496
I1013 10:09:01.251560  1684 solver.cpp:228] Iteration 9200, loss = 0.00446405
I1013 10:09:01.252562  1684 solver.cpp:244]     Train net output #0: loss = 0.00446402 (* 1 = 0.00446402 loss)
I1013 10:09:01.253566  1684 sgd_solver.cpp:106] Iteration 9200, lr = 0.0061309
I1013 10:09:03.386270  1684 solver.cpp:228] Iteration 9300, loss = 0.00824475
I1013 10:09:03.388242  1684 solver.cpp:244]     Train net output #0: loss = 0.00824472 (* 1 = 0.00824472 loss)
I1013 10:09:03.389245  1684 sgd_solver.cpp:106] Iteration 9300, lr = 0.00610706
I1013 10:09:05.521981  1684 solver.cpp:228] Iteration 9400, loss = 0.0200841
I1013 10:09:05.523952  1684 solver.cpp:244]     Train net output #0: loss = 0.020084 (* 1 = 0.020084 loss)
I1013 10:09:05.525956  1684 sgd_solver.cpp:106] Iteration 9400, lr = 0.00608343
I1013 10:09:07.638610  1684 solver.cpp:337] Iteration 9500, Testing net (#0)
I1013 10:09:09.004231  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9877
I1013 10:09:09.007218  1684 solver.cpp:404]     Test net output #1: loss = 0.0394568 (* 1 = 0.0394568 loss)
I1013 10:09:09.021282  1684 solver.cpp:228] Iteration 9500, loss = 0.00323504
I1013 10:09:09.021282  1684 solver.cpp:244]     Train net output #0: loss = 0.00323501 (* 1 = 0.00323501 loss)
I1013 10:09:09.023258  1684 sgd_solver.cpp:106] Iteration 9500, lr = 0.00606002
I1013 10:09:11.161974  1684 solver.cpp:228] Iteration 9600, loss = 0.00335854
I1013 10:09:11.163949  1684 solver.cpp:244]     Train net output #0: loss = 0.00335851 (* 1 = 0.00335851 loss)
I1013 10:09:11.164966  1684 sgd_solver.cpp:106] Iteration 9600, lr = 0.00603682
I1013 10:09:13.296618  1684 solver.cpp:228] Iteration 9700, loss = 0.0024854
I1013 10:09:13.298666  1684 solver.cpp:244]     Train net output #0: loss = 0.00248537 (* 1 = 0.00248537 loss)
I1013 10:09:13.300631  1684 sgd_solver.cpp:106] Iteration 9700, lr = 0.00601382
I1013 10:09:15.431372  1684 solver.cpp:228] Iteration 9800, loss = 0.0139184
I1013 10:09:15.433302  1684 solver.cpp:244]     Train net output #0: loss = 0.0139184 (* 1 = 0.0139184 loss)
I1013 10:09:15.435307  1684 sgd_solver.cpp:106] Iteration 9800, lr = 0.00599102
I1013 10:09:17.568011  1684 solver.cpp:228] Iteration 9900, loss = 0.00603178
I1013 10:09:17.569984  1684 solver.cpp:244]     Train net output #0: loss = 0.00603175 (* 1 = 0.00603175 loss)
I1013 10:09:17.570989  1684 sgd_solver.cpp:106] Iteration 9900, lr = 0.00596843
I1013 10:09:19.683639  1684 solver.cpp:454] Snapshotting to binary proto file examples/mnist/lenet_iter_10000.caffemodel
I1013 10:09:19.745410  1684 sgd_solver.cpp:273] Snapshotting solver state to binary proto file examples/mnist/lenet_iter_10000.solverstate
I1013 10:09:19.767470  1684 solver.cpp:317] Iteration 10000, loss = 0.00483315
I1013 10:09:19.768472  1684 solver.cpp:337] Iteration 10000, Testing net (#0)
I1013 10:09:21.132349  1684 solver.cpp:404]     Test net output #0: accuracy = 0.9899
I1013 10:09:21.134388  1684 solver.cpp:404]     Test net output #1: loss = 0.0316015 (* 1 = 0.0316015 loss)
I1013 10:09:21.136361  1684 solver.cpp:322] Optimization Done.
I1013 10:09:21.137379  1684 caffe.cpp:255] Optimization Done.