win10编译tensorflow C++接口

原文地址：https://www.bearoom.xyz/2018/08/28/win10-build-tf-cc/

首先，我觉得这是一个比较DT的活，因为，tensorflow支持最好的编程语言应该是python(应该说大部分深度学习框架支持的最好的语言都是Python)，tensorflow的底层说是C/C++编写的，但是，感觉它对C/C++真的很不友好，有关Python的资料一查一大把，有关C/C++的一查寥寥无几，能看到的还有很多直接就照搬官网的那点少到可怜的例子...由于我可能会比较多的用C/C++来开发，所以，有点希望用上C/C++的API，所以才有了这篇笔记。

好了，就不废话了，在此先推荐一篇之前参考的文章，写得比较清楚了，但是我觉得可能还有点不太准确，或者说我没遇到的问题，或者说我不是这么解决的。

OK，废话不多说，直接上方法：

1、需要准备的东西

首先是软件：

1)、CMake Gui，我这里用的是CMake 3.11.0，基本上3.0以上的应该都OK；VS2015(社区版免费的，基本就可以了)；

2)、CUDA9.0以及配套的cudnn7(深度学习必备精品，用CPU的那就不需要了)；

3)、Anaconda，官网或者去清华镜像下载(python大蟒蛇的绝佳工具，学习和使用深度学习技术应该还是有必要弄一个的吧)；

4)、swigwin-3.0.12(这个我不太清楚是干啥的，但是有用)；

5)、梯子(梯子可以解决我参考的那篇博客提到的某些问题，当然这些问题其实也可以用博客的方法解决的)；

6)、源码(我下载的是tensorflow1.8的，因为我电脑上装的就是tensorflow1.8 Python版本的)；

7)、Git(这很重要，编译过程中要下载文件的，就是通过Git);

2、Cmake源码

以上材料和开发环境我就默认是装好的，Anaconda比较好办，参考我之前的一篇笔记，有很简单粗暴易行的方法，其他方法发也很简单，基本能搜到N多教程。然后解压下载下来的源码，用Cmake GUI打开，并设置源码路径和Cmake出来的工程路径：

然后按左下角的，配置工程，然后回报错的：

这里是由于没有设置SWIG的路径，SWIG再官网下载后解压出来就可以了，然后添加到

中，然后再次点击Configure再配置一遍，然后就修改一些项目

tensorflow项里面，有梯子的话就可以这样做：

如果没有梯子的话就这样：

没有GPU的话就把tensorflow_ENABLE_GPU也去掉吧。

然后再次点击Configure配置一边工程，没有报错的话就点击generate生成工程。

3、VS2015编译

用VS2015打开vs14_project/tensorflow.sln工程，整个工程Cmake出来时包含274个项目在里面：

首先修改配置属性，改为x64下的Release(因为Anaconda的时Release的，没有Debug，所以这里最好编译Release的，Debug可能会有错误，而且编译一个就差不多9G+了，不想尝试编译Debug了)，之后需要修改前面五个文件的配置属性：

配置好后修改一个文件tensorflowcontriboosted_treeslibutilssparse_column_iterable.cc，将第99~101行注释掉，改为：

bool operator<( const IndicesRowIterator& other ) const {

    QCHECK_LT( iter_, other.iter_ );

    return ( row_idx_ < other.row_idx_ );

}

然后就右击解决方案生成解决方案，这个过程会超级久，因为还要下载很多依赖项，甚至回有一点卡，我查了下任务管理器，主要时比较耗内存和CPU，CPU占有几乎快满了。然后我是会出现一个问题，跟tf_core_gpu_kernel编译不过有关的(看了下错误，感觉应该时跟访问权限有关，我的CUDA和VS都是装在C盘的，应该就导致访问权限不足，目测是这个原因)，这个时候就关闭VS，然后以管理员身份运行VS2015，然后再打开tensorflow工程，然后点编译解决方案(不要重新编译，点编译就可以，不然又得花很多时间)，然后这一项会编译很久，超级久的，以至于我都一度怀疑人生。然后还有一个DT的事情，tf_core_kernel编译的时候是很容易出现“compiler is out of heap space”导致这一项编译失败，然后就会出现别的问题，这个时候就是再点编译项目就可以了，再次编译但是不是重新编译，然后就可以了，因为在编译这一项的时候是很占CPU的，CPU几乎就爆满了，所以容易出现问题。

基本上这么做之后就可以编译通过了，但是我这边会有一个错误，跟Python API有关的，tf_python_api这一项我没有编译过，还是报了“cmd.exe”的错误，可能是跟我已经装了tensorflow的python版有关吧，具体没有查，因为这不是我的目的，况且我电脑上已经有tensorflow的Python版，所以这个我就忽略了，也不是很需要这个。

接下来就是打包头文件和lib文件、dll文件，在解决方案中找到INSTALL工程，右键单独对其进行编译，编译完成之后就回把相关的头文件、lib文件、dll文件和exe文件(如果需要的话可以找我要打包出来的文件，编译这个还挺花时间的)。

编译好之后做一下小的测试，试验一下是不是可以用。

4、测试

首先，新建一个控制台应用程序，然后在工程中添加打包出来的头文件和lib文件的路径，代码如下：

#include "stdafx.h"
COMPILER_MSVC
#define NOMINMAX
#include <vector>
#include <Eigen/Dense>

#include "tensorflow/core/public/session.h"
#include "tensorflow/cc/ops/standard_ops.h"
#include "tensorflow/cc/ops/training_ops.h"
#include "tensorflow/core/framework/graph.pb.h"

using namespace tensorflow;

GraphDef CreateGraphDef()
{
    Scope root = Scope::NewRootScope();

    auto X = ops::Placeholder(root.WithOpName("x"), DT_FLOAT, ops::Placeholder::Shape({ -1, 2 }));
    auto A = ops::Const(root, { { 3.f, 2.f },{ -1.f, 0.f } });
    auto Y = ops::MatMul(root.WithOpName("y"), A, X, ops::MatMul::TransposeB(true));
    GraphDef def;
    TF_CHECK_OK(root.ToGraphDef(&def));

    return def;
}


int main()
{
    GraphDef graph_def = CreateGraphDef();

    // Start up the session
    SessionOptions options;
    std::unique_ptr<Session> session(NewSession(options));
    TF_CHECK_OK(session->Create(graph_def));
    
    // Define some data. 
    // This needs to be converted to an Eigen Tensor to be
    // fed into the placeholder. 
    // Note that this will be broken up into two
    // separate vectors of length 2: [1, 2] and [3, 4],
    // which will separately
    // be multiplied by the matrix.
    std::vector<float> data = { 1, 2, 3, 4 };
    auto mapped_X_ = Eigen::TensorMap<Eigen::Tensor<float, 2, Eigen::RowMajor> >(&data[0], 2, 2);
    auto eigen_X_ = Eigen::Tensor<float, 2, Eigen::RowMajor>(mapped_X_);
    
    Tensor X_(DT_FLOAT, TensorShape({ 2, 2 }));
    X_.tensor<float, 2>() = eigen_X_;
    
    std::vector<Tensor> outputs;
    TF_CHECK_OK(session->Run({ { "x", X_ } }, { "y" }, {}, &outputs));

    // Get the result and print it out
    Tensor Y_ = outputs[0];
    std::cout << Y_.tensor<float, 2>() << std::endl;
    
    session->Close();
    getchar();
    
    return 0;
}

程序的输出信息如下：

跟Python版一样，也是会先显示一段系统和硬件信息，然后是输出结果，关于代码中的变量和函数等都是什么意思，或者怎么样些一个C++的tensorflow程序，后面我再研究研究吧，不过我Python版都不太会写，所以就还是要花点时间。

给一个我编译好的CPU版本的，Release的，64位，版本是1.8.

上善若水，为而不争。