计算机视觉算法框架理解

计算机视觉算法听起来似乎很高、大、上，以至于我们很难动手实现，然而事实真的如此吗？下面笔者将最近关于计算机视觉算法的一点认识分享出来，敬请大家批评指正。

以文本分类问题为例，文本分类追求的目标就是将一篇特定的文本归到某个已有的类比当中（例如将有关NBA球星科比的报道，归到体育）。这个已有的类别可以是人工设定的，也可以是机器自动学习的。在初次接触到上述问题时，我感到大脑一篇空白，进而开始懊恼自己的无知，然后沮丧、抑郁等情绪接踵而至。但在调研了一些书籍、论文和代码之后，笔者发现问题似乎也没有原本认为的那么难，之所以这麽说是因为自己有了下面一些认识。

图1 计算机视觉算法框架示意图

细想起来，文本分类问题可以分解为以下几个字问题：如何收集文本、如何确定文本分类的模型、如何评价文本分类模型的好坏、如何将分类的结果很好的展示，分别对应图1的数据、模型、评价、显示。

总结：每一个子问题都对应着一系列的函数实现，应该清楚的是，每个子问题之间是通过数据进行信息传递的，例如数据是为模型提供原材料的（数据应该加工为模型能够理解的形式）。