决策树如何决定在哪个分支上选择哪个特征(如熵的概念和计算)

　　不用说，我没有完成大部分课程(只有那些用粗体标出的)。我在大规模开放在线课程中陷入了自我延续的循环。知识的容易获得使课程自然地从一门课程延续到下一门课程，因为所涉及的主题太短，这使我的兴趣稍纵即逝。我经常在完成前一门课之前跳到下一门课。
　　对我来说，简洁是大规模开放在线课程的最大缺点。我曾希望在学习了大量的开放在线课程后，能在数据科学领域找到一份职业，但现在看来这太天真了。
　　为了提供思路，教授传统机器学习(ML)方法的大规模开放在线课程经常忽略模型的实际作用。大规模开放在线课程说，随机森林算法是一组决策树，但他没有解释决策树如何决定在哪个分支上选择哪个特征(如熵的概念和计算)。它只是告诉我们支持向量机是一种分类方法，但它没有解释如何确定超平面。
　　在更高级的人工智能领域(如深度学习)，“我知道什么”和“我需要知道什么”是非常不同的。大规模开放在线课程教授深度学习的常规做法是将一堆代码放在张量流上，放在一个优秀的数据库中，比如MNIST，并推断“你现在是一个深度学习专家”(夸张，但你应该明白我的意思)。这与现实相去甚远，因为研究报告通常包含复杂的结构，包括对从深层神经网络模型中提取的特征的理解以及其他更复杂的特征，如变压器和双向编码。同样重要的是要理解为什么最先进的模式优于其他模式，以及一些概念，如迁移学习和元学习。
　　我认为，教授多媒体教学的大规模开放在线课程经常给人一种错觉，以为任何人都可以成为多媒体教学的实践者。他们天真地认为，ML只是几行包含。安装()和。预测()。这是因为大规模的开放在线课程说人们可以更容易地开始学习多媒体学习(也许是大量关于多媒体学习的宣传让这些课程变得有利可图)。
　　但不要误解我，大规模开放在线课程真的很棒。它使人们能够轻松快捷地获得知识并开始一个话题。但是他们能让你成为专家吗？显然不是。你完成课程后做什么能决定你是否能成为专家。