【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?

原贴地址:

https://www.zhihu.com/question/316135639

作为一个 AI 方向的在读博士生,实在是过的蛮闹心,无意中逛知乎发现了这个帖子,发现很适合现在的自己,于是转载到这里,以作收藏。

----------------------------------------------------------------------------


今年刚渡过了 CS PhD 的申请狂潮(本人是14级的学生),顺便回答一下吧。
我在中国科大计算机本科期间,学生工作做的很多,认得不少13,14,15,16,17届的学生(包括少年班和物理学院),了解一些他们的一些想法。中国科大是PhD申请大户之一,因此申请倾向和数据都还算可以参考的风向标;此外计算机和信息学院本身没有特别偏重AI,因此相关的改变就直接反应了AI这几年发展带来的冲击力。13届学生是第一批开始感受到AI发展带来影响的学生,不过当时由于大数据、VR、IoT这些宣传得还挺火,13届申请方向还是挺多样性的,并没有出现全员AI的情况。到了14级,AI开始成为比较热门的方向,这在各种场合都有反映,港中文到我们这里宣传的时候也特地请了MMLab的教授(特别是科大校友),MSRA招联培生的宣讲中也越来越多的谈及Deep learning。这些很大程度上是因为14年deep learning完成了很多里程碑式的事件。不过由于科大课程设置和科研团队没有特别偏AI,导致申请AI方向的人没有预想的多。15级学生已经完全感受到了AI的冲击,几乎每个学生都知道deep learning或者相关的学术词汇,我们编译原理的老师曾经吐槽说“15级没有一个做system的了,都想搞AI”;不过到了申请季,大家都意识到AI方向竞争过于激烈,科大学生多数又不愿申请排名50开外的学校,大家反而选择避开AI的锋芒,而事实证明这个选择是理智的,今年申请AI方向确实竞争过度,而且就算不申请AI方向,CS PhD申请也够受了。2018年,科大又搞了人工智能试点学院以及大数据学院,不少学生(16级)因为当时热门就选了这个方向,现在因为发现这个方向竞争过度激烈而感到焦虑,我很担心学生间发生内卷。这些现象表明AI热潮来得如此之快,以至于大家还没有准备就已经饱和了,至少是CS PhD申请上是如此。

另外我还要谈谈在北京一家人工智能公司的经历。我在那里认得不少学生,相当大一部分来自清北,上交和华科(很多北京本科生来兼职以获取人工智能经验)。实习的一段时间内,我强烈地感受到novelty(创意,新颖性)和work(有效性)之间的矛盾。学术领域非常看中novelty,而deep learning又很容易挖坑出novelty,这也导致相当容易发论文。然而公司在试图把这些novelty用到实际中的时候,却发现几乎很难在实际中有成效。真正有效的是数据量,数据的清洁度,以及deep learning中非常少的大家都熟知的一些算法,以及满足这些算法和数据的系统平台。这是deep learning非常尴尬的一点,这也迫使很多人最终变成调参工程师。然而即便如此,大家还是愿意使用deep learning,很大一部分原因是有的时候它的实际效果确实好,而且虽然要调参,但是大家总是能够在会议发表之前调好参数,相比之下你可能无论如何调整SVM的kernel也达不到CNN的效果。另外一个常见的误解是deep learning就意味着高算力,这个不算完全正确。msra参加过ImageNet多年的成员透露说,当年的经典算法最后输了甚至很多是因为没有跑完,毕竟很多经典算法不做近似的情况下需要对整个ImageNet进行SVD,即使当今的算力也远远达不到。而进行mini-batch和分布式训练的时候,deep learning方法体现出了巨大的优势,既是算力/资源上的(想想你显卡的内存才多大,数据又有多大)也是结果上的,甚至过大的batch对deep learning反而不利。deep learning的这些奇怪性质让公司和学术界又爱又恨,既让大量的人投入研究,又觉得万一是死路一条心里一寒。

再谈谈就业的情况。这里特别说一下美国加州,因为我去访问过所以特别了解,而且我感觉国内AI圈的就业环境也在渐渐步加州地区的后尘。相比CS PhD而言,CS Master其实焦虑得多,首先是PhD数量远远少于Master(比如加州大学系统公开数据中Master数量大约是PhD的10倍)。我去参观USC的时候(对于科大而言是 CS Master 著名保底校),得到了很多非常有趣的反馈。比如他们的deep learning课程评分非常低,上课效果极差,作业难以批改,助教很少反馈,大作业非常随便,评分非常玄学,很多人都不来上课,而且即使他们来了教室门外走廊也可能站不下,但是选课的waiting list最多竟达到了大几百人,选课的主体几乎包含学校所有学院的学生(包括一些怎么也不相干的方向)。大家为什么选课呢?就是为了简历上写一句“我学过deep learning,因此我觉得我可以申请AI方向的工作”。这个现象让部分USC的 CS Master非常焦虑。由此可见AI造成巨大危机的一点是其入门门槛实在是太低了,各个领域都想分一杯羹,使得其在应用领域迅速脱离CS的指导,日益玄学化和调参化,这样一但出现致命的问题,CS界的人也没有办法救回它。而且另外一个严重问题是大量CS外的人的涌入导致工程质量遭到了很大挑战,某USC的同学向我哭诉其同组同学竟然完全不懂OOP就写大工程,最后abcd满天飞,现在出了bug要调整结构快把人逼疯了。最终AI到实际应用还是一个工程问题,然而现在硅谷充满了刷deep learning课和leetcode然后直接到公司的情况,这让AI的落地和就业模式充满了不确定因素,就怕出现重大事故城门失火殃及池鱼,最后大家不信任AI直接导致AI的研究投资断裂,进入寒冬。有趣的事,USC的Web课评价要高很多,竞争也少的多,而且上的大多是CS Master,通过了解其中不少人在赌下面AI会先在招工作方面凉凉。滑稽的是,他们不久前才收到USC本科某课程的教务通知,本科有个课程waiting list才十几,讲师就抱怨“TOOOOO LONG”了。

然而让我现在放弃AI是不可能的,因为按照行话来说,现在这里“low-hanging fruits”太多了,太多有趣的问题没有解决了,作为真的想要做研究的人很难说服自己放弃这个领域。这好像20世纪初的量子论一样,把p=hv倒一下都可能拿一个诺奖。量子论的研究高峰经历了数十年,彻底改变了人们对基础理论的认知,虽然很多相关工具(泊松括号,哈密顿量,对易子,线性代数)很多年前就被人研究过了。而深度学习为代表的从2012年以来才过了7年而已,谁都不知道未来50年会怎么样。AI的风险很多在于它太接近应用,导致人们常常高估近期的成果,而低估长久的发展。作为CS PhD而言,其实不希望这个领域过于热门的,这个虽然会带来很多资金,但是也造成了很多风险。然而现在火了是事实,所以更重要的是想好下面的大方向是什么。个人赌的是AI-system,这也是UW(TQ Chen等)和UCB(RISELab + BAIR)今年新有的方向(可能之前也有,但是我没有听说过)。当然了,看申请情况,考虑到这点的似乎不是我一个人,AI-sys的pool推测竞争异常激烈,初筛后剩下的人中录取率应该不足5%(仅仅是周边了解推测,我没有委员会的数据)。此外,尽量做自己喜欢的方向吧,我曾经差点和我的同学一起申请清华的HPC方向去了,这个领域一直不温不火,但是一想到一些很有趣的没有做的事情,心里还是很高兴的,从来无需担心这个领域的起起伏伏。

PS:本文其实也间接提示AI-system也非常可能是一个PhD申请的“刚发展就饱和”的领域,现在我也不得不承认CS PhD申请是有点内卷了(体现在你刚想到一个方向时发现别人也就都想到了)。

PS: PS: 此外,不管哪个领域,都可以在上升期做科研,在平稳期做业务,在饱和期做教育,显然Andrew Ng是个明白人。

作者:SIY.Z
链接:https://www.zhihu.com/question/316135639/answer/626310136
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

-----------------------------------------------------------------------------------------

原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10583182.html