主题简介
分享个人在自动化所的读博经历与收获的感悟,在读博期间的成长与遗憾,旨在与大家交流学习,共同提高。
作者简介
王少楠,中国科学院自动化研究所助理研究员,研究兴趣为自然语言处理、语义分析与计算、语言神经认知基础等。曾获2018年中国科学院优秀毕业生称号,中国科学院院长奖学金特别奖,以及中文信息学会优秀毕业论文。在国际一流学术会议(IJCAI、AAAI、EMNLP)和国际权威期刊 ACM TALLIP 上发表论文多篇。
具体内容
大家好,我是来自模式实验室的王少楠。
今天主要想跟大家分享博士期间以及工作近一年来的经历和感悟,我的博士生涯可以说是从博二回到研究所开始的,在这之前都是被动学习的阶段,从回到研究所拿到研究方向开始,由被动学习接受知识变为主动学习创造知识,我认为这可以标志着博士阶段的开始吧。在这里建议大家可以在回研究所或者学校之前来所里或学校实习,提前接触实验室的研究项目和工程,熟悉实验室的氛围,这对于之后的研究很有益处。
初回研究所,遇到的第一个问题就是如何选择一个研究课题,研究课题一般是导师根据研究组的研究方向和未来规划设定的。研究课题可能是一个新问题,或者是老问题,各有利弊,可以根据自己的能力、兴趣和未来职业规划来选择。我认为新问题 的已有工作少、创新性高、风险高,比较适合自主能力强未来也要从事科研工作的人,而老问题的已有工作多、变化快、创新性,比较适合未来想进入企业工作的人。
我当初根据兴趣选择了一个交叉学科的研究方向,借鉴认知神经科学经验的自然语言处理方法。
这个方向涉及了两门主要学科,我做的第一件事情就是去熟悉这两门学科。这里推荐入手学习一门学科的方式的次序为沟通为主、实践+教材次之,最后是论文和上课。
熟悉完基础知识之后,一个重要的事情就是我要研究什么问题。因为我的目标是解决自然语言处理任务,以自然语言任务出发,设计认知神经科学实验,验证某个结论,提升模型性能,因此我跟老板商量之后选择了语义分析中的词义消岐任务。
现在任务和问题基本确定了,时间也来到了博三年级,下一步就是要怎么去解决这个问题。自然我首先去了解了两个学科对于这个问题的研究结论。自然语言处理领域认为语境和词频是影响词义消岐的两个主要特征,认知神经科学对于人脑词义消岐的结论是上下文约束不强时,两个意思通达(no N400 change);上下文对次要意思强约束时,两个意思通达;上下文对主要意思强约束时,只有主要意思通达。
那么怎么结合两个学科的结论来研究这个问题呢?经过调研之后我发现,既然语境是计算机词义消解的关系,那么设计脑电/眼动实验探索哪些语境特征对于人脑词义消解是重要的,这个思路也许可行。于是联系了相关认知领域的人去讨论,吃了一鼻子的灰,发现认知科学需要严格控制变量、设计实验语料、研究某一个特性,与自然语言领域的研究思路完全不同,复杂的想法根本无法验证。
在这个阶段遇到了很多挫折,也做了很多反思,心态上从要彻底解决一个研究问题转变到从简单做起、改进已有方法的问题,这个心态的转变对于我来说是一个重要的转折,让我意识到不能一上来就给自己设定太宏大的目标,问题解决是一步一个脚印走出来的。在博三的最后阶段,发表了第一篇文章,也逐渐开始明白了如何研究一个科学问题。在这里,要十分感谢自己的导师,逐字逐句的帮我修改论文,用极大的耐心指导我如何撰写论文以及如何做研究。导师有很多话当时的我不太理解,到现在自己开始指导学生才能逐渐明白其中的道理。
迈过科研的第一道关卡之后,时间也进入到博四阶段,这时我逐渐找到了做研究的感觉,在语义分析中的语义表征问题上连续做了几个工作,发表了一些论文,也得以出国开会去宣传这些工作。
时间过的很快,转眼间就到了博士最后一年,面临工作的选择问题。我当时选择了直接留所工作,没有去找其他的工作机会。这是因为导师和课题组和研究氛围很好很温暖,而且对我来说自由的工作时间、感兴趣的工作内容、并且可以带来成就感的工作是我的首选,而留在研究所工作无疑很契合上述条件。
工作之后,有几个重要的转变,首先是心态上由做学生时的毕业压力到学术追求自我追求的压力,其次是研究工作由单打独斗的模式转向团队合作,由被辅导转向辅导学生。
上述言论仅从个人经历出发,并不适用于所有人,只希望大家可以顶住压力坚持下去,或快或慢都是成长,科研和工作只是生活的一部分。