aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

论文阅读-明白问题的重要性【研究的艺术·二】

研究的艺术的第2部分:

  • 怎么样去找到你研究的问题
  • 想清楚自己研究问题的重要性是什么

找问题去解决 是研究领域一个独有的事情,在做一件事情之前,想清楚这件事情的意义是非常重要的。

这个是具有普适性的,在生活中或工作中都可以用的到。这样既可以将事情做的更好,可以避开无意义的事情从而节省时间。


第3章 从话题到问题(topics to questions)

摘要

在自己的兴趣之中,找到一个话题然后适度的调整它的大小,使得我们能在这上面做研究。对于这个话题,我们需要提出一些问题,来指导我们做研究。

正文

  • 在研究的时候,可以自由的选择话题去做(学术界 相对高;工业界 相对低)
  • 自由也有危害:定不下来具体要做什么事情(进入一个新的行业 或者 刚开始做研究)
  • 一些定义:
    • subject:学术领域(气候变换、人工智能、计算机视觉等)
    • topic:话题,即领域内特别兴趣点(气候变换对鸟的迁移带来的影响、怎么样高效的设计卷积神经网络使得图片的分类精度更高)
  • 为什么要选择话题?【因为很难有一个研究是针对整个研究领域来做的,】所以一定要在自己的领域里面找到一个话题,这样才可以往深挖。
  • 话题是一个使得你可以在里面问一些问题的途径,如果回答这个问题回答得比较好的话呢,整个领域的研究人员都会对它感兴趣,而且好的答案能够在一定程度上推进整个领域往前发展。
  • 话题本身,也可能比较大也可能比较小。
    • 大就是说,在整个研究领域中很常见的一个话题(心理学中害羞或愿意冒险是人类学来的还是天生的)
    • 小众一点的也可以,但只有某些特定的研究人员感兴趣(把咖啡放在桌上之后留下的印子为什么一定是个圆形)
    • 大家都感兴趣的话题,肯定有更多人参与研究,所以竞争更加激烈一点;
    • 比较小众的话题在里面做出比别人更好的工作的概率更高一点,但是会导致你就算做出来受众没那么广;
  • 最重要还是对这个话题问一些问题,然后你问题的答案,别人可能会觉得重要,甚至这个答案在一定程度上能改变整个研究领域。

区分什么是question什么是problem?

  • question,就是疑问,就是说问一个问题,然后需要来做答案的
  • problem,可认为是一个困难,就是存在一个问题,如果不去解决他的话,可能会带来一些危害
  • 往细的说,一个疑问不一定会带来一个问题,一些问题回答与否,并不都会带来什么后果;但有些问题的回答可以解决很大的问题
    • a problem或者一个困难或者一个问题,就是研究界觉得是值得去解决的一件事情
    • a question或者说一个疑问呢,是找到一个问题的途径,也就是说,针对话题问一些问题使得我们可以找到一些方法来解决某个problem
  • 这两个是可以区分开的,也就是针对一个话题,要问很多这样子的问题,然后找出里面到底谁值得去回答

怎么样从兴趣到一个话题

(兴趣到话题再到疑问)

在通过读一些文章之后去发现自己没有发现的兴趣,然后从中找到一个话题,话题主要取决于自己的兴趣

对于技术领域来说,能考虑的就那么几件事情:

  1. 怎么样把一个东西的效果做出来,就是针对一个问题我们提出个算法,使得之前的算法都不是很行,用了这个算法之后行了
  2. 怎么样把它做大,数据更大,整个规模更大
  3. 怎么把它做便宜一点
  4. 怎么样把它做安全一些

看到一个技术点或者一个话题可以带上以上四点来考虑,在这之后看看自己对什么东西感兴趣,然后针对这些兴趣去找到对应的话题

这本书介绍了很多东西可以去看一看,但主要还是偏文科的,跟我们理工科还是有不一样的地方


如何将话题变小,并使其能开始做研究?

怎么使话题促成一个比较好的研究工作?能不能把这个话题换算成一个论点?这个论点看上去是有价值去讨论的。

当找到合适的话题的时候,就要问一些问题了。常见的错误:当找到一个合适的话题的时候,就会迫不及待的把这个所有话题相关的文章、资料都找起来读一读。这样子的效率是比较低的。因为你去读的时候,如果没有带着问题出发的话,你可能读起来就不那么的专注了。

李沐老师对于上面例子的观点:

  • 与作者不同的是老师觉得,如果你是真的新进入一个领域或者一个话题的时候,不一定能问出什么样的问题出来,可能干的事情就是把那些文章都找出来读一读然后总结一下。
  • 因为很多第1年第2年的硕士生或者博士生他干的事情,就是找到一个话题之后,就把整个话题的文章拿出来写一个综述文章,这样子能够对整个话题有一个比较全面的认识,当比较熟悉之后就知道哪一些东西是可以问合适的问题。
  • 反过来讲,当你打算去写综述的时候呢你其实也已经问了一个问题:这个话题上有没有很好的综述文章,如果答案是有的话,那么就不要干这个事情了,就读一下综述的文章,在里面有一个比较全面认识,就可以开始想自己的问题;如果没有的话,就变成了一个实际的problem,可以给大家写一个综述的文章,给大家带来价值。在这个时候很有可能就可以问了一个很好的问题。
  • 当开始真正的写综述的时候,再去读文章就会去想这篇文章提出的东西怎么样放进我的综述文章里面,也就是综述里面需要对整个话题、整个子领域给画一个比较大的图,然后把所有的工作放进图里面把他们之间联系起来。

更好的是说,在读论文的时候,能带着一些具体的一些问题(能够真的成为最后研究的一些问题)来去读的话,专注度会更好一点。


怎么样评估你的问题

当对某一个问题感兴趣的时候,应该问自己个更难的问题,叫做“so what”。

  • 就是说我如果解决了这个问题,又怎么样呢,别人会不会关心,他能给别人带来什么样的好处,是不是能够推动整个领域的发展,或者推动领域在一个小地方的发展,能不能启发别人做更多的工作;
  • 也可以反过来问,假设我不去回答这样个问题,会不会有什么样损失,别人会不会觉得错过了一个亿,是不是整个领域可能会停止向前发展很多年。
  • 如果你的答案是说没有,就是说是因为兴趣而做的也没有关系,这可以使得我们继续往深里面走,但是还得不断的去问SO WHAT这个问题,去想我现在的东西so what,别人care不care。
  • 对自己狠一点,这样子才能比较客观一点。在生活中,时不时很tougher的问一问自己so what 这个问题,能够使得生活变得更加简单,发现很多事情其实没必要做的,会发现一些更有意义的事情

怎么样找到我们的问题以及怎么样去问so what这个问题

  • 先把话题给列出来(把topic的名字你找出来),句式:我想去 学习/做/研究 _______
  • 有了话题之后再其后加间接的问题,就是加个w词(6w1h)
  • 去想清楚问题的重要性,如果问题是一个开放性的问题的话,那么问题的重要性很有可能就是为了帮助读者更好的了解 怎么样 为什么 或者 是不是 的问题啊

在so what 这个问题上继续展开

  • 在一开始找问题的时候,很有可能找到的问题就是这个领域关心的一些问题。那么这时候就不那么需要去关心这个东西的意义在什么地方
  • 在技术领域,通常我们去找一个方法来解决某一个痛点,只要你的方法真的能够比较好的解决这个痛点的情况下,一般都是有意义的,最后的意义的大小取决你这个痛点到底是有多痛以及是多少人觉得痛
  • 但是,很多时候其实是并不知道我们的这个东西为什么重要,特别是偏理论点的研究或者是很开放性的问题。在这个情况下一开始是OK的,就是说一开始并不知道为什么要做这个事情,随着研究慢慢深入,我们不断的去问自己说,找出来的这个东西(发现这个东西)到底有没有用,别人到底在不在意
  • 所以不断的去想这个事情,也会指导你的研究的方向。当我们有没有想清楚这个事情的时候,很有可能这个研究是不能停的。只有当我们大概是知道为什么别人觉得这东西有用的时候,我们是可以把研究停下来,开始写论文了
  • 总结一下:这里面是有3步的:我们的话题是什么;在这个话题里面的问题是什么;为什么别人会在意这个事情

怎么去找话题

  • 当我们去参加一个比如说科研实践这样子的课的话,在你的兴趣点里面找到一些话题来研究
  • 如果已经有了一个研究领域的话要去怎么样找:
    • 去读一些教科书啊或者去上节课(书和课要比现在学的要再往上一层,因为了解一下自己已经懂得东西,可能也没什么新的想法)
    • 参加一些这个领域的学术报告,参加一下研讨会,跟大家讨论一下、问一些问题,看看大家在讨论什么东西;
    • 问问老师(如果你的老师是一线的研究员的话,他肯定在心中是有一些想法的)
    • 去网上找一找谈论

李沐老师的看法:

  • 除非是在一个比较大的团队里面,有很多人一起做一个事情,以及说有大的数据或者有比较多的计算资源的话,一般来说尽量不要去碰那种大家都在谈的特别大的领域。因为这里面的人特别多,比如说啊图片分类问题,目标检测问题,以及现在大家都在做的那些特别大的transformer模型。因为就算有一个很好的想法,但是要把文章写出来的话,需要大量的实验以及大量的精力去调这种东西,要做出效果的话,不是一个人很短时间就能做出来的。
  • 反过来讲,可以去关注一些稍微小一点的问题,从小的地方开始,也许可以往大的方向靠。那么怎么样找小的问题,可以在网上找一找(reddit上面很多这样子讨论,大家会分享一下自己的使用的一些经验)
  • 可能比较好的一个办法是说:如果有时间的话,可以去公司里实习,去看一下整个工业界中在应用人工智能的时候,遇到的一些痛点。很多时候工业界的人,他自己可能没这个想法,反正就这么痛,用过去就已经习惯了。但是我们作为一个刚进去的实习生,是个外来者,可以去仔细的观察大家是怎么样用的,遇到了什么问题,去把这些小的事情抽象出来,总结出来就变成了一个研究的问题了。然后只要观察仔细的话,其实是会发现很多这样子的问题,这里面的小问题很有可能是能支撑我们几年的研究的。

本节的核心思想

  • 怎么样从兴趣点开始去找到一个话题,然后把这个话题缩小到足够小的范围,使得我们能够去驾驭它,也使得它足够大到支撑一个比较好的研究
  • 要在这个话题里面去问很多问题,因为我们的研究都是用来解决问题的,所以一定要有问题
  • 有了问题之后,你要去问,最重要的 so what的问题,就是说解决这个问题要怎么样。在真的动手去解决问题之前,真的就要去想一想,假设半年之后,1年之后我解决了这个问题,那么别人关不关心这个事情
  • 在做任何项目之前,都应该去想想这个东西做出来它的意义在于什么,不要去想说能不能做出来。就假设说有足够的资源,运气足够好,能把它做出来最好的结果以及能做出来情况下,去想一想对别人的影响有多大(这个事情的意义的天花板在什么地方)

第4章 从疑问到问题

前言

  • 在这一节将解释怎么样去把一个question变成一个problem,而且是一个读者认为值得解决的问题
  • 作者把问的问题question和值得解决问题problem给区分开来,帮助我们去了解这样子的一个思考的过程
  • 这个思考的过程,不仅仅是对新手有用,在以后如果要指导别人做研究的话,也需要了解这一个过程来帮助别人来更好的思考

正文

  • 回顾一下在上一章所提出了的3步公式来解决问题,首先提出话题:在研究什么,然后问一个问题,然后需要去找出回答问题之后的意义在哪里。这样就找到了一个读者认为是值得解决的问题,也就能创建一个与读者的强联系。

理解研究问题

研究的问题有两类:

  1. 实际问题(practical problem):比如说一个算法他跑的比较慢,解决他的话会让它跑得更快了;一个任务在某个数据集上的精度不是很高,可以提出一个新的算法解决它;这个领域没有一个很好的数据集能够让大家更好的去评估这个问题,那我提出个数据集;这都是解决一些实际的问题
  2. 概念问题(conceptual problem):这些问题不是要去解决某一个实际的痛点,而是说如果我们回答他的话,会对某一个事情或者这个世界有一个更好的认识。在科学领域,绝大部分问题是这种概念上的一些问题,帮我们更好的理解某一个东西。

但是在技术领域,更偏向实际的问题。当然也有很多偏理论的问题,比如说了解batch normalization为什么能够工作,以及说深度学习为什么能工作,甚至机器学习为什么能工作。这里面有很多的理论工作,但是我们只是目前为止,没有太多的去涉及这些的论文,所以导致大家可能觉得这些东西不多。但实际上在整个人工智能领域 特别是机器学习,可能是在深度学习之前啊,可能至少有1/3的论文是关于这样子的一些概念性的问题。

这个问题是怎么样来的:

  • 首先是有一些实际的问题(在日常生活中碰到一些东西)
  • 然后就会有动机(motivates)去找到一些研究的问题(值得research的问题,通常是一些开放性的你不可能立马就知道答案的或者别人觉得没有很容易就解决的,其中就一些有价值的问题)
  • 有价值的问题就定义了一些啊研究的实际的或者是概念上的问题
  • 这样子的问题导致说,我们要去研究出他的答案,就是整个研究工作在干的事情
  • 这些研究答案能够去帮助解决这些实际的问题

为什么要有问题?

  • 如果你没有问题的话,可能你整个论文写出来就是很多数据在里面,很多证据摆在里面,但是别人看上去就没有能找到你的观点(point)在哪里
  • 很多新手写作就是没有把东西聚焦在某一个问题上,使得读者跟不上你的节奏,也不知道到底在问什么问题,所以还是需要有一个问题

问题的结构

不管是实际的问题还是概念上的问题都有一个下面的结构:

  1. situation condition就是说你的状况
  2. 你不想要的一个结果(如果不解决它的话,可能需要去付某一些不想付的代价)

需要注意的是所谓的代价,其实是读者关心的,不是我们自己要付的代价而是他们要付的代价

怎么样从读者的角度去找出这样子的代价:从自己的状况开始不断的问so what

概念性的问题会有什么样的区别:

  • 在实际问题上,我们的状况通常是一些状态,导致会付出我们不想要付的代价
  • 但对于这种概念上的问题来讲我们的状态通常是说不知道某或者不了解某一个东西,这就是condition;一般来说不理解某一个东西,不会给我们带来立即的一个代价(除了考试),所以一般不会去谈他的代价
  • 那它的后果是什么:如果不能了解这个问题的话,那么就会无法去理解一个更重要的问题,而这个重要的问题,大家都觉得我们应该去了解的

作者画了幅图来说明:我们去了解我们的第一个问题(研究要去回答的问题)能帮助我们了解一个更大的一个问题,就是从Q1 一直到Q2,只要Q2足够大而且确实是能过去的话,那么这还是有价值的。

如何更好的去找到这样子的一个后果:可以反问大家,如果我不能回答这个问题的话,会导致我不能回答什么事情。概念性的问题,比实际的问题在问上去觉得更加虚一点,因为看不到一些事实上可见的代价。很多时候这些问题最后也只是满足了人类的一个好奇心。

怎么样去区别纯研究和应用的研究?

  • 纯研究就是去回答一个概念上的一个问题,应用的研究就是去解决一个实际上的问题
  • 纯研究通常会出现在比如说自然学科领域,在学术界会多一点。在工业界的话,大部分的研究是应用性的研究,当然在学校也是一样,偏技术类的研究通常都是应用性的研究,就是去回答一些实际的问题
  • 但具体的区别就是说你最后你的重要性也就说 so what 的问题,这个问题是要去回答一个问题,就是满足大家的一个好奇心,就是纯研究,还是说去解决一个实际的问题,降低某一个代价,就是应用的一个研究
  • 同样主题的东西,最后的significance不一样,导致了在纯研究和应用的研究的差异。应用性的研究,大家可能会觉得问题不大,反正因为能看到实际的一些结果。但是对纯研究的话,很多说大家对上面不是那么的理解。如果是做纯研究领域的话,想让大家能够更好的理解你研究价值,也可以往实际的那些应用去靠

怎么样找到一个好的研究问题

  • 找人帮忙:去跟别人讨论然后不断的去问so what的问题,有人帮你讨论其实会更好一点
  • 在阅读中寻找问题
  • 从自己的总结中选择:在写的时候通常会想的比较全面,所以写的比较客观,然后把它写下的时候也是帮助我们将整个思维想的更全面
  • 找到一个好的问题,是一个研究者可能需要花很多年的一个事情,需要跟可能比我们更善于去找好问题的研究者去合作,从他那里学习不断的去学习怎么样找到这个领域的好的的问题

问题的解决前提

  • 在真的去解决一个问题之前,不要去想说能不能解决它。能不能解决它其实是后一步的事情,先要问的问题是说读者认不认为这个东西值得解决
  • 作者直接把后果说了出来,假设我们不这么做的话,那么很有可能读者会不在意(care)我们的工作,也就是为什么在做一个问题之前,一定要想说读者会不会觉得这个问题值得解决

怎么样摆脱进入一个新的领域时不知道问题重不重要的焦虑:

  • 首先要承认这个问题,不可能在一开始就知道问题是不是重要的,很多时候需要写一篇论文然后看一下数据怎么样,所以不是一两天的事情

李沐老师的办法:

  • 不要等到真的把研究做完论文写完,再去给别人看说这个东西值不值得做。要在一开始的时候,尽量的在有想法的时候,跟别人谈,跟你的同学谈也行,同事谈也行,老师谈也行,甚至是可能针对的用户谈也行,就看看他们关不关心这个事情
  • 不要等到你的研究真的做完,可以是做了中间一半比如说1/3或者1/2的时候,准备一个10分钟、20分钟的小报告,然后在本地的一些研究小组里面给大家讲一讲,看一看大家的一个反馈。(可以在workshop上面投稿,看看大家的想法)
  • 在工作中,在公司的时候,想做任何研究的时候,在做它之前一定要想清楚说哪个产品团队或哪个客户可能会需要这个东西,他们会不会把这个研究工作做进产品里面。在做之前先别急着动手,先想清楚你要做什么样的问题,可能用什么方法,然后你去跟这些未来可能存在的这些啊合作方去聊,告诉他说:我准备做这个问题,你感不感兴趣,你感不感兴趣把这个东西放进你的产品里面
  • 核心是说要在做研究的过程中,要不断的跟潜在的读者(用户)沟通,使得可以根据这个交互来帮助我们改变整个研究的一个方向。也是确保在研究做完之后,最后是有人关心有人买账

第5章 从问题到学术资源

在有了问题的时候,怎么样去找资源(文中偏文科):

  • 在技术领域,要去解决某个问题,先去找到跟你这个问题最相关的一两篇论文,然后去看他引用了谁,就是往前走,看看他之前的工作长什么样子
  • 不要去看一篇论文对前面工作总结,要去把那些他真的引用的那些东西真的拿去看一下,完成一个自己的一个总结,然后再看一下谁引用这一篇文章
  • 把这个论文往前走往后走,基本上能找到要的那些资源了

第6章 使用学术资源

怎么样评估一篇论文的好坏:

  • 看引用,大概就知道这篇文章有多少人读它,多少人关心它,这个方法主要是针对已经发表了几年的文章
  • 对于新的文章是说,至少在计算机领域,不管是杂志也好会议好都是有排名的,虽然排名也不那么可信。假设一篇文章引用的那几篇主文章 就是说我们的方法、做对比的或者基于的那些文章,发表在某一个会议的时候,我们的文章也通常要发表过去
  • 研究也是有圈子的,假设想发一个一流会议的文章的话,那么我们去读的和引用的,和基于的工作最好也是一流会议甚至是更好

本期总结

总结:

  • 第2部分的标题叫做问问题然后找到答案
  • 核心是说先找到大小合适的话题,然后问一些问题,然后把一个读者认为值得去了解答案的问题抽出来,做成一个研究问题,我们的研究问题可能是实际的,也可能是概念上的
  • 不管是哪类问题都要想清楚:
    • 它的状况是什么
    • 不解决他的话他的后果是什么
  • 后面两节是说给一个问题怎么样找到资源,就找到前面的工作,然后怎么样读懂别人的工作,以及把自己的工作放在别人的工作之上
  • 核心是说要学懂前面两章讲的东西,就是话题、问题以及他的后果

参考资料

https://www.bilibili.com/read/cv17357477