当前位置：谷歌学术镜像_Google学术搜索 » 学术资讯 » 学术界 » 文章详细

记住这5个问题，帮你快速理解一篇ML学术论文的要点

发布时间：2021-02-28

机器学习范畴十分炽热，新的模型、技术不时更新十分快，请求我们在平常的工作和学习过程中，会需求去阅读一些学术论文，跟踪某个范畴的最新动态。但读论文经常会有两种不适的觉得，一是容易遗忘，二是不能大纲挈领。遗忘通常是读了后面遗忘前面，或者过几日回忆本人读的论文完整不晓得是怎样回事。不能大纲挈领表现在喜欢逐字逐句的阅读，没有偏重点的从全局来学习论文。那么，我们应该如何阅读机器学习范畴的论文？谷歌 Robotics 研讨科学家 Eric Jang 在博客上写了一篇名为“How to Understand ML Papers Quickly”的文章，提到他的学员也经常问他一些大同小异的问题，比方 “arXiv 上的各种论文每天都众多成灾，我们又该如何去选择性地阅读？” 他提出，阅读大多数机器学习范畴的论文的益处在于，你只需求问五个简单的问题，就能弄分明学术论文的逻辑，并能防止很多费事，例如难懂的术语，糟糕的数学推导…这五个问题是：

1）函数迫近器的输入是什么？

例如，只要一个对象居中的224x224x3 RGB 视图。

2）函数迫近器的输出是什么？

例如，对应于输入长度为1000向量的图像。

经过这种“省略”的方式考虑机器学习系统的输入和输出，如此一来，你便能够跳过算法术语，并思索其他范畴能否用其他办法完成了同样的目的。我发现这种办法在阅读“元学习”范畴的学术论文时十分有用。经过将机器学习问题视为一组输入和预期的输出，你能够推断输入能否足以预测输出。假如不停止此练习，你可能会随意设置一个机器学习问题，输出可能无法由输入肯定。因而便有可能发明一个引发“错误”的机器学习系统。

3）关于输出的预测是以什么为代价来停止监视的？这个特定目的对世界又有什么样的假定？

机器学习模型是经过组合偏置和数据而构成的。有时偏置很强，有时又很弱。为了使模型更好地泛化，你需求添加更多偏向或者添加更多的无偏数据。正如“天下没有免费的午餐”理论所指出的，没有哪一个优秀的模型是能悄悄松松做出来的。举一个例子：许多最优控制算法都假定一个稳定而连续的数据生成过程，即马尔可夫决策过程（MDP）。在MDP 中，"状态"和"行动"经过环境的过渡动态肯定映射到"下一个状态、反应以及能否完毕"。这种构造固然十分寻常，但能够将损失停止公式化表达，使学习Q值遵照贝尔曼方程。

4）经过锻炼后，模型能够从以前不足为奇的输入/输出中概括出什么？

由于从数据或模型的体系构造中捕获了信息，因而机器学习系统能够很好地泛华。近年来，我们看到泛化的程度越来越高，因而在阅读学术论文时，我会去察看那些令人诧异的泛化功用以及它们来自何处（数据，偏置或两者兼而有之）。更好的归结偏置在该范畴存在很多噪音，例如因果推理、符号办法或以对象为中心的表示。这些是构建稳健而且牢靠的机器学习系统的重要工具，而且我晓得分隔构造化数据与模型的偏置界线可能很含糊。话虽如此，但让作者感到困惑的是，为什么有那么多研讨人员以为推进机器学习行进的方式是减少学习量并增加硬编码行为的量。我们之所以展开“机器学习”的科研工作，恰恰是由于有些事情我们不晓得如何去停止硬编码。作为机器学习研讨人员，我们应该将工作重点放在改善学习办法上，而将硬编码和符号办法留给机器硬编码研讨人员运用。

5）结论能否可证伪？

那些宣称不能证伪的论文不在科学范畴之内。

上一篇：整治学术造假现状：没有个人负责，没有公开调查过程
下一篇：中国知网查重检测七种学术不当行为介绍