致候选人:
现在,你准备在计算机科学的实验领域写一篇博士论文。除非你以前写过很多正式的文件,否则你会大吃一惊:这很难!
可能成功的途径有两种:
- 提前计划。
很少有人走这条路。少数人很快离开了大学,几乎没有人注意到他们。如果你想留下一个持久的印象,并且作为一名研究生有一个长期的职业生涯,不要选择它。
- 坚持不懈。
你所要做的就是熬过你的博士委员会。好消息是,他们的年龄比你大得多,所以你可以猜一猜谁最终会先到期。坏消息是,他们在这个游戏中更为熟练(毕竟,他们在面对博士委员会时坚持了下来,不是吗?)。
以下是一些指导方针,当你真正开始写作的时候,它们可能会对你有所帮助。这个清单会一直列下去。你可能不想一次就把它读完。但是,在你写任何东西之前,请先读一下。
总体思路:
- 论文是一种假设或猜想。
- 博士论文是一份冗长的正式文件,为某一特定论文辩护。(许多人使用”论文”一词来指代文档,以至于现在的词典将其作为”论文”的第三个含义)。
- 用来描述一篇论文的两个重要形容词是”原创性”和”实质性”。为支持一篇论文而进行的研究必须是两方面的,而且论文必须表明这两方面的内容。特别是,论文要突出原创贡献。
- 科学的方法是从一个假设开始,然后收集证据来支持或否认它。在撰写论文为某一特定论文辩护之前,必须收集支持该论文的证据。因此,撰写论文最困难的方面在于把证据和相关的讨论组织成一种连贯的形式。
- 论文的本质是批判性思维,而不是实验数据。分析和概念是这项工作的核心。
- 一篇论文集中在原则上:它陈述了经验教训,而不仅仅是背后的事实。
- 一般来说,论文中的每一项陈述都必须有发表的科学文献或原著为依据。此外,论文不会重复已发表资料中的批判性思维和分析的细节,而是将结果作为事实,并引导读者到资料来源了解更多细节。
- 论文中的每个句子在语法意义上都必须是完整和正确的。此外,论文必须符合严格的正式语法规则(例如,没有缩略语,没有俗语,没有污言秽语,没有未定义的技术术语,没有隐藏的笑话和俚语,即使这些术语或短语在口语中被经常使用)。事实上,论文的写作必须是清晰的。意义的细微差别很重要;术语和散文必须做出细微的区别。语言必须准确地传达所要表达的意思,不多也不少。
- 论文中的每个陈述都必须是正确的,并且在逻辑和科学意义上是站得住脚的。此外,论文中的讨论必须满足应用于数学和科学的最严格的逻辑规则。
人们应该从练习中学到什么:
- 所有的科学家都需要交流他们的发现。博士论文提供了与其他科学家交流的培训。
- 写论文需要学生进行深入思考,组织技术讨论,收集论据来说服其他科学家,并遵循严谨、正式地论据陈述和讨论的规则。
经验法则:
好的写作在论文中是必不可少的。然而,好的写作并不能弥补思想或概念的匮乏。恰恰相反,清晰的表述总是会暴露弱点。
定义和术语:
- 论文中使用的每个技术术语都必须参照以前发布的定义(对于具有通常含义的标准术语),或者通过在术语使用之前出现的精确、明确的定义(对于新术语或以不寻常方式使用的标准术语)来定义。
- 在整篇论文中,每个术语只能用一种方式使用。
- 避免一长串定义的最简单的方法是包含一个陈述:“本文档中使用的术语遵循[引文]中给出的术语”。然后,只定义例外。
- 引言部分可以给出术语的直觉(即非正式定义),只要稍后对术语进行更精确的定义。
避免使用的术语和短语:
- 副词
大多数情况下,它们经常被过度使用。用强硬的字眼代替。例如,可以说,“作家滥用副词。”
- 笑话或双关语
它们在正式文件中没有地位。
- “坏”,”好”,”好的”,”糟糕”,”愚蠢”
科学论文不作道德判断。使用”不正确/正确”表示事实的正确性或错误。使用精确的词汇或短语来评估质量(例如,“方法A需要的计算比方法B”更少)。一般而言,应避免所有的定性判断。
- “真”,”纯”
在”好”的意义上(它是判断性的)。
- “完美”
什么都不是。
- “理想的解决方案”
你又在评头论足了。
- “今天”,”现代”
今天是明天的昨天。
- “很快”。
多快?今晚晚些时候?下一个十年?
- “我们很惊讶地得知……”
就算你是,那又怎样?
- “似乎是”,”似乎”,
有些东西看起来如何并不重要。
- “看起来像是”
重要的是事实。
- “就…而言”
通常都很含糊。
- “基于”、”以X为基础”、”以…为基础”
小心,可以含糊不清。
- “与众不同”
并不是指”各种各样的”;和什么不同?
- “根据”
口语化
- “很多”
口语的,含糊的
- “类似于”
口语的,含糊的
- “种类”
口语的,含糊的
- “有点像”
口语的,含糊的
- “差不多”
口语的,含糊的
- “数量”
含糊其辞。你是指”一些”,”许多”,还是”大多数”?定量陈述更可取。
- “由于”
口语的
- “大概”
只有当你知道统计概率的时候。(如果你知道,请用数量说明。)
- “很明显,很显然”
注意: 对每个人来说都很清楚吗?
- “简单”
可以有负面的含义,如”傻瓜”。
- “还有”
用with就行了。
- “实际上,真的”
精确地定义术语,以消除澄清的需要
- “事实是”
使它成为一个元句子;重述
- “这个”,”那个”
就像”这引起了关注。”理由: “此”可以指前一句的主语,整个前一句,整个前一段,整个前一节等,更重要的是,它可以在具体意义上或元意义上进行解释。例如,”在: X表示Y”。这意味着…”读者可以假设这”指的是Y,或者是指X这样做的事实。即使在受限的情况下(例如,This calculation…),这个短语也很弱,而且常常是模棱两可的。
- “你会读到……”
第二人称在正式论文中没有地位。
- “我来描述一下……”
第一人称在正式论文中没有地位。如果自我参照是必要的,就用”第10条描述……”
- “我们”是指”我们看到了”
要避开的陷阱。理由: 几乎任何句子都可以用”我们”开头,因为”我们”可以指的是: 读者和作者、作者和顾问、作者和研究团队、实验计算机科学家、整个计算机科学界、科学界或其他未指明的群体。
- “希望这个项目……”
计算机程序不希望如此,除非它们实现了人工智能系统。顺便说一句,如果你正在写一篇人工智能论文,那就和别人谈谈: 人工智能的人有他们自己的规则体系。
- “…一位著名的研究人员…”
不管是谁说的,还是谁做的。事实上,这样的陈述对读者是有偏见的。
- 使用”很少”、”最多”、”全部”、”任何”、”每个”时要小心。
论文是精确的。如果一个句子说”大多数计算机系统包含X”,你必须能够为它辩护。你确定你真的知道真相吗?昨天生产和销售了多少台电脑?
- “必须”,”总是”
绝对地。
- “应该”
谁说的?
- “证明”,”证明”
数学家会同意这是一个证明吗?
- “显示”
用在”证明”的意义上。要证明某事,你需要提供一个正式的证明。
- “能/可以”
你妈妈可能已经告诉你区别了。
声音:
使用主动结构。例如,说“操作系统启动设备”,而不是“设备由操作系统启动”。
时态:
用现在时写作。例如,说“系统将页面写入磁盘,然后使用帧…”而不是“系统将在页面写入磁盘后使用帧…”。
尽早定义否定:
例如: 说“输出队列上没有数据块等待”,而不是说“等待输出的数据块不在队列上”。
语法与逻辑:
注意,每个句子的主语都是按动词所说的做的。说“程序必须使用x指令进行过程调用”与说“程序在调用过程时必须使用x指令”不同。事实上,第一个显然是错误的!另一个例子:“rpc需要程序传输大数据包”与“rpc需要允许程序传输大数据包的机制”不同。
所有的计算机科学家都应该知道逻辑规则。不幸的是,当话语语言是英语而不是数学符号时,这些规则就更难遵循了。例如,句子“there is a compiler that translate the n languages by…”表示存在处理所有语言的单个编译器,而句子“对于每个n种语言,都有一个编译程序来翻译…”表示可能有1个编译程序、2个编译程序或n个编译程序。当使用数学符号书写时,差异是明显的,因为“所有”和“存在”是相反的。
注重结果,而不是取得结果的人/环境:
“那天晚上在实验室工作了八个小时之后,我们意识到……“在论文中没有一席之地。不管你什么时候意识到这一点,也不管你花了多长时间才得到答案。另一个例子: “吉姆和我通过测量得出了表3中的数字……“。在论文中向吉姆致谢,但不要在正文中写上名字(甚至是你自己的名字)。你可能很想记录一长串没有任何结果的实验,或者记录一个导致成功的巧合。要完全避免。特别是,不要记录看似神秘的影响(例如,“如果那只猫没有爬过地板上的洞,我们可能就不会发现网桥上的电源供应错误指示器“。永远不要把这样的事件归因于神秘的原因,或暗示奇怪的力量可能已经影响了你的结果。总结: 坚持简单的事实。描述结果时不要纠结于你的反应或帮助你实现它们的事件上。
避免自我评估(包括表扬和批评):
下面的两个例子都是不正确的: “第二节中概述的方法代表了分布式系统设计的一个重大突破,因为……“,“尽管下一节中的技术并不惊天动地,……“
现存著作的参考文献:
人们总是引用论文,而不是作者。因此,即使论文有多个作者,也可以用单数动词来指称论文。例如,“约翰逊和史密斯“[J&S90]报告说……“
避免使用“作者声称x“这个短语。”索赔”一词的使用使人对”X”产生了怀疑,因为它引用的是作者的思想而不是事实。如果您同意”X”是正确的,只需在”X”后面加上引用即可。如果一个人必须引用一篇论文而不是一个结果,那就说”论文陈述了……”,或者”约翰逊和史密斯[J&S90]提出了……”的证据。
概念Vs.实例:
当一个概念和它的实例模糊不清时,读者可能会感到困惑。常见的例子包括: 算法和实现算法的特定程序、编程语言和编译器、计算机系统中的一般抽象及其特定实现、数据结构和内存中的特定实例。
概念和抽象的术语
当定义一个概念的术语时,要注意精确的确定该概念如何转换为实现。考虑以下讨论:
虚拟机系统包括一个称为地址空间的概念。当程序需要地址空间时,系统动态地创建地址空间,并在创建地址空间的程序使用完地址空间后销毁该地址空间。虚拟机系统使用一个小而有限的数字来标识每个地址空间。从概念上讲,每个新的地址空间都应该有一个新的标识符。但是,如果虚拟机系统的执行时间过长,以致用尽了所有可能的地址空间标识符,则必须重用一个数字。
重要的一点是,该讨论之所以有意义,是因为它独立于”地址空间标识符”定义了”地址空间”。如果人们希望讨论一个概念及其实现之间的区别,定义必须允许这样的区别。
知识Vs.数据
从实验中得出的事实被称为”数据”。”知识”一词意味着事实已经被分析、浓缩,或与其他实验中的事实相结合以产生有用的信息。
因果关系:
一篇论文必须仔细地将因果关系与简单的统计相关性分开。例如,即使在X教授的实验室中编写的所有计算机程序都比Y教授的实验室中编写的计算机程序需要更多的内存,它也可能与教授、实验室或程序员无关(例如,在X教授的实验室中的工作人员可能正在开发比Y教授的实验室中的应用程序需要更多内存的应用程序)。
仅得出有根据的结论:
我们必须谨慎,只得出证据支持的结论。例如,如果程序在计算机A上的运行速度比在计算机B上慢得多,除非排除了计算机操作系统、输入或输出设备、内存大小、内存缓存或内部总线带宽的所有差异,否则不能得出A中的处理器比B中的处理器慢的结论。事实上,除非有对照实验的结果(例如,当计算机处于空闲状态时,多次运行一组程序),否则必须避免判断。即使某些现象的原因似乎很明显,但如果没有确凿的证据支持,就不能得出结论。
商业与科学:
在一篇科学论文中,人们从不对一种思想/方法的经济可行性或商业成功得出结论,也不会去思考一种思想的发展历史或起源。科学家必须客观的评价一个想法的优点,而不论其在商业上的普及程度如何。特别是,科学家从不认为商业上的成功是衡量价值的有效标准(许多流行产品既不是精心设计的,也没有经过精心设计)因此,像”400多家供应商使用Y技术制造产品”这样的说法在论文中是不相关的。
政治与科学:
科学家在评估观点时要避免所有的政治影响。显然,不管政府机构、政党、宗教团体或其他组织是否赞同某一想法并不重要。更重要而又经常被忽视的是,一个想法是由一位已经获得诺贝尔奖的科学家还是一名一年级的研究生提出的并不重要。我们必须独立于来源来评估这个想法。
规范组织:
一般来说,每一篇论文都必须定义推动研究的问题,说明为什么这个问题很重要,告诉别人做了什么,描述新的贡献,记录验证贡献的实验,并得出结论。论文没有规范的组织;每个都是独一无二的。然而,在计算机科学实验领域写论文的新手可能会发现以下示例是一个很好的起点:
- 第一章:导言
对问题的概述;为什么它很重要?对现有工作的总结,以及对你的假设或要探讨的具体问题的陈述。让任何人都能读懂它。
- 第2章:定义
只接受新条款。使定义精确、简洁、明确。
- 第3章:概念模型
描述你工作的核心概念。把它成为一个”主题”,把你所有的论点联系在一起。它应在概念层面上回答导言中提出的问题。如有必要,再增加一章,对问题或其解决方案进行补充说明。
- 第四章:实验测量
描述那些为你的论点提供证据的实验结果。通常,实验要么强调概念验证(证明一种方法/技术的可行性),要么强调效率(证明一种方法/技术比现有的方法/技术能提供更好的性能)。
- 第5章:推论和结果
描述中心思想的变化、扩展或其他应用。
- 第6章:结论
总结学到的知识和应用的方法。提及未来研究的可能性。
- 摘要:
这篇论文的摘要(几段)。描述问题和研究方法。强调原创贡献。
建议的写作顺序:
撰写论文最简单的方法是由内而外。首先写下描述你的研究的章节(上面大纲中的3、4和5)。收集出现的术语,并为每个术语保留一个定义。定义每一个技术术语,即使您用的是传统的方式。
将定义组织到单独的一章中。使定义精确和正式。回顾后面的章节,以验证技术术语的每次使用都符合其定义。读完中间章节,验证术语,写出结论。接下来写介绍。最后,完成一个摘要。
成功的关键:
顺便说一句,成功的关键在于: 实践。从来没有人通过阅读这样的文章来学习写作。相反,你需要练习,练习,再练习。每一天。
临别的想法:
我们给你留下以下的想法来考虑。如果它们现在对你来说没有任何意义,那么在你写完一篇论文之后再去看一遍。
在巨大的痛苦之后,一种正式的感觉来了。
——艾米莉·狄金森
一个人可以在任何时候写作,只要他坚持不懈。
–塞缪尔·约翰逊
一直走到路的尽头。
–哈里·劳德
一般的博士论文不过是把尸骨从一个墓地转移到另一个墓地的过程。
–弗兰克·J·多比
原文链接:https://www.cs.purdue.edu/homes/dec/essay.dissertation.html