ChatGPT:科研新助手

Embrace the ChatGPT Revolution in Academia

杨志宏

目录

  • ChatGPT 简介
  • ChatGPT 提示词
  • ChatGPT 科研辅助

ChatGPT 简介

什么是ChatGPT

ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是 OpenAI 开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以强化学习训练。ChatGPT目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。

ChatGPT训练过程

ChatGPT的训练主要分为两个阶段:预训练阶段和微调阶段。

预训练阶段

预训练阶段:在此阶段,模型被暴露于大量的互联网文本数据,并进行无监督学习,目标是让模型学习到语言的基本结构和语境相关性。这一阶段的训练是基于一个被称为”transformer”的神经网络架构,它通过预测给定的一系列词中的下一个词,从而学习语言模式。

微调阶段

微调阶段:在预训练完成后,模型会在由人类评估员监督的更小、更具体的数据集上进行训练。这些评估员按照OpenAI的指南,对模型生成的输出进行评估和反馈。在此过程中,模型被调整,以使其在特定任务(如生成连贯、准确的对话回应)上表现得更好。

如何理解ChatGPT生成的结果

  1. ChatGPT基于预测语言模式来生成回应,它不是理解你的问题,它只是模仿在训练数据中看到的模式,根据其学习到的大量文本数据来预测你可能想要的回答。
  2. 因此,ChatGPT生成的回答并不总是完全准确或可靠。它只是用来生成最有可能的回答,但这个回答可能并不总是正确的。
  3. ChatGPT只能处理到其训练数据的时间点的信息。用户可以通过提供最新信息文本进行局部调优。
  4. ChatGPT是从现有的文本中训练而来,这些文本中不可避免存在各种偏见,因此它生成的内容也表现出这些偏见。

ChatGPT 提示词

什么是提示词

提示词是一种发掘大模型威力的小模型,提示词通常由一段自然语言(即我们平常能够读懂的人类语言)所组成。

提示词案例 1: 争议点写作辅助提示词
我是一位教育学在读博士,我正在撰写一篇期刊论文,我的研究问题是翻转课堂并不利于教师权威的建立和教学效果的提升。作为我的学术助理,请根据以下模版完成前言部分的写作。

###
在最近关于_____的讨论中,一个争议点是_____。一方面,有人认为_____。从这个角度看,_____。但是,另一方面也有人认为_____ 。 用_____的话说, 他是这个观点的一个主要支持者,“_____”。按照这种看法,_____。那么,总结来看,问题就在于:_____,还是_____。 我自己的观点是_____。虽然我承认_____,但我仍然认为_____。例如,_____。虽然有人可能会反对,_____,而我的回答是_____。这个问题之所以重要,是因为_____。
###

ChatGPT建议使用前后成对的符号,如'''"""###等,对长文本进行标记。

使用 SRGCD 通用模型生成高质量提示词

所谓 SRGCD 模型,指的是通过具体化场景、角色、目标、条件、调试优化,提高 ChatGPT 生成内容的质量。

场景(Scene)

具体的场景,主要界定不同的学术场景,例如正在撰写博士论文开题报告、正在撰写研究计划书、正在进行田野调查、正在准备硕士毕业论文答辩PPT。

提示词案例 2: 场景提示词
中文:我正在准备/进行/筹划/计划【要做的事情或正在做的事情】
英文:I'm preparing/doing/planning [something to do or be doing]

角色(Role)

明确说明你目前的身份,例如什么专业、是否跨专业、国外还是国内……,同时界定和假设 ChatGPT 的角色,例如答辩组成员、你将扮演专家推荐人。

提示词案例 3: 角色提示词
中文:我是一名【填入年级】【本科生/硕士生/博士生/访问学者】,来自【大学/研究所/其他组织机构】。你将扮演我的【导师/同学/访谈对象/审稿人/学术同行/学术合作者】
英文:I am an undergraduate/master/doctoral student/visiting scholar from a university/research institute/other organization. You will act as my [tutor/classmate/interview subject/reviewer/academic peer/academic collaborator]

目标(Goal)

明确说明你想要实现的目标,例如:根据论文标题生成学术论文提纲、根据个人情况完成个人申博陈述……

提示词案例 4: 任务目标提示词
中文:我的目标是【动作:撰写、完成、进行、实施、设计、申请】【对象:开题报告、学位论文、学术论文、摘要、论文提纲、内容分析、问卷调查、案例研究、文献综述、寻找学术争议点、博士候选人、在国际学术会议发言】

英文:My goal is [Action: write, complete, carry out, implement, design, apply] [Object: proposal report, dissertation, academic paper, abstract, thesis outline, content analysis, questionnaire survey, case study, literature review, find academic controversy points, doctoral candidate, speak at international academic conference]

条件(Condition)

在实现目标的过程中的各种明确要求,例如,字数要求、提供可靠的参考文献、提供中英文答案、提供不同的输出格式(文字、表格、markdown等)

提示词案例 5: 条件提示词
1. 字数不少于/不多于【】字。
2. 需提供可靠的参考文献,并在正文用(著者,出版年)格式进行标注。参考文献的条数不少于/不多于【】条。
3. 请以【文本/表格/markdown】的格式进行输出。

调试(Debugging)

根据给出的答案的满意度进行调试,包括重新发问(每次也会有部分差异性的答案出现)、更换部分检索词、缩减重点关键词、中英文重复问。

关键在于根据生成内容的质量不断调整、尝试提示词内容,以便达到预期目标。

如何成为提问高手

ChatGPT只是一个高效率的助手,需要我们本身有足够广深的知识,才能更好地发问和对回答进行判断。因此,我们平时的阅读、学习、写作过程中,一定要有意识地积累和总结有关知识和模型。

例如风笑天(2014)在《社会研究:设计与写作》中,提出了广泛提问的思路:

涉及谁——以什么方式——在什么时候——在什么地方——有什么行为——有什么态度——有什么差别——有什么趋势——有什么特点——由于什么原因——有什么后果——具有什么关系——内在机制是什么

ChatGPT 科研辅助

确定选题

table table
a b

确定理论框架

确定研究方法

前言写作

数据分析

讨论写作

摘要写作

降重

小节

道冲而用之或不盈,渊兮似万物之宗。挫其锐,解其纷,和其光,同其尘。湛兮似或存,吾不知谁之子,象帝之先。

风笑天. 2014. 社会研究:设计与写作. 北京: 中国人民大学出版社.