Embrace the ChatGPT Revolution in Academia
ChatGPT,全称聊天生成预训练转换器(英语:Chat Generative Pre-trained Transformer),是 OpenAI 开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以强化学习训练。ChatGPT目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。
ChatGPT的训练主要分为两个阶段:预训练阶段和微调阶段。
预训练阶段:在此阶段,模型被暴露于大量的互联网文本数据,并进行无监督学习,目标是让模型学习到语言的基本结构和语境相关性。这一阶段的训练是基于一个被称为”transformer”的神经网络架构,它通过预测给定的一系列词中的下一个词,从而学习语言模式。
微调阶段:在预训练完成后,模型会在由人类评估员监督的更小、更具体的数据集上进行训练。这些评估员按照OpenAI的指南,对模型生成的输出进行评估和反馈。在此过程中,模型被调整,以使其在特定任务(如生成连贯、准确的对话回应)上表现得更好。
提示词是一种发掘大模型威力的小模型,提示词通常由一段自然语言(即我们平常能够读懂的人类语言)所组成。
ChatGPT建议使用前后成对的符号,如'''
或"""
或###
等,对长文本进行标记。
所谓 SRGCD 模型,指的是通过具体化场景、角色、目标、条件、调试优化,提高 ChatGPT 生成内容的质量。
具体的场景,主要界定不同的学术场景,例如正在撰写博士论文开题报告、正在撰写研究计划书、正在进行田野调查、正在准备硕士毕业论文答辩PPT。
明确说明你目前的身份,例如什么专业、是否跨专业、国外还是国内……,同时界定和假设 ChatGPT 的角色,例如答辩组成员、你将扮演专家推荐人。
明确说明你想要实现的目标,例如:根据论文标题生成学术论文提纲、根据个人情况完成个人申博陈述……
在实现目标的过程中的各种明确要求,例如,字数要求、提供可靠的参考文献、提供中英文答案、提供不同的输出格式(文字、表格、markdown等)
根据给出的答案的满意度进行调试,包括重新发问(每次也会有部分差异性的答案出现)、更换部分检索词、缩减重点关键词、中英文重复问。
关键在于根据生成内容的质量不断调整、尝试提示词内容,以便达到预期目标。
ChatGPT只是一个高效率的助手,需要我们本身有足够广深的知识,才能更好地发问和对回答进行判断。因此,我们平时的阅读、学习、写作过程中,一定要有意识地积累和总结有关知识和模型。
例如风笑天(2014)在《社会研究:设计与写作》中,提出了广泛提问的思路:
涉及谁——以什么方式——在什么时候——在什么地方——有什么行为——有什么态度——有什么差别——有什么趋势——有什么特点——由于什么原因——有什么后果——具有什么关系——内在机制是什么
table | table |
---|---|
a | b |
道冲而用之或不盈,渊兮似万物之宗。挫其锐,解其纷,和其光,同其尘。湛兮似或存,吾不知谁之子,象帝之先。