OpenAI最近发布了最新的o1版本(包括o1-preview和o1-mini两个版本),这意味着GPT系列又增添了一位强大的成员。o1系列的问世,给出了一个有力的回应:“强者依旧是强者。”在回答问题之前,o1会进行深度思考——它能够在响应用户前产生一长串的内部思维链。
四个亮点:
1)推理能力:在AIME 2024数学竞赛中,o1的预览版达到了56.7%的准确率,而正式版更是高达83.3%。在代码竞赛中,o1的表现也非常出色,从GPT-4o的11%提升到89%。
2)安全性:在最难的一次越狱测试中,GPT-4o得了22分(满分100分),而o1-preview模型得了84分。你可以在系统卡和我们的研究文章中阅读更多关于这一点的信息。
3)准确性:虽然o1在输出之前的一系列动作花费了更多的反应时间,但结果却更加准确,有理有据,逻辑上也能说得通。
4)编程能力:o1 mini比o1 preview更擅长编程。
作为一个GPT的忠实用户,小编今天就给大家对比一下4o、o1-preview以及o1-mini在学术论文写作中的区别~
文章较长,建议大家收藏慢慢学习!
在撰写一篇高质量学术论文时,必须以工匠的精细态度对待每一个环节,确保学术论文整体的流畅性与细节的完美。这个过程就像遵循一本指导手册,它为你提供了一份详尽的论文结构图,帮助你的写作过程更加有序和顺畅。
1.论文选题与规划
一篇优秀的文章背后,肯定有一个精心挑选的选题。选题的好坏直接影响着文章能够发表的期刊等级。许多同学却采取了相反的做法,将大量时间花在写作上,对于选题却不够重视,往往随意挑选一个题目就匆忙开始写作,这实际上是本末倒置的错误方法。另外,也有一些同学面临着选题的困难,不知道该写些什么。这些问题的根本原因在于他们没有进行充分的论文流程规划以及阅读相关文献进行参考。
主题确定:通过AI工具辅助选择一个感兴趣的、并且与翻译实践相关的主题。
研究问题:帮助同学们明确想通过翻译实践报告回答的具体问题。
初步规划:讨论报告的大致结构,包括引言、文献综述、翻译实践部分、分析讨论和结论。
下面我们先使用一个提示词进行辅助选题,同时对比GPT三个版本的输出变化。
提示词:
你现在的身份是一个[中美经济专家];
我想研究中美经济关系,请帮我想5个中美经济相关的论文选题。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
首先来看看输出区别,现在在输出开头处,o1两个版本会提示思考的时间。同时我们点击这个时间会提示到思考的过程有哪些内容。之前对比3.5、4.0和4o的区别时发现4o的输出非常快且效果惊人。现在o1-mini的速度更快!o1-preview思考的时间较长,在响应时间上不具备优势,但在结果的表现上却更加准确,有理有据,逻辑上也能说得通。
言归正传,我让GPT帮我选题,我们直接选择4o输出的《中美知识产权保护与技术转移的经济效应》这个论文题目。来看看后续的对比。
2.摘要
摘要是文章的精华,通常在200-250词左右。要包括研究的目的、方法、结果和结论。让AI工具作为某领域内资深的研究专家,编写摘要需要言简意赅,直接概括论文的核心,为读者提供快速了解的窗口。
下面我们先使用GPT多个版本辅助编写摘要的能力区别。
提示词:
我选择标题《中美知识产权保护与技术转移的经济效应》,请帮我写一份300字左右的摘要。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
3.关键词
关键词主要从论文标题、摘要及正文中提炼出来,需要准确反映论文的核心主题和专业领域。关键词的选择不仅有助于标引人员进行主题词的选取、数据库的建立以及文献的检索,而且也便于读者高效检索和引用相关学术成果,从而促进学术交流的深入进行。因此,这篇文章主要目的在于探讨如何在学术论文写作中有效地选取关键词,以确保论文的传播和影响力。精准的3-5个高频词汇排列有序,是论文主题与关注焦点的准确代表。
下面我们先使用GPT多个版本进行关键词选取能力对比。
提示词:
根据摘要内容,帮我选择精准的3-5个高频关键词,是论文主题与关注焦点的准确代表。并做简要说明。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
4.引言
引言部分引入研究主题,明确研究背景、问题陈述,并提出研究的目的和重要性,最后,概述研究方法和论文结构。
下面我们先使用GPT多个版本进行引言撰写能力对比。
提示词:
根据摘要和关键词内容,帮我写一篇300字左右的论文引言。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
5.正文
论文的核心部分,要求逻辑严密、条理清晰,以自然段或小标题的形式呈现。详细介绍研究的背景、相关理论、研究方法、实验设计、结果分析和讨论等内容。
下面我们先使用GPT多个版本进行大纲生成能力对比。
提示词:
你现在是一个[中美经济专家],根据摘要、引言、关键字等内容,帮我为论文《中美知识产权保护与技术转移的经济效应》拟一份大纲。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
论文正文是论文的核心内容,需要2-3万字。这里给出大体结构,然后根据主题结构让GPT产出相关内容。不过这里也确实被o1小小震撼了一下,更需要逻辑条理的大纲输出的内容更详尽!非常给力,而且o1-mini的速度确实不是吹的,很快!o1-preview的逻辑能力虽然慢,但是非常有条理!
6.推理论证结果
o1的官方测试数据
-
2024年高考数学试卷可以做到120+(满分150),10分钟就完成答题。 -
小学奥数题基本全能做对,列方程的标准解法和适合小学生的“妙解”都能想到。 -
之前让大模型困扰的一些问题,比如3.8和3.11哪个大,Pi和3.1416哪个大,strawberry里面有几个r,都可以做对。 -
编程方面,可以独立完成一个demo项目的开发,目测比目前代码能力最强的Claude 3.5 Sonnet代码能力更强。 -
OpenAI o1 System Card里面有个例子,在做一道CTF题的时候,那道CTF题远程验证环境的容器坏了,o1-preview就找到了比赛平台的漏洞,启动了一个新的容器把flag直接给读出来了。虽然OpenAI的原意是提醒AI的安全风险,但这也体现了o1主动与环境交互解决问题的能力。
7.结论
摘要是文章的精华,通常在200-250词左右。要包括研究的目的、方法、结果和结论。让AI工具作为某领域内资深的研究专家,编写摘要需要言简意赅,直接概括论文的核心,为读者提供快速了解的窗口。
下面我们先使用GPT多个版本进行编写结论能力对比。
提示词:
帮我编写论文《中美知识产权保护与技术转移的经济效应》总结部分内容,300字左右。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
8.参考文献
列出引用过的文献,按引用顺序排列,并确保格式规范。只列举确实阅读过的文献,包括书籍、期刊文章等,以便读者进一步查阅相关资料。也可以利用endnotes和zotero等文献管理工具插入文献。
提示词:
帮我编写论文《中美知识产权保护与技术转移的经济效应》参考文献部分,帮我找出10篇相关参考文献。
GPT-4o反馈:
GPT-o1-mini反馈:
GPT-o1-preview反馈:
名称 | GPT-4o | GPT-o1-mini | GPT-o1-preview |
---|---|---|---|
输出速度 | 快 | 很快 | 较慢 |
输出能力 | 强 | 较强 | 很强 |
代码能力 | 一般 | 强 | 较强 |
本文由 mdnice 多平台发布