模型

概览

OpenAI API由多种具有不同能力和价格点的模型驱动。您还可以使用微调对我们的原始基础模型进行有限的自定义,以适应您的特定用例。

模型
描述

GPT-3.5

一组模型,改进了GPT-3,可以理解并生成自然语言或代码。

DALL·E

一个模型,可以根据自然语言提示生成和编辑图像。

Whisper

一个模型,可以将音频转换为文本。 嵌入 一组模型,可以将文本转换为数字形式。

CodexLimited beta

一组模型,可以理解并生成代码,包括将自然语言翻译为代码。

Moderation

经过微调的模型,可以检测文本是否可能敏感。

我们还发布了开源模型,包括Point-E、Whisper、Jukebox和CLIP。

请访问我们提供给研究人员的模型索引,以了解更多关于哪些模型在我们的研究论文中亮相以及InstructGPT和GPT-3.5等模型系列之间的区别的信息,供研究人员参考。

GPT 3.5

GPT-3.5 模型能够理解和生成自然语言或代码。我们最具实力和性价比的模型是 gpt-3.5-turbo,它经过优化以适用于聊天,但也适用于传统的自动完成任务。

最新模型
描述
最大请求
训练数据

gpt-3.5-turbo

GPT-3.5 最具实力的模型,经过优化以适用于聊天,与 text-davinci-003 相比成本只有其 1/10。将会更新到我们最新的模型版本。

4,096 个词元

截至 2021 年 9 月

gpt-3.5-turbo-0301

gpt-3.5-turbo 在 2023 年 3 月 1 日的快照。与 gpt-3.5-turbo 不同,该模型将不会接受更新,并且仅在 2023 年 6 月 1 日结束的三个月期间得到支持。

4,096 个词元

截至 2021 年 9 月

text-davinci-003

能够完成任何语言任务,比 curie、babbage 或 ada 模型具有更好的质量、更长的输出和一致的指令遵循,还支持在文本中插入完成。

4,000 个词元

截至 2021 年 6 月

text-davinci-002

具有类似 text-davinci-003 的功能,但是通过监督微调进行训练而不是强化学习。

4,000 个词元

截至 2021 年 6 月

code-davinci-002

优化用于代码自动完成任务。

4,000 个词元

截至 2021 年 6 月

我们建议在体验过程中使用 gpt-3.5-turbo,因为它会产生最好的结果。一旦您已经成功,我们鼓励尝试其他模型,以查看是否可以以更低的延迟或成本获得相同的结果。

OpenAI模型是非确定性的,这意味着相同的输入可能会产生不同的输出。将温度设置为0会使输出大部分确定性,但仍可能存在一些变异性。

特定功能的模型

虽然新的gpt-3.5-turbo模型针对聊天进行了优化,但在传统的completion任务上也表现非常出色。原始的GPT-3.5模型针对文本补全进行了优化。

我们用于创建嵌入(embedding)和编辑文本(editing text)的端点使用其专门的模型集。

Turbo

Turbo是与ChatGPT相同的模型系列。它针对会话聊天输入和输出进行了优化,但与Davinci模型系列相比,在完成任务时同样表现出色。在API中,任何ChatGPT能够很好完成的用例都应该能够在Turbo模型系列中表现出色。

Turbo模型系列也是第一个像ChatGPT一样定期接收模型更新的模型系列。

擅长:对话和文本生成

Davinci

Davinci是最能胜任的模型系列,可以执行其他模型(ada、curie和babbage)能执行的任何任务,并且通常需要更少的指令。对于需要大量理解内容的应用,如特定受众的摘要和创意内容生成,Davinci将产生最佳结果。这些增强的功能需要更多的计算资源,因此每个API调用的Davinci成本更高,速度也不如其他模型快。

另一个Davinci闪耀的领域是理解文本的意图。Davinci非常擅长解决许多逻辑问题和解释角色的动机。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长:复杂意图、因果关系和面向受众的摘要。

Whisper(耳语)

Whisper是一种通用语音识别模型。它是基于大量多样化音频训练的多任务模型,可以进行多语言语音识别、语音翻译和语言识别。目前,通过我们的API,Whisper v2-large模型可以使用whisper-1模型名称进行访问。

目前,Whisper的开源版本和通过我们的API提供的版本没有区别。然而,通过我们的API,我们提供了一个优化的推理过程,使得通过我们的API运行Whisper比通过其他方式更快。如果您想了解更多关于Whisper的技术细节,可以阅读相关论文

Embeddings(嵌入)

嵌入是文本的数值表示形式,可以用于衡量两个文本之间的相关性。我们的第二代嵌入模型,text-embedding-ada-002,是专门设计用来代替以前的16个第一代嵌入向量模型,成本只有一小部分。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在我们的公告博客文章中了解更多关于我们最新嵌入向量模型的信息。

Codex(BETA测试)

Codex模型是我们的GPT-3模型的后代,可以理解和生成代码。它们的训练数据包含来自GitHub的自然语言和数十亿行公共代码。了解更多。

它们在Python方面最为强大,并且熟练掌握包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL甚至Shell在内的十多种语言。

目前,我们提供两种Codex模型:

最新模型
描述
最大请求
训练数据

code-davinci-002

最强大的Codex模型。特别擅长将自然语言翻译为代码。除了完成代码,还支持在代码中插入完成。

8,000个词元

截至2021年6月

code-cushman-001

几乎与Davinci Codex一样强大,但速度略快。这种速度优势可能使其更适合实时应用。

2,048个标记

最多更多信息,请访问我们的Codex工作指南。

Mederation(内容审核)

OpenAI的Moderation模型旨在检查内容是否符合OpenAI的使用政策。该模型提供分类能力,可以检查以下类别的内容:仇恨、仇恨/威胁、自残、性、未成年人性行为、暴力和暴力/图形。更多信息请参见我们的Moderation指南。

模型
描述

text-moderation-latest

最强大的Moderation模型。准确性将略高于稳定模型。

text-moderation-stable

几乎与最新模型一样强大,但较旧。

GPT-3

GPT-3模型能够理解和生成自然语言。这些模型已经被更强大的GPT-3.5一代模型取代。然而,原始的GPT-3基础模型(davinci、curie、ada和babbage)是目前唯一可供微调的模型。

模型
描述
最大请求
训练数据

text-curie-001

非常强大,比Davinci更快、成本更低。

2,048个词元

截至2019年10月

text-babbage-001

能够完成简单的任务,速度非常快,成本更低。

2,048个词元

截至2019年10月

text-ada-001

能够完成非常简单的任务,通常是GPT-3系列中最快的模型,成本最低。

2,048个标记

截至2019年10月

davinci

最强大的GPT-3模型。可以完成其他模型可以完成的任何任务,而且通常具有更高的质量。

2,048个标记

截至2019年10月

curie

非常强大,但比Davinci更快、成本更低。

2,048个标记

截至2019年10月

babbage

能够完成简单的任务,速度非常快,成本更低。

2,048个标记

截至2019年10月

ada

能够完成非常简单的任务,通常是GPT-3系列中最快的模型,成本最低。

2,048个标记

截至2019年10月

最后更新于