> For the complete documentation index, see [llms.txt](https://openaidoc.kaimingwan.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://openaidoc.kaimingwan.com/readme/mo-xing.md).

# 模型

## 概览

OpenAI API由多种具有不同能力和价格点的模型驱动。您还可以使用微调对我们的原始基础模型进行有限的自定义，以适应您的特定用例。

| 模型                | 描述                                     |
| ----------------- | -------------------------------------- |
| GPT-3.5           | 一组模型，改进了GPT-3，可以理解并生成自然语言或代码。          |
| DALL·E            | 一个模型，可以根据自然语言提示生成和编辑图像。                |
| Whisper           | 一个模型，可以将音频转换为文本。 嵌入 一组模型，可以将文本转换为数字形式。 |
| CodexLimited beta | 一组模型，可以理解并生成代码，包括将自然语言翻译为代码。           |
| Moderation        | 经过微调的模型，可以检测文本是否可能敏感。                  |

我们还发布了开源模型，包括Point-E、Whisper、Jukebox和CLIP。

请访问我们提供给研究人员的[模型索引](https://platform.openai.com/docs/model-index-for-researchers)，以了解更多关于哪些模型在我们的研究论文中亮相以及InstructGPT和GPT-3.5等模型系列之间的区别的信息，供研究人员参考。

## GPT 3.5

GPT-3.5 模型能够理解和生成自然语言或代码。我们最具实力和性价比的模型是 gpt-3.5-turbo，它经过优化以适用于聊天，但也适用于传统的自动完成任务。

| 最新模型               | 描述                                                                                               | 最大请求      | 训练数据          |
| ------------------ | ------------------------------------------------------------------------------------------------ | --------- | ------------- |
| gpt-3.5-turbo      | GPT-3.5 最具实力的模型，经过优化以适用于聊天，与 text-davinci-003 相比成本只有其 1/10。将会更新到我们最新的模型版本。                       | 4,096 个词元 | 截至 2021 年 9 月 |
| gpt-3.5-turbo-0301 | gpt-3.5-turbo 在 2023 年 3 月 1 日的快照。与 gpt-3.5-turbo 不同，该模型将不会接受更新，并且仅在 2023 年 6 月 1 日结束的三个月期间得到支持。 | 4,096 个词元 | 截至 2021 年 9 月 |
| text-davinci-003   | 能够完成任何语言任务，比 curie、babbage 或 ada 模型具有更好的质量、更长的输出和一致的指令遵循，还支持在文本中插入完成。                            | 4,000 个词元 | 截至 2021 年 6 月 |
| text-davinci-002   | 具有类似 text-davinci-003 的功能，但是通过监督微调进行训练而不是强化学习。                                                   | 4,000 个词元 | 截至 2021 年 6 月 |
| code-davinci-002   | 优化用于代码自动完成任务。                                                                                    | 4,000 个词元 | 截至 2021 年 6 月 |
|                    |                                                                                                  |           |               |

我们建议在体验过程中使用 gpt-3.5-turbo，因为它会产生最好的结果。一旦您已经成功，我们鼓励尝试其他模型，以查看是否可以以更低的延迟或成本获得相同的结果。

> OpenAI模型是非确定性的，这意味着相同的输入可能会产生不同的输出。将温度设置为0会使输出大部分确定性，但仍可能存在一些变异性。

## 特定功能的模型

虽然新的gpt-3.5-turbo模型针对聊天进行了优化，但在传统的completion任务上也表现非常出色。原始的GPT-3.5模型针对文本补全进行了优化。

我们用于创建嵌入(embedding)和编辑文本(editing text)的端点使用其专门的模型集。

## Turbo

Turbo是与ChatGPT相同的模型系列。它针对会话聊天输入和输出进行了优化，但与Davinci模型系列相比，在完成任务时同样表现出色。在API中，任何ChatGPT能够很好完成的用例都应该能够在Turbo模型系列中表现出色。

Turbo模型系列也是第一个像ChatGPT一样定期接收模型更新的模型系列。

擅长：对话和文本生成

## Davinci

Davinci是最能胜任的模型系列，可以执行其他模型（ada、curie和babbage）能执行的任何任务，并且通常需要更少的指令。对于需要大量理解内容的应用，如特定受众的摘要和创意内容生成，Davinci将产生最佳结果。这些增强的功能需要更多的计算资源，因此每个API调用的Davinci成本更高，速度也不如其他模型快。

另一个Davinci闪耀的领域是理解文本的意图。Davinci非常擅长解决许多逻辑问题和解释角色的动机。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长：复杂意图、因果关系和面向受众的摘要。

## Whisper(耳语)&#x20;

Whisper是一种通用语音识别模型。它是基于大量多样化音频训练的多任务模型，可以进行多语言语音识别、语音翻译和语言识别。目前，通过我们的API，Whisper v2-large模型可以使用whisper-1模型名称进行访问。

目前，Whisper的开源版本和通过我们的API提供的版本没有区别。然而，通过我们的API，我们提供了一个优化的推理过程，使得通过我们的API运行Whisper比通过其他方式更快。如果您想了解更多关于Whisper的技术细节，可以阅读[相关论文](https://arxiv.org/pdf/2212.04356.pdf)。

## Embeddings(嵌入)

嵌入是文本的数值表示形式，可以用于衡量两个文本之间的相关性。我们的第二代嵌入模型，text-embedding-ada-002，是专门设计用来代替以前的16个第一代嵌入向量模型，成本只有一小部分。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在我们的[公告博客](https://openai.com/blog/new-and-improved-embedding-model)文章中了解更多关于我们最新嵌入向量模型的信息。

Codex(BETA测试)

Codex模型是我们的GPT-3模型的后代，可以理解和生成代码。它们的训练数据包含来自GitHub的自然语言和数十亿行公共代码。了解更多。

它们在Python方面最为强大，并且熟练掌握包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL甚至Shell在内的十多种语言。

目前，我们提供两种Codex模型：

<table><thead><tr><th>最新模型</th><th> 描述</th><th width="136">最大请求</th><th>训练数据</th></tr></thead><tbody><tr><td>code-davinci-002 </td><td>最强大的Codex模型。特别擅长将自然语言翻译为代码。除了完成代码，还支持在代码中插入完成。 </td><td>8,000个词元</td><td>截至2021年6月</td></tr><tr><td>code-cushman-001 </td><td>几乎与Davinci Codex一样强大，但速度略快。这种速度优势可能使其更适合实时应用。 </td><td>2,048个标记 </td><td></td></tr></tbody></table>

&#x20;   最多更多信息，请访问我们的Codex工作指南。

## Mederation(内容审核)

OpenAI的Moderation模型旨在检查内容是否符合OpenAI的使用政策。该模型提供分类能力，可以检查以下类别的内容：仇恨、仇恨/威胁、自残、性、未成年人性行为、暴力和暴力/图形。更多信息请参见我们的Moderation指南。

| 模型                     | 描述                            |
| ---------------------- | ----------------------------- |
| text-moderation-latest | 最强大的Moderation模型。准确性将略高于稳定模型。 |
| text-moderation-stable | 几乎与最新模型一样强大，但较旧。              |

## GPT-3&#x20;

GPT-3模型能够理解和生成自然语言。这些模型已经被更强大的GPT-3.5一代模型取代。然而，原始的GPT-3基础模型（davinci、curie、ada和babbage）是目前唯一可供微调的模型。

| 模型               | 描述                                         | 最大请求     | 训练数据       |
| ---------------- | ------------------------------------------ | -------- | ---------- |
| text-curie-001   | 非常强大，比Davinci更快、成本更低。                      | 2,048个词元 | 截至2019年10月 |
| text-babbage-001 | 能够完成简单的任务，速度非常快，成本更低。                      | 2,048个词元 | 截至2019年10月 |
| text-ada-001     | 能够完成非常简单的任务，通常是GPT-3系列中最快的模型，成本最低。         | 2,048个标记 | 截至2019年10月 |
| davinci          | 最强大的GPT-3模型。可以完成其他模型可以完成的任何任务，而且通常具有更高的质量。 | 2,048个标记 | 截至2019年10月 |
| curie            | 非常强大，但比Davinci更快、成本更低。                     | 2,048个标记 | 截至2019年10月 |
| babbage          | 能够完成简单的任务，速度非常快，成本更低。                      | 2,048个标记 | 截至2019年10月 |
| ada              | 能够完成非常简单的任务，通常是GPT-3系列中最快的模型，成本最低。         | 2,048个标记 | 截至2019年10月 |

&#x20;    \ <br>