OpenAI 推出新工具以快速构建人工智能语音助手-haoqq AI Tools & Websites

OpenAI发布了一系列新工具，使开发者可以更容易地基于其人工智能技术构建应用。新的实时工具将立即投入测试，允许开发者使用一套指令创建人工智能语音应用程序。

此前的流程要求开发人员至少经过三个步骤：首先转录音频，然后运行生成文本模型得出查询答案，最后使用单独的文本到语音模型。OpenAI 的大部分收入来自使用其服务构建自己的人工智能应用的企业，因此推出先进功能成为其关键卖点。

随着包括谷歌母公司 Alphabet 在内的科技巨头在其业务中整合能够处理视频、音频和文本等不同形式信息的人工智能模型，竞争也日趋白热化。

OpenAI 推出了一个模型训练后微调工具，允许开发者利用图像和文本改进模型生成的反应。这一微调过程可以包括来自人类的反馈，人类可以根据模型的反应向其提供好的和坏的答案示例。利用图像对模型进行微调将使模型具有更强的图像理解能力，从而实现增强视觉搜索和改进自动驾驶汽车物体检测等应用。

还推出了一种工具，可以让较小的模型从较大的模型中学习，同时还推出了 “提示缓存”（Prompt Caching）技术，通过重复使用人工智能之前处理过的文本片段，将一些开发成本降低了一半。

OpenAI 推出新工具以快速构建人工智能语音助手