OpenAI 推出新工具以快速构建人工智能语音助手

2024-10-04

OpenAI发布了一系列新工具,使开发者可以更容易地基于其人工智能技术构建应用。新的实时工具将立即投入测试,允许开发者使用一套指令创建人工智能语音应用程序。


此前的流程要求开发人员至少经过三个步骤:首先转录音频,然后运行生成文本模型得出查询答案,最后使用单独的文本到语音模型。OpenAI 的大部分收入来自使用其服务构建自己的人工智能应用的企业,因此推出先进功能成为其关键卖点。


随着包括谷歌母公司 Alphabet 在内的科技巨头在其业务中整合能够处理视频、音频和文本等不同形式信息的人工智能模型,竞争也日趋白热化。


OpenAI 推出了一个模型训练后微调工具,允许开发者利用图像和文本改进模型生成的反应。这一微调过程可以包括来自人类的反馈,人类可以根据模型的反应向其提供好的和坏的答案示例。利用图像对模型进行微调将使模型具有更强的图像理解能力,从而实现增强视觉搜索和改进自动驾驶汽车物体检测等应用。


还推出了一种工具,可以让较小的模型从较大的模型中学习,同时还推出了 “提示缓存”(Prompt Caching)技术,通过重复使用人工智能之前处理过的文本片段,将一些开发成本降低了一半。


相关标签