博客 | 首席技术官办公室

生成式人工智能不存在“一刀切”的模型

Lori MacVittie 缩略图
洛里·麦克维蒂
2024 年 6 月 25 日发布

根据头条新闻,OpenAI 是城里唯一的生成式 AI 游戏。 每次关于人工智能的对话都会提到它,甚至这一次也是如此。 但它并不是唯一的服务,也不是唯一可用的模式。 

事实上,企业对生成式人工智能的采用并不像新闻标题所暗示的那样同质化。  

我们最近的研究发现,组织平均采用近三种不同的模式。 这种选择背后的原因似乎是由用例驱动的。 

例如,看到安全操作作为用例倾向于开源模型并不奇怪,这些模型可以私下进行训练,而不必担心暴露流程和敏感的公司数据。 内容创作也是如此,通常需要与模型共享敏感数据。 看到工作流自动化用例关注微软的托管服务也就不足为奇了,因为许多组织都与内部部署和Azure中的微软解决方案紧密结合。 

没有一个单一的模型能够满足企业用例中不断增长的生成式人工智能的所有技术和业务要求。 

这在应用交付、安全性和常规操作方面带来了一些挑战,因为不同的模型选择意味着不同的部署模式。 

新兴的人工智能部署模式

目前出现了三种基本的部署模式。 核心区别在于扩展推理服务的运营责任。 在所有模式中,组织负责应用程序的交付安全。    

  1. SaaS 管理。 在 SaaS 托管部署模式中,AIapplications使用API访问 AI 托管服务,例如 OpenAI ChatGPT。 规模的运营责任在于提供商。  
  2. 云管理。 云管理部署模式利用云提供商托管的 AI 服务。 这些服务仍然可以通过 API 访问,但可能是企业私有的,也可能是共享的。 人工智能应用程序本身也可能位于公共云或本地。 当服务是私有的时,企业承担扩展推理服务的责任,这可能是一个挑战,因为大多数组织在扩展大型语言模型方面经验很少。 当共享服务时,组织将责任推给云提供商,但必须在运营中考虑配额和基于令牌的成本等因素。 
  3. 自我管理开源模型最有可能以自我管理模式部署,无论是在公共云还是在本地。 可以通过 API 或直接通过应用访问模型。 在这种模式下,组织承担扩展、保护和监控推理服务的全部责任。 

(若想深入了解这些模式,你可以查看 Chris Hain 的博客)

有许多提供商将托管开源模型以支持 SaaS 管理模式,并且许多云提供商也提供开源即服务。

OpenAI 模型不仅可通过 OpenAI 以 SaaS 管理模式使用,还可通过 Microsoft 以云管理模式使用。 Mistral 是一种流行的开源模型,可以采用这三种模式进行部署。 这就是为什么我们将用例视为模型选择的主要驱动因素,因为企业可以选择混合搭配模型和部署模式。

组织已经感受到了不仅需要训练模型而且需要操作和保护模型所需技能的压力。 因此,对于许多运营专业知识有限的组织来说,按用例匹配模型是最有意义的。 将资源集中在那些由于安全或隐私原因无法以共享模式部署的用例上,最终将获得最好的结果。   

警惕运营短视

但要警惕运营短视的危险,这可能会导致组织内部出现孤岛。 我们已经在云计算中看到了这种情况的发生,毫无疑问,我们将在企业生成人工智能中再次看到这种情况。 但是,意识到按模型隔离操作和安全的危险,人们希望组织能够避免由此产生的复杂性和风险,并战略性地选择能够充分利用运营资源、能力和预算的模型和部署模式。 

现在还为时过早,当你读到这篇文章时,毫无疑问将会出现新的供应商和具有新功能的新模式。 但部署模式基本保持不变,这使得在运营方面可以进行更具战略性的规划——从预算到人员配备,再到您需要保护和扩展您可能选择的任何模型的应用服务。