Anthropic在2024年3月发布的Claude 3系列模型及其在众多基准测试中的成功表现对企业来说是个好消息,看起来企业客户将能够从更多供应商那里评估和选择更多高质量的AI和GenAI工具。
然而,随着公共工具和服务的质量和种类的增加,至关重要的是要记住,这一切都始于数据,不仅仅是用于训练为AI和机器学习工具提供动力的基础模型的数据,还有这些工具为发现隐藏模式和洞察力而搜索和分析的数据。
正如我之前解释的那样,在让你的企业准备好利用AI方面,有一些关键的准备工作,没有成功的数据策略,就不可能有成功的AI策略。第一步是准备你的数据,使其适合AI,这涉及到评估、整合、保护和策划你的分散的数字黄金,以便它可以被市场上各种不断增长的AI工具和服务所访问。
在这篇文章中,我将重点讨论:为什么在你的数据和基于云的AI服务之间建立高效的管道至关重要,以及这可能为你的业务带来什么。
设计AI管道
一旦你在云中评估、整合和保护了你的数据,你就会希望策划与不同组或用例相关的特定数据集,然后建立一个管道,将这些选定的数据传输到你选择的AI工具。如果你的数据驻留在Amazon Simple Storage Service(S3)存储桶中,你会想要利用S3 API,它们支持广泛的AI工具和服务,可以全面且快速地访问数据。
不管怎样,这两个质量都应该是优先考虑的——你希望这些工具以高速运行,你希望避免将自己锁定在特定的供应商或提供商中。你今天选择的领先GenAI工具可能不是三个月后最适合你需求的工具,你可能希望有灵活性来利用来自不同AI工具的数据。这个领域变化如此之快。
超大规模计算服务商通常避免迫使客户进入封闭的园区,所以即使你的数据驻留在AWS S3中,你仍然可以利用微软或谷歌的工具。例如,如果你想利用Google Vertex,你可以使用S3 API在你的S3数据集和谷歌服务之间建立一个管道。
那么接下来呢?好吧,一旦你的数据适合AI,并且你已经建立或规划了管道将你选择的服务连接到你的策划数据,就是时候看看这些工具实际上能为你的企业做什么了。我们开始注意到我们的客户有各种有趣的用例。
企业今天如何使用AI
如果你经营着一家制造业企业,你可能拥有在整个自动化制造过程中捕获数据的成像和物联网设备。如今,在我的公司,我们正在与客户合作,他们获取这些扫描和物联网数据,建立到云服务的管道,然后构建其最终用户可以与之交互的机器学习(ML)模型,以便更多了解其制造、质量保证或装配现场内部发生的情况。他们正在发现使工作流程更有效的方法。他们正在更快地发现和修复产品缺陷。
如果你有一家营销公司,你可能想利用像AWS Rekognition或 AWS Kendra 这样的服务来分析和搜索视频和图像内容。我们的一位客户是一家在全球拥有数百个工作室的广告巨头,每个工作室都有自己丰富的创意工作历史。像这样的全球企业可以利用 AI 工具帮助其创意团队轻松地从过去的项目中找到灵感,并使用 GenAI 服务在向新客户提案时创造新的活动。
然而,目前我们在企业中看到的最常见的 AI 应用涉及某种变体的聊天界面。这个工具可以用于客户支持、营销甚至内部研究,以促进机构知识的传播。
实施这些服务事实证明出奇地容易。Google Vertex 是一个非常好的选择,因为它易于使用、具有成本效益,并且在确保私有数据受到保护的同时利用Google的LLM。亚马逊Bedrock同样令人印象深刻。
我们的客户还一直在使用Microsoft Copilot和Copilot Studio,这是一个帮助你创建针对特定需求的聊天机器人的网络应用程序,并以保持数据隐私和合规性的方式进行操作。一家拥有大量知识库文档的科技公司可以创建由这些文本组成的策划数据集,训练一个定制的 Copilot,然后为其客户或内部用户提供一个工具,使他们更容易从该知识库中找到并提取相关信息。
每个行业和每个企业都有其特定需求,但近年来我所合作的每个企业都有一个共同问题——数据量不断增长。归根结底,这些 AI、GenAI和ML工具可以为企业提供将分散数据转化为资产的机会,从而帮助提高效率、加速业务流程并创造巨大的竞争优势。
我们不知道哪些 AI 工具和服务将占上风,或者哪些特定的工具最适合你的业务。然而有一点是明确的:这项技术将改变你的行业,明天的领先企业将是那些今天让数据适合 AI 并开始构建用于AI工具和服务的数据管道的企业。