在 Salesforce 数据云上以无代码方式使机器学习民主化的 Amazon SageMaker

26

无需代码的 Amazon SageMaker Canvas 使 Salesforce Data Cloud 的机器学习大众化

作者 Daryl Martis Rachna Chadha Ifetayo Stewart Ravi Bhattiprolu 和 Miriam Lebowitz

日期 2023年11月27日

在这篇文章中,我们将介绍如何利用 Amazon SageMaker Canvas 无需代码地创建和部署机器学习模型,并与 Salesforce Data Cloud 整合。文章中将展示业务分析师和普通数据科学家如何轻松创建有力的业务应用。

文章要点

使用 Amazon SageMaker Canvas,业务分析师与数据科学家可无需写代码即可创建和部署机器学习模型。SageMaker Canvas 提供简单的点击式界面,并能直接访问 Salesforce Data Cloud 的数据。本文展示如何建立预测模型以推荐产品,并通过 SageMaker Canvas 部署与 Salesforce Einstein Studio 整合。

这是探讨 Salesforce Data Cloud 与 Amazon SageMaker 整合系列文章的第三篇。在第一篇和第二篇中,我们展示了如何通过 SageMaker 安全访问 Salesforce 数据,以构建、训练和部署模型。

在本文中,我们将示范业务分析师和普通数据科学家如何在 Amazon SageMaker Canvas 中创建机器学习 (ML) 模型,并将其与 Salesforce Einstein Studio 整合,形成强大的商业应用。SageMaker Canvas 提供简单的无代码体验,让您可以轻松访问 Salesforce Data Cloud 的数据,并用几次点击来构建、测试和部署模型。此外,SageMaker Canvas 使您能够通过特征重要性和 SHAP 值更好地理解预测,简单易懂。

SageMaker Canvas

SageMaker Canvas 允许业务分析师和数据科学团队在不写任何代码的情况下,构建和使用机器学习和生成性 AI 模型。它提供了可视化的点击界面来生成准确的机器学习预测,包括分类、回归、预测、自然语言处理NLP和计算机视觉CV。此外,您还可以访问 Amazon Bedrock 的基础模型或 Amazon SageMaker JumpStart 提供的公共基础模型,进行内容生成、文本提取和文本摘要,以支援生成性 AI 解决方案。SageMaker Canvas 允许您随时引入建好的机器学习模型,并直接在 SageMaker Canvas 中生成预测。

Salesforce Data Cloud 和 Einstein Studio

Salesforce Data Cloud 是一个数据平台,为企业提供来自任何接触点的客户数据的实时更新。

Einstein Studio 是 Salesforce Data Cloud 上的 AI 工具的入口。通过 Einstein Studio,管理员和数据科学家可以轻松地用几次点击或代码创建模型。Einstein Studio 的自定义 AI 模型体验BYOM使其能够连接来自外部平台如 SageMaker的自定义模型或生成性 AI 模型到 Salesforce Data Cloud。

解决方案概述

我们将示范如何利用 Salesforce Data Cloud 中的数据与 SageMaker Canvas 来构建机器学习模型。我们将建立一个预测模型,用于推荐产品。该模型使用存储于 Salesforce Data Cloud 的特征,例如客户人口统计、营销参与和购买历史。产品推荐模型将通过 SageMaker Canvas 的无代码用户界面构建和部署,使用 Salesforce Data Cloud 中的数据。

我们将使用以下 示例数据集,该数据集存储在 Amazon S3 中。要在 Salesforce Data Cloud 中使用此数据集,请参考在数据云中创建 Amazon S3 数据流。为了创建模型,以下属性是必要的:

属性名称说明Club Member客户是否为俱乐部成员Campaign客户所参加的营销活动State客户所居住的州或省Month购买的月份Case Count客户提出的案件数量Case Type Return客户在过去一年是否退回产品Case Type Shipment Damaged客户在过去一年是否有任何货物受损Engagement Score客户的参与程度对邮件营销活动的回应、在线商店的登录等Tenure客户与公司的关系年限Clicks客户在购买前一周平均点击次数Pages Visited客户在购买前一周平均访问的页面数量Product Purchased实际购买的产品

接下来的步骤概述了如何使用 SageMaker Canvas 中推出的 Salesforce 连接器来访问您的企业数据并构建预测模型:

配置 Salesforce 连接应用以注册 SageMaker Canvas 域。在 SageMaker Canvas 中设置 Salesforce Data Cloud 的 OAuth。使用内建的 SageMaker Canvas Salesforce Data Cloud 连接器来连接 Salesforce Data Cloud 数据并导入数据集。在 SageMaker Canvas 中构建和训练模型。在 SageMaker Canvas 中部署模型并进行预测。将 Amazon API Gateway 端点作为前端连接到 SageMaker 推理端点。在 Einstein Studio 中注册 API Gateway 端点。详细指导请参考将自有 AI 模型带入数据云。

以下图示显示了解决方案架构。

前提条件

在开始之前,完成以下前提步骤以创建 SageMaker 域并启用 SageMaker Canvas:

创建一个 Amazon SageMaker Studio 域。详细指导请参考在 Amazon SageMaker 域上登录。记下创建的域 ID 和执行角色,这将在用户配置文件中使用。您在后续步骤中添加对此角色的权限。

以下截图显示了我们为本篇文章创建的域。

在 Salesforce 数据云上以无代码方式使机器学习民主化的 Amazon SageMaker

接下来,转到用户资料并选择 编辑。

导航到 Amazon SageMaker Canvas 设置 区域并选择 启用 Canvas 基本权限。

选择 启用 Canvas 模型的直接部署 和 为所有用户启用模型注册权限。这样 SageMaker Canvas 就能将模型部署到 SageMaker 控制台的端点上。这些设置可以在域或用户配置文件层级进行配置,而用户配置文件设置的优先级高于域设置。

创建或更新 Salesforce 连接应用

接下来,我们创建一个 Salesforce 连接应用,启用从 SageMaker Canvas 到 Salesforce Data Cloud 的 OAuth 流程。完成以下步骤:

加速器苹果版下载免费版登录 Salesforce 并转到 设置。搜索 应用程序管理器 并创建一个新的连接应用。提供以下输入: 对于 连接应用名称,输入一个名称。对于 API 名称,保持默认设置自动填充。对于 联系人电子邮件,输入您的联系电子邮件地址。选择 启用 OAuth 设置。

对于 回调 URL,输入 https//ltdomainidgtstudioltregiongtsagemakeraws/canvas/default,并提供来自 SageMaker 域的域 ID 和地区。

在您的连接应用上配置以下范围:

通过 API 管理用户数据 (api)。随时进行请求 (refreshtoken offlineaccess)。在 Salesforce Data Cloud 数据上执行 ANSI SQL 查询 (Data Cloudqueryapi)。管理 Data Cloud 配置文件数据 (Data Cloudprofileapi)。访问身份 URL 服务 (id profile email address phone)。访问唯一用户标识符 (openid)。将您的连接应用的 IP 放宽 设置设置为 放宽 IP 限制。

配置 Salesforce Data Cloud 连接器的 OAuth 设置

SageMaker Canvas 使用 AWS Secrets Manager 安全存储来自 Salesforce 连接应用的连接信息。SageMaker Canvas 允许管理员为单个用户配置文件或域级别配置 OAuth 设置。请注意,您可以将秘密添加到域和用户配置文件,但 SageMaker Canvas 首先在用户配置文件中查找秘密。

要配置您的 OAuth 设置,完成以下步骤:

在 SageMaker 控制台中编辑域或用户配置文件设置。在导航窗格中选择 Canvas 设置。在 OAuth 设置 下,对于 数据源,选择 Salesforce Data Cloud。对于 秘密设置,您可以创建一个新秘密或使用现有的秘密。在本示例中,我们创建一个新秘密并输入 Salesforce 连接应用的客户 ID 和客户秘密。

有关在 SageMaker Canvas 中启用 OAuth 的详细信息,请参见设置 Salesforce Data Cloud 的 OAuth。

这样就完成了从 Salesforce Data Cloud 到 SageMaker Canvas 的数据访问设置,助力机器学习和 AI 模型的构建。

从 Salesforce Data Cloud 导入数据

要导入数据,完成以下步骤:

从创建的 SageMaker 域用户配置文件中选择 启动 并选择 Canvas。

首次访问 Canvas 应用时,创建过程约需 10 分钟。

在导航窗格中选择 Data Wrangler。

在 创建 菜单中,选择 表格 以创建表格数据集。

命名数据集并选择 创建。

对于 数据源,选择 Salesforce Data Cloud,并 添加连接 以导入数据湖对象。

如果您之前已配置连接到 Salesforce Data Cloud,则可以选择使用该连接而不是创建新的。

为新的 Salesforce Data Cloud 连接提供名称并选择 添加连接。

这个过程大约需要几分钟来完成。

您会被重定向到 Salesforce 登录 页面以授权连接。

登录成功后,请求将被重定向回 SageMaker Canvas 并显示数据湖对象列表。

选择包含用于模型训练的特征的数据集,该数据集通过 Amazon S3 上传。拖放文件,然后选择 在 SQL 中编辑。

Salesforce 对所有 Data Cloud 对象字段添加 “c“。根据 SageMaker Canvas 的命名规则,”“ 不允许在字段名称中使用。

编辑 SQL 以

台湾网络攻击报告:形势严峻关键要点台湾去年每日平均遭受240万次网络攻击,是前一年的两倍。中国被认定为主要攻击来源,重点攻击电信、交通和国防等关键领域。政府服务网络频繁受到攻击,涉及高级持续威胁和分布式拒绝服务攻击等先进手段。黑客采用社交工程手段渗透台湾公务员邮箱,获取敏感信息。据Tech Times报道,台湾国家安全局发布的报告显示,去年台湾每天平均遭受约240万次网络攻击,攻击次数是前一年的两...

新版 AWS 人工智能与机器学习认证探讨关键要点AWS 发布了两项新的人工智能认证,以帮助专业人士提升AI技能并推动负责任的AI普及。AWS 认证人工智能从业者 适合商业领袖及非技术专业人士,帮助他们理解如何利用AI提高工作效率。AWS 认证机器学习工程师 助理 适合具有AI/ML经验的技术人员,专注于机器学习系统的开发和部署。AWS 提供考试准备资源,包括新上线的 AWS Escape Room...