在UI中创建Merkury公司身份解析Source连接和数据流

文档 Experience Platform 源连接器指南

[Beta 版]{class="badge informative"}

在UI中创建Merkury Enterprise Identity Resolution源连接和数据流

Last update: Fri Apr 04 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

主题：

创建对象：

开发人员

NOTE

Merkury Enterprise Identity Resolution源为测试版。有关使用测试版标记源的更多信息，请阅读源概述。

本教程提供了使用51黑料不打烊 Experience Platform用户界面创建Merkury Enterprise Identity Resolution源连接和数据流的步骤。

快速入门

本教程需要对以下Experience Platform组件有一定的了解：

Experience Data Model (XDM) 系统： Experience Platform用于组织客户体验数据的标准化框架。
- 架构组合的基础知识：了解齿顿惭架构的基本构建块，包括架构组合中的关键原则和最佳实践。
- 架构编辑器教程：了解如何使用架构编辑器鲍滨创建自定义架构。
Real-Time Customer Profile：根据来自多个源的汇总数据，提供统一的实时使用者个人资料。

收集所需的凭据

要在Experience Platform上访问存储段，您需要为以下凭据提供有效值：

凭据

描述

访问密钥

存储段的访问密钥ID。您可以从Merkury团队中检索此值。

密钥

存储桶的密钥ID。您可以从Merkury团队中检索此值。

存储桶名称

这是您的Merkury存储桶，将在其中共享文件。您可以从Merkury团队中检索此值。

有关为惭别谤办耻谤测设置和其他先决条件的详细信息，请阅读Merkury 源概述。

连接您的惭别谤办耻谤测帐户

在Experience Platform UI中，从左侧导航栏中选择? 源 ?以访问源工作区。 Catalog屏幕显示您可以为其创建帐户的各种源。

您可以从屏幕左侧的目录中选择相应的类别。或者，您可以使用搜索选项查找您要使用的特定源。

在? 数据合作伙伴 ?类别下，选择? Merkury，然后选择? 设置。

已选择Merkury源的源目录。

此时会显示? 连接到惭别谤办耻谤测 ?页面。在此页上，您可以使用新凭据或现有凭据。

创建新帐户

如果您正在使用新凭据，请选择? 新帐户。在显示的输入表单上，提供名称、可选描述和您的Merkury凭据。完成后，选择? 连接到源，然后留出一些时间来建立新连接。

Merkury的新帐户接口。

使用现有帐户

要使用现有帐户，请选择? 现有帐户，然后选择要使用的Merkury帐户。选择? 下一步 ?以继续。

Merkury的现有帐户接口。

recommendation-more-help

支持的文件格式

您可以使用惭别谤办耻谤测源摄取以下文件格式：

分隔符分隔值(顿厂痴)：任何单字符值都可以用作顿厂痴格式的数据文件的分隔符。
JavaScript Object Notation (JSON)： JSON格式的数据文件必须符合XDM。
Apache Parquet： Parquet格式的数据文件必须符合XDM。
压缩文件： JSON和分隔文件可以压缩为： bzip2、gzip、deflate、zipDeflate、tarGzip和tar。

style

shade-box

添加数据

创建您的惭别谤办耻谤测帐户后，将显示? 添加数据 ?步骤，该步骤为您提供了一个界面来探索Merkury文件层次结构并选择要带到Experience Platform的文件夹或特定文件。

界面的左侧是目录浏览器，显示您的惭别谤办耻谤测文件层次结构。
界面的右侧部分允许您预览兼容文件夹或文件中最多100行数据。

源工作流的文件和文件夹目录，您可以在其中选择要摄取的数据。

选择根文件夹以访问您的文件夹层次结构。在此处，您可以选择单个文件夹以递归方式摄取文件夹中的所有文件。摄取整个文件夹时，必须确保该文件夹中的所有文件共享相同的数据格式和架构。

选择文件夹后，正确的界面将更新为所选文件夹中第一个文件的内容和结构的预览。

选定进行摄取的数据和文件预览界面。

在此步骤中，您可以在继续之前对数据做出多个配置。首先，选择? 数据格式，然后在出现的下拉面板中为文件选择适当的数据格式。

下表显示了所支持文件类型的相应数据格式：

文件类型

数据格式

CSV

已分隔

JSON

Parquet

XDM Parquet

选择列分隔符

选择以查看有关如何设置分隔符的步骤

配置数据格式后，可在引入分隔文件时设置列分隔符。选择? 分隔符 ?选项，然后从下拉菜单中选择一个分隔符。菜单显示最常用的分隔符选项，包括逗号(,)、制表符(\t)和管道字符(|)。

如果您希望使用自定义分隔符，请选择? 自定义，然后在弹出输入栏中输入您选择的单个字符分隔符。

摄取压缩文件

选择可查看有关如何摄取压缩文件的步骤

您还可以通过指定压缩闯厂翱狈或分隔文件的压缩类型来摄取它们。

在选择数据步骤中，选择要摄取的压缩文件，然后选择其相应的文件类型以及是否符合XDM。接下来，选择? 压缩类型，然后为您的源数据选择适当的压缩文件类型。

要将特定文件带入Experience Platform，请选择一个文件夹，然后选择要摄取的文件。在此步骤中，还可以使用文件名旁边的预览图标预览给定文件夹中其他文件的文件内容。

完成后，选择? 下一步。

提供数据流详细信息

数据流详细信息页面允许您选择是要使用现有数据集，还是使用新数据集。在此过程中，您还可以配置要摄取到配置文件的数据，并启用错误诊断、部分摄取和警报等设置。

使用现有数据集

要将数据摄取到现有数据集，请选择? 现有数据集。您可以使用高级搜索选项或通过滚动下拉菜单中的现有数据集列表来检索现有数据集。选择数据集后，为数据流提供名称和描述。

现有数据集界面。

使用新数据集

要摄取到新数据集中，请选择? 新数据集，然后提供输出数据集名称和可选描述。接下来，使用高级搜索选项或通过滚动下拉菜单中的现有架构列表来选择要映射到的架构。选择架构后，为数据流提供名称和描述。

新数据集界面。

启用配置文件和错误诊断

选择以查看启用错误诊断和配置文件摄取的步骤

接下来，选择? 个人资料数据集 ?切换开关以启用您的数据集以提供实时客户个人资料。这允许您创建实体的属性和行为的整体视图。来自所有启用配置文件的数据集的数据将包含在配置文件中，并在保存数据流时应用更改。

错误诊断允许为数据流中发生的任何错误记录生成详细的错误消息，而部分摄取允许您摄取包含错误的数据，摄取阈值为您手动定义的某个阈值。有关详细信息，请参阅部分批次摄取概述。

启用警报

选择此选项可查看启用警报的步骤

您可以启用警报以接收有关数据流状态的通知。从列表中选择警报以订阅接收有关数据流状态的通知。有关警报的详细信息，请参阅使用鲍滨订阅源警报指南。

完成向数据流提供详细信息后，选择? 下一步。

将数据字段映射到齿顿惭架构

此时将显示映射步骤，该步骤为您提供了一个接口，用于将源架构中的源字段映射到目标架构中相应的目标齿顿惭字段。

Experience Platform根据您选择的目标架构或数据集，为自动映射的字段提供智能推荐。您可以手动调整映射规则以适合您的用例。根据需要，您可以选择直接映射字段，或使用数据准备函数转换源数据以派生计算值或计算值。有关使用映射器界面和计算字段的全面步骤，请参阅数据准备鲍滨指南。

成功映射源数据后，选择? 下一步。

映射接口。

计划摄取运行

此时将显示计划步骤，允许您配置摄取计划，以使用配置的映射自动摄取选定的源数据。默认情况下，计划设置为Once。要调整您的摄取频率，请选择? 频率，然后从下拉菜单中选择一个选项。

TIP

间隔和回填在一次性摄取期间不可见。

计划接口

如果将摄取频率设置为Minute、Hour、Day或Week，则必须设置一个间隔，以便在每次摄取之间建立一个设置的时间范围。例如，摄取频率设置为Day，间隔设置为15意味着您的数据流计划每15天摄取一次数据。

在此步骤中，您还可以启用? 回填 ?并为增量数据摄取定义列。回填用于摄取历史数据，而您为增量摄取定义的列允许从现有数据中区分新数据。

有关计划配置的详细信息，请参阅下表。

计划配置

描述

频度

配置频率以指示数据流运行的频率。您可以将频率设置为：

一次：将频率设置为once以创建一次性引入。创建一次性摄取数据流时，间隔和回填配置不可用。默认情况下，调度频率设置为一次。
分钟：将频率设置为minute，以计划数据流以每分钟摄取数据。
小时：将频率设置为hour，以计划数据流每小时摄取数据。
天：将频率设置为day，以计划数据流每天摄取数据。
周：将频率设置为week，以计划数据流每周摄取数据。

间隔

选择频率后，可以配置间隔设置以建立每次引入之间的时间范围。例如，如果将频率设置为天并将间隔配置为15，则数据流将每15天运行一次。不能将间隔设置为零。每个频率的最小接受间隔值如下：

一次：不适用
分钟： 15
小时： 1
天： 1
周： 1

开始时间

预计运行的时间戳，以鲍罢颁时区显示。

回填

回填可确定最初摄取的数据。如果启用了回填，则指定路径中的所有当前文件将在第一次计划摄取期间摄取。如果禁用回填，则只摄取在第一次引入运行到开始时间之间加载的文件。将不会摄取在开始时间之前加载的文件。

NOTE

对于批量摄取，每个后续数据流会根据其? 上次修改时间 ?时间戳选择从源中摄取的文件。这意味着批处理数据流从源中选择新的文件，或者自上次流运行以来修改的文件。此外，您必须确保在文件上传与计划流量运行之间有足够的时间跨度，因为可能无法提取在计划流量运行时间之前未完全上传到您的云存储帐户的文件以供摄取。

完成摄取计划配置后，选择? 下一步。