验证拼接
身份拼接(或简单地拼接)的目标是提高事件数据集对跨渠道分析的适用性。 当数据集中的所有数据行都包含所需的最高可用身份顺序时,即可实现此提升。 然后,此提升允许您:
- 创建以人员为中心的报表,同时不排除匿名人员。
- 将多个设备连接到单个人员。
- 跨渠道连接人员。
本文概述了用于测量一个或多个新创建的拼接数据集上的标高以及置信度拼接可实现这些好处的分析方法。
分析方法涉及管理员通常可访问的数据视图组件设置。 这些方法还要求在Analysis Workspace项目中工作的分析人员创建计算指标和可视化图表。
虽然这些分析方法可用于基于字段的拼接和基于图形的拼接,但某些元素可能不在数据集中,尤其是在基于图形的拼接场景中。 这些缺少的元素可能会导致难以直接在Analysis Workspace中计算提升。
数据视图先决条件
对于拼接验证测量计划,您需要确保已在数据视图中定义拼接数据集中的所有必需维度和量度。 您需要验证是否已将stitchedID.id
和stitchedId.namespace.code
字段添加为维度。 虽然拼接的数据集是原始数据集的精确副本,但拼接过程会向数据集中添加以下两个新列:
-
使用
stitchedID.namespace.code
定义? 拼接的命名空间 ?维度。 此维度包含行被提升为的标识的命名空间,例如Email
、Phone
。 或拼接过程回退到的命名空间,如ECID
。
-
使用
stitchedID.id
定义? 拼接滨顿值 ?维度。 此维度包含标识的原始值。 例如:经过哈希处理的电子邮件、经过哈希处理的手机、ECID。 此值与? 拼接的命名空间 ?一起使用。
此外,您需要添加两个基于维度中值的拼接量度。
-
使用拼接数据集中包含人员ID的字段配置指标,以定义是否设置了人员ID。 即使您使用基于图形的拼合,添加此人员ID,因为人员ID有助于建立基线。 如果人员ID未包含在数据集中,则您的基线为0%。
在下面的示例中,
personalEmail.address
用作标识,用于创建? _Email set ?量度。
-
使用
stitchedID.namespae.code
字段创建? 电子邮件拼接命名空间 ?维度。 请确保指定包括排除值组件设置,以便只考虑尝试将数据行提升到的命名空间的值。- 选择? 设置包括/排除值。
- 选择? 如果满足所有条件 ?作为? 匹配。
- 将? Equals
email
指定为? 标准 ?以选择已提升到电子邮件命名空间的事件。
拼接维度
将这两个维度都添加到数据视图后,在Analysis Workspace中使用自由格式表检查每个维度包含的数据。
在? 拼接的命名空间维度 表中,您通常看到每个数据集的两行。 一行,表示拼接过程何时必须使用回退方法(ECID)。 另一行显示与所需身份命名空间(电子邮件)关联的事件。
对于? 拼接滨顿维度 表,您可以看到来自事件的原始值。 在此表中,您会看到值在永久性ID和所需人员ID之间振荡。
以设备为中心或以人员为中心的报表
创建连接时,必须定义用于人员ID的字段或标识。 例如,在Web数据集上,如果您选择设备ID作为人员ID,那么您将创建以设备为中心的报表,并失去将此数据与其他离线渠道联接的功能。 如果您选择跨渠道字段或身份(例如电子邮件),则在发生任何未经身份验证的事件时将会丢失。 要了解这种影响,您需要弄清楚有多少流量未经身份验证,以及有多少流量经过身份验证。
-
创建计算量度? 个未验证事件以及总计。 在规则生成器中定义规则,如下所示:
-
根据您之前定义的? _Email set ?量度创建计算量度? 电子邮件身份验证率。 在规则生成器中定义规则,如下所示:
-
使用? 鲍苍补耻迟丑别苍迟颈肠补迟别诲事件对总计 ?个计算量度以及? 电子邮件身份验证率 ?个计算量度来创建一个圆环图可视化图表。 该可视化图表显示数据集中未经身份验证和经过身份验证的事件数。
拼接识别率
您想要测量拼合前后的标识识别性能。 为此,请另外创建三个计算指标:
-
一个? 拼接身份验证率 ?计算量度,用于计算在事件总数中,拼接命名空间设置为所需身份的事件数。 在设置数据视图时,您创建了一个? 电子邮件拼接的命名空间 ?量度,该量度包括一个只有在事件的命名空间设置为电子邮件时才计数的过滤器。 计算量度使用此? 电子邮件拼接的命名空间 ?量度来指示具有所需标识的数据的百分比。
-
一个? 百分比增加 ?计算量度,用于计算当前标识率与拼接标识率之间的原始百分比变化。
-
一个? 提升 ?计算量度,用于计算当前标识率与拼接标识率之间的提升。
结论
如果您将所有数据合并到一个Analysis Workspace自由格式表中,则可以开始查看拼合提供的影响和值,包括:
- 当前身份验证率:已具有正确人员滨顿的事件数在事件总数中的基线。
- 拼接身份验证率:在事件总数中,具有正确人员滨顿的新事件数。
- 百分比增加:原始百分比从拼接身份验证速率减去基线当前身份验证速率增加。
- 提升:相对于基准当前身份验证率的百分比变化。
本文的要点是,这种类型的拼接验证和分析支持您:
- 通过比较当前与拼接率,提供身份验证有效性的全面自定义视图。
- 通过百分比增加和提升量度,启用对改进的清晰测量。
- 帮助确定实施拼合对用户身份验证的真正影响。
- 创建标准化方式以跨团队传达身份验证性能。
- 允许做出有关身份验证策略和优化的数据驱动型决策。
这些指标一起为利益相关者全面展示了Customer Journey Analytics拼接如何影响身份验证成功率和整体人员识别性能。