数据卫生是一个过程清理信息数据库确保它们准确、有组织且无错误。 在信息安全背景下,数据卫生还涉及将数据存储在安全地点并重新验证员工是否有权接触它们。
如今,大多数公司都存储大量与客户和员工相关的数据,并依靠这些数据来了解其业务运营情况的重要见解。 这意味着保持良好的数据卫生习惯从未如此重要——最重要的是,它为明智、有把握的决策提供了基础。
在本指南中,我们准确解释了什么是数据卫生、如果不实施良好的数据卫生实践可能会遇到的问题,以及如何保持公司记录干净整洁。 在本指南中,我们介绍:
什么是数据卫生?
正如我们上面简要解释的那样,数据卫生(更积极地说是数据清理)是指涉及清理数据集和数据库以确保它们完全准确、最新且最终可用的任何过程。
和数据泄露 现在,确保安全存储数据已成为数字领域的常见问题,这被认为是数据卫生的一个不同但同样重要的方面。
确保遵循良好的数据卫生实践应该是任何公司数据管理流程的基石。
经过严格错误检查并安全存储的信息数据库通常被称为“干净”的数据集。 相反,未经清理或检查不准确的数据通常称为“脏数据”。
数据卫生差的原因
有多种不同的因素可能会对给定数据集的健康产生负面影响,其中一些因素比其他因素更为明显。
彻底的错误将对给定数据集的卫生产生最大的影响,其主要原因是人为错误。 然而,在未经检查的数据集中,您可能拥有曾经正确但现在已经过时的信息,这可能会在数据卫生方面给您带来同样多的问题。
组织得不好的数据也可能被认为是不卫生的。 即使数据本身是正确且最新的,如果它不是在清晰、可用的格式,如果组织得很好,你将无法得出你能得出的见解。
另一个数据卫生危害是重复数据– 或数据集中的重复项。 如果您有多人收集数据并在一个集中位置处理数据,但您没有检查重复数据,则可能会显着影响您从该信息中收集的结论。
类似的事情可以说“不相关”的数据它可能已添加到您的数据集中,但尽管不再需要,但尚未删除。
专家提示
组织不清晰或存储不正确的数据可能与不正确或过时的数据一样无用。 在商业环境中创造这种清晰度应该以统一的、广为人知的做法为中心。 如果给定公司中的每个人都使用相同的流程查看、输入、编辑和删除数据,并以特定的、预先确定的方式维护数据库,那么您的数据将比您的数据更加有用。部署散弹枪方法。
亚伦·德拉普金 Tech.co 首席撰稿人
存储“脏”数据的危险
如果您未能在组织内保持良好的数据卫生实践,您可能会遇到各种危险。 这些包括:
- 效率低下:如果您依赖不准确的数据进行报告,您将花费大量时间来纠正错误,这些错误会突然出现并需要立即引起注意。
- 决策失误:简而言之,如果您使用低质量的分析来制定决策,那么决策将缺乏信息,并且可能对您的业务造成损害。
- 数据泄露:如果您没有安全地存储公司数据,那么您就有可能将其暴露给那些寻找敏感信息并在线销售的攻击者。
- 合规问题:如果您的数据卫生状况不佳,那么您将面临合规问题,这可能会导致高昂的罚款。
- 不信任和声誉损害:如果您的公司因数据卫生状况不佳而闻名,那么他们就不太可能受到客户的信任。
- 缺乏责任感:如果您的数据卫生状况不佳,您将无法跟踪绩效、赞扬成功者并追究落后者的责任。
根据您所在的行业,不良的数据卫生会产生不同的后果。例如,营销团队可能会发现自己列入黑名单来自某些电子邮件收件箱或不准确的买家角色。
另一方面,销售团队可能破坏客户或客户关系如果未正确记录初次联系或外展,或者无法访问这些通话中的数据,则多次联系同一个人进行介绍性通话。
数据卫生最佳实践技巧
您可以采取多种方法来确保保持良好的数据卫生习惯。 在本节中,我们将介绍一些概念和实践,这些概念和实践应该成为每个公司的数据管理和存储策略的一部分。
练习定期数据清理
当然,良好数据卫生的关键组成部分是定期、彻底的数据清理,在此期间删除错误记录并处理其他相关问题,例如重复。
您现在可以使用人工智能工具以及其他具有汽车功能的工具来帮助您进行数据清理工作。
例如,您可以使用其中一个工具来搜索数据库中的重复项并将其删除,或者您可以选择像 DemandTools 这样的数据管理平台,这将首先阻止它们添加到您的数据库中。
标准化您的数据输入
这是稳健的数据卫生策略的关键和基础方面。 你必须制定规则– 如果您愿意的话,可以为您的所有数据输入提供数据“风格指南”。
如果您不这样做,任何向您的数据库之一添加信息的人都可能会插入难以检测的重复项,这将导致数据报告和分析问题。
例如,如果您正在收集客户信息,您将需要标准化称呼(例如 Mr. 和 Mrs.)、大小写以及输入电话号码的方式。
应制定其他规则来帮助处理具有交叉数据点或以某种方式相互关联的条目。
这个标准化过程的结构可能取决于性质和滤波器的灵敏度在您用来解析数据以获得见解的数据库软件中可用。
标准化您的数据流程
标准化您输入的数据很重要,但更进一步,标准化流程决定如何输入和进行更改对于确保良好的数据卫生也至关重要。
例如,应该有一个统一的流程来管理如何格式化数据,解决差异和错误,报告变更到数据库、合并数据集并清除脏数据。
与这些流程相关的规则必须清楚地传达给对给定数据库或数据集感兴趣的所有员工,并且定期严格评估这些规则至关重要。
做出有关数据共享的深思熟虑的决策
公司内各部门之间没有共享足够的数据,创建数据孤岛 不好为了您的数据卫生和数据可见性。 同一公司内的不同部门最终可能会出于不同目的使用相同的数据(例如客户信息),而这些目的很容易相互冲突。
但这必须与信息安全最佳实践相平衡,例如最小特权原则(下面详细介绍这一点)以确保您企业中的每个人都无法自由访问您的数据。
重新验证您的数据
有些人会提交虚假的电子邮件地址、电话号码和其他个人信息,特别是在将其输入在线表格时。 这意味着您所持有的数据在用于任何重要用途之前必须经过检查以确保其绝对正确 - 如果不正确,可能会浪费销售人员的时间,或用于构建可能影响公司战略的报告。
当然,除了产生无用数据的彻头彻尾的伪造之外,电子邮件地址也可以被删除,电话号码也可以被更改,所以重新验证您的数据定期将确保没有差异。
定期进行数据审核
根据 Oracle 最近的一项研究,超过80%的商界领袖对其公司持有的数据量感到“瘫痪”,并且不相信这些数据是准确的。
可以减轻这样的恐惧的一件事是定期数据审核,其中内部流程得到检查、细化和改进。 数据审计应该是连续的、定期的,并且是数据管理策略的核心支柱。
如果员工经常期待他们,他们就会坚持更高标准就日常数据使用情况而言,他们的数据使用率高于很少进行审计的公司的员工。
数据卫生和数据安全
尽管数据卫生主要是指保持您现在持有的实际数据无错误且“干净”,但数据卫生有时也指数据安全实践。
持有敏感数据的公司应该对其所有敏感数据集部署“零信任”原则。
“零信任”挑战了网络存在传统“边缘”的假设,每个人都可以在网络中自由移动并访问他们想要的任何东西,而无需表明自己的身份。 组织内部或外部的任何人都不应被完全信任,并且不断的重新验证是必不可少的。
如果您持有 PII(个人身份信息)有关客户以及员工医疗和财务记录。
零信任架构——许多企业的共同特征最好的密码管理器– 可以与从信息安全角度促进良好数据卫生的其他原则结合使用。 这包括最小特权原则——每个员工只能访问的概念他们需要的最少数据量完成他们的角色,仅此而已。
投资密码管理器等网络安全工具肯定有助于在安全环境中改善数据卫生,因为威胁行为者将更难破解密码。