这些数据值多少钱?
复杂的数据分析比以往任何时候都更加现实,这要归功于捕获更多数据并将其连接到物理世界的能力的巨大改进. 目前在这个网络上流传的最雄心勃勃的概念之一是“数字双”. 数字双胞胎 概念提出了一个虚拟克隆现实生活中的东西,如建筑物, 基础设施, 产品或工艺, 然后复制他们在现实世界中的行为. 如果实现了这一点, 我们有机会分析实时性能,并在舒适的虚拟世界中测试“假设”模拟场景.
如需求捕获, 对数据的消费和分析会增加, 我们如何确保数据集实际产生我们希望的价值? 要回答这个问题, 本文探讨了以货币形式评估数据集的潜在好处.
钱,钱,钱
仅仅关注数据的货币价值可能是违反直觉的, 作为专业人士, 我们更愿意谈论数据的技术价值. 然而, 当谈到与行业外的其他人讨论数据的价值时, 这个信息传达起来有点棘手.
一种选择是采用度量或分级系统来帮助其他人理解我们的数据及其价值, 但这些不可避免地需要翻译和上下文. 例如, 我们认为是“A”的评分可能并不适用于使用基于其他指标的系统的人, 比如星星. 金钱是一种人人都懂的语言,它提供了一个简单一致的价值,便于进行比较. 尽管, 它可以将某些数据的兴趣扩展到董事会等其他群体, 或者外部投资者.
这些数据值多少钱?
您可能想知道如何用金钱来衡量数据的价值? 虽然不是一门精确的科学, 首先要理解每个数据记录在其生命周期中如何产生收入或节省,同时考虑潜在的成本.
数据记录可以产生许多不同的方式,但一些例子包括:
- 如果这些数据能够通过不需要进行现场访问来节省操作费用, 比如测量公路桥下面的高度间隙, 这一记录将消除干扰道路使用者的需要,从而产生价值.
- 如果数据具有足够的商业价值,那么它可以通过数据订阅服务或许可协议获得收入, 允许其他人查看和使用数据. 如果其他人要收集或获取类似的数据集存在明显的进入障碍,则此选项可能特别有趣.
不管数据有多有用,都不存在免费的数据. 从数据诞生之日起,其产生的成本就在不断增加. 在其剩余的生命周期中,它将承担托管、保护和管理数据的成本.
随着数据的老化(特别是当数据依赖于人工输入时), 它通常会过时或不完整, 此外,还需要考虑维护数据完整性的成本. 如果数据的完整性恶化,那么数据将变得毫无价值, 但在最坏的情况下, 它会变成负债. 例如, 如果有人使用过时的高度间隙数据来确定他们是否可以通过桥下的高负荷, 然后负载和桥梁之间就会发生碰撞, 假设数据是负价值的负债是安全的.
了解数据价值后的机会是什么?
一旦我们有了数据价值的快照,我们可以用它做什么呢?
如果您有一个有价值的数据集,那么可以探索保护其价值的选项. 这可以通过加强安全、改善基础设施甚至保险来实现. 在保护数据完整性方面, 我们也可以用一个积极的估值来证明在维护支出上的投资是合理的, 也许可以通过更好的培训或设计系统来尽量减少人为错误的影响.
在现有数据集的成本大于收益的情况下, 创造解决方案以重振其价值的机会出现了. 例如, 如果你试图维护一个非常详细的数据集,需要大量的人力投入,那么我们可以建议通过评估每个字段来合理化我们正在更新的字段数量,以减轻负担. 其次, 我们可以证明投资新技术是合理的,以尽量减少人力投入,并使收集信息更具成本效益和可靠性. 低价值数据集的另一个解决方案是建议停用数据以释放资源.
如果我们在创建新数据集的阶段, 通过在设计阶段预测数据集的价值,它可以成为其业务案例的一部分,并有助于突出数据的未来收益和成本(例如维护数据完整性),以确保未来的预算.
总之, 随着人们越来越渴望创造新的数字数据来模拟越来越多的物理世界, 我们可以利用数据集的货币净值提供的洞察力来合理化有关虚拟数据目的的决策, 设计与未来.
Chris是IBI纽瓦克办事处(英国)的数据分析师,在交通运输领域拥有10年的数据分析和咨询工作经验. Chris目前正在与英国情报部门的同事合作,将英国高速公路的多个主要库存数据集整合到IBI的AVIS (ASSIT)平台中, 目前负责桅杆审查项目的技术交付,该项目涉及使用相同的平台来定位和捕获英国道路网络上以前未计算的结构桅杆和大型标志.