什么是小数据,为什么它很重要?
在不断深化的企业信息和商业智能海洋中,使用小数据保持事物的可管理性非常重要。
全球流通中的数据量呈指数增长,其中大部分数据被输入系统以帮助企业获得可以据以采取行动的洞察力。人类仍然需要能够读取和处理数据,但这是小数据发挥作用的地方。
人们可能会认为小数据是我们曾经了解的数据定义,数据的规模对大多数人来说都很容易理解、消化和采取行动。然而,随着大数据和大数据分析的兴起,人们倾向于忘记小数据在现代商业环境中的重要性。
尽管大数据可能很流行(而且很有用),但只有小数据才能真正让我们理解为什么这些趋势机器可以帮助我们看到正在发生的事情。因此,虽然大数据技术可以找到模式和相关性,但小数据可以帮助我们了解上下文。
什么是小数据?
其实小数据变“小”的不是数据本身,而是查询的范围。您可以将小数据视为对应于信息图。这种类型的可视化旨在用最少的必要上下文(或没有)来讲述一个严格具体的故事。
您不需要深入研究数据或将其转换为不同的维度:到目前为止,还没有人提出实时、可点击的信息图表的标准,这可能是一件好事。这并不是说这样的演示文稿没有用处。它可能对移动游戏开发社区或老式电信企业很有价值,他们正从其专有的电话黑客API 服务中获得各种乐趣。但是,一旦您开始研究数字,您就会离开小数据领域。
同时,您不应该将小数据仅仅视为大数据的选择性提炼。专注于单个数据点可以——凭借一点人类的直觉和理解——产生传统大数据分析所忽略的有价值的信息。
基于广泛的消费者分析,林斯特罗姆建议企业不要关注数字和趋势,而是要检查个体客户的行为,以了解他们为什么会这样行事。
特别是,它表明客户的决策过程可能会受到气候、政府和宗教背景或文化传统等无形因素的影响。最终,我们的目标不仅是预测客户会做什么,而是确定激励他们的潜在驱动因素。这是大数据本身无法产生的分析类型:可以公平地说,很少有客户关系管理 (CRM)系统被设置来记录和跟踪此类数据,即使是最先进的数据,解释它也会有问题人工智能。
为什么企业转向小数据?
处理大数据比仅仅提取 Excel 电子表格要复杂得多。一个查询可能涉及多个系统和数据源,并且通常涉及某种模糊的人工智能 (AI) 解释。对于大多数人的日常任务来说,它太大了,太笨拙了。
即使是为大数据系统制定正确的问题也是一个挑战。我们过去五年的销售数据与前三大竞争对手相比如何?您最好花时间自己将图表放在一起并得出自己的结论,而不是试图弄清楚如何从 AI 中获得有意义的答案。
尽管我们人类只能处理有限数量的数据,但我们有一种天赋,可以识别哪些项目是重要的,并在此基础上做出可操作的决策。我们还可以利用我们更广泛的上下文理解来解释信息:每个大数据事件都是从小数据开始的,所以关注事物的这一端当然不会有什么坏处。
对大数据的抵制并没有那么强烈,因为人们对它的局限性有了新的认识。“大数据”方法的要点是不要陷入细节的泥潭。例如,您不需要确切地知道哪些数字正在输入输出,或者它们占用了多少 PB——这只是大数据。就目前而言,这很好,但你不能完全不了解事物来经营企业。
事实上,大数据一如既往地强大。然而,问题在于,根据定义,任何符合该术语条件的东西都太大、太复杂,人类无法理解。让机器仔细研究大量汇总的数据以推断新兴的全球趋势是件好事,但员工需要关注更小的事实和数据集。这些可能是客户资料、每日销售总额或服务器统计数据——我们可以自己理解和处理的东西。
小数据的局限性是什么?
有理由警惕过于全心全意地拥抱小数据。当流程的重要部分主动排除数据时,很容易被误导。
保存与原始数据源无关的可读记录和电子表格也存在风险,很容易发生意外更改,从而导致决策脱节和错误。理想情况下,小数据应该是大数据资产的一个应用程序,并且至少要像对待主存储库一样谨慎和认真。