洞察大数据
组织在运营、客户和供应商方面生成了爆炸性的数据量,而这些数据量正在持续增长。举例来说,国际数据公司(IDC)预测,从2009年到2020年,数据量将增长44倍,达到35.3泽字节,相当于1.8万亿千兆字节。因此,公司在管理业务并与利益相关者互动时产生了大量的数字“废气数据”。
大数据简介:
大数据是指各种类型的数据的集合。它包括传统的企业产生的数据,如客户关系管理(CRM)、行政和财务细节、管理信息系统、供应链操作等,这些数据可以存储在公司的数据库中。它还包括社交媒体、视频、传感器数据(由点击社交网络链接产生)和电子邮件等内容。但当这些数据量太大以至于传统的系统无法控制时,就被称为大数据。仅仅大小并不能说明一切。数据之所以被称为大数据,是因为:
- 体量:信息量巨大。
- 速度:变化迅速。
- 多样性:非结构化且当前形式不可用。
通过使用分析工具对这些数据进行切片和切块,可以识别趋势和模式,并通过执行商业智能来辅助决策。在当今世界,通过部署SAP、Microsoft Dynamics和Oracle企业资源计划(ERP)系统,信息可以在组织内部轻松共享。这种数据的合并和共享不仅增加了复杂性,也增加了分析潜力。例如,大约十年前,公司历史数据是估计未来销售额的唯一方式。但今天,可以使用许多其他资源作为输入来预测收入,如竞争分析、市场经济学和网站点击量。所有这些都是大数据的途径。
挑战:
当公司需要设计创新的方式来收集和理解数据时,数据才真正变得庞大,这是一个具有挑战性的任务。公司可能会被数据淹没,而不擅长处理和分析数万亿字节的数据。这可以归因于:
- 公司缺乏基础设施来管理海量数据:通常没有足够的存储或服务器空间来容纳所有生成的数据。
- 缺乏适当的技能,即大数据分析师或商业智能专业人员:根据麦肯锡公司的数据,存在大数据分析技能不足的问题。此外,大多数中小型企业以及部分大型企业的管理层缺乏利用数据的战略。
- 数据完整性威胁:如前所述,由于ERP系统,来自不同来源的非结构化数据经常混合在一起,使得验证其准确性变得困难,从而导致垃圾数据。
利用大数据的方法:
IT部门在处理大数据时面临困境。有几种方法可以缓解这个问题。云具有管理大量数据的能力,因此提供了一个无需投资昂贵的大型容量服务器即可使用的合适环境。XBRL被广泛用作结构化数据语言,用于格式化数据并使其计算机可读。用于分析大数据的一种流行技术是Apache Hadoop(高可用分布式面向对象平台)。
相关文档
**
**