如今,企业产生和收集的数据80%是非结构化数据,而且这一比例将继续增长。非结构化数据的数量正以每年55%到65%的速度快速攀升。如果没有合适的工具来分析这些数据,企业就会错过大量为商业智能提供的信息。但是,重要的是要知道如何利用非结构化数据来服务于企业更广泛的目标。
什么是非结构化数据?
非结构化数据是高度可变且不遵循任何明确模式的信息。因此,非结构化数据难以标记、组织、搜索和最终分析。
非结构化数据的示例包括:
分析师报告
音频文件
事件日志
地理空间数据
图像
会议记录
多媒体数据
社交媒体帖子
视频文件
用户交互数据
非结构化数据和结构化数据有什么区别?
非结构化数据在几个关键方面不同于结构化数据。虽然非结构化数据是可变的,但结构化数据由明确定义、一致且可预测的数据组成,这使得结构化数据更易于搜索和获取信息。
结构化数据的示例包括电话号码、日期或姓名,可用于餐厅、航空公司和其他可预订服务的销售交易和在线预订系统。
此外,非结构化数据位于应用程序或NoSQL数据库中,而结构化数据位于关系数据库中。例如,会议记录形式的非结构化数据可以在Notes或MicrosoftWord等应用程序中找到,或者在Instagram中发布社交媒体帖子中。例如,客户姓名和交易日期是存在于客户关系管理(CRM)系统的关系数据库中的结构化数据。
企业并不是只选择一种格式而不选另一种格式的数据,而是通过将结构化和非结构化数据一起利用以获得最佳商业智能来获得最大收益。
谁从非结构化数据中受益?如何受益?
使用非结构化数据的好处包括:
多种信息来源可供借鉴
快速积累丰富的数据集
数据湖中的巨大存储容量
更准确的数据可提供更好的商业智能,因为非结构化数据占企业数据的四分之三以上
Crux公司首席执行官WillFreiburg表示,“企业的各个层面都可以从对非结构化数据的适当管理中受益,因为它包含丰富的洞察力,可以使各种内部消费者受益。”
例如,Freiburg解释说,非结构化数据可以更好地了解供应链风险的来源,衡量消费者情绪和购买行为,并改进运营流程。
尽管非结构化数据对企业的各个部分都具有相关性和优势,但业务领导者不需要在企业中整体或均匀地使用它。与其相反,他们应该以符合业务战略目标的有针对性的方式处理非结构化数据。
非结构化数据的用例
非结构化数据用例适用于销售和营销、产品开发和客户服务。
(1)销售和营销
企业使用非结构化数据来识别客户购买模式和对品牌的看法。情感分析是非结构化数据独有的主要优势。分析社交媒体帖子、论坛讨论和其他媒体可为企业的销售和营销业绩提供背景信息。
非结构化数据还为CRM平台中的算法提供信息。预测分析产生洞察,告知企业如何预测客户需求。例如,销售团队可以根据洞察力采取行动,为新客户提供更好的产品或服务推荐,或者了解向现有客户追加销售的合适时间。
(2)产品开发
通过对客户论坛、客户服务电话和社交媒体的情绪分析,非结构化数据可以告知企业如何改进其产品或服务。
(3)客户服务
自动聊天机器人通过将客户关注的问题传递给可以解决问题的适当人员来增强客户服务代表。反过来,该信息为上述情绪分析提供信息。
然而,更重要的是,投诉和故障排除对话为研发团队提供了有关哪些功能运行良好、哪些功能运行不佳的有用信息。该数据为产品开发提供有关如何改进产品或服务的信息。
利用非结构化数据实现商业智能的三个步骤
Crux公司的Freiburg提出了三个步骤,开始利用非结构化数据来获得更好的商业智能。
(1)确定非结构化数据的具体用途
Freiburg建议管理层“清楚企业试图用外部数据回答什么问题”。
了解企业希望如何使用非结构化数据是确定使用何种数据的第一步。
首先要收集的非结构化数据。这反过来将告知要实施什么样的大数据业务解决方案。
(2)简化数据源
Freiburg建议建立一个“通用数据模型”,以便在数据中建立一组真实性。
由于非结构化数据来自各种来源和多种格式,弗莱堡强调需要“建立高质量的数据管道,以确保数据交付的一致性和及时性保持不变,无论来源如何。”
(3)为数据程序制定路线图和解决方案
与专门提供高性能质量数据集成工具和服务的供应商合作。例如,Crux公司拥有数千个数据集,可以将这些数据集集成到其在步骤2中创建的数据管道中并发挥其优势。
一旦业务领导者和数据分析师确定了后端,也就是他们试图回答的问题以及他们将如何集成数据源,他们就需要在前端工作。这意味着他们需要以一种允许通过日常应用程序可视化和查询数据的方式嵌入分析。
非结构化数据工具提供商
从非结构化数据中产生的洞察力不仅仅是神奇地出现。与其相反,它需要特殊的工具来处理数据,然后才能产生任何有意义的知识。市场上流行的非结构化数据工具提供商包括:
Accenture
Azure
Crux
DynamoDB
Hadoop
MongoDB
为什么非结构化数据对商业智能很重要?
结构化数据只讲述了企业试图理解的问题的一小部分,准确地说只有20%。
另一方面,非结构化数据占企业数据的80%,并且来自多种不同格式的各种来源。因此,它为企业描绘了一幅更全面的图景,以帮助他们更好地理解和解决他们的挑战。
非结构化数据确实更难分析。然而,企业通过这样做获得的大量信息使得非结构化数据分析工具非常值得投资。
因此,企业必须通过非结构化数据来定义他们寻求回答的问题或挑战,集成和简化各种数据源,并使用正确的工具来帮助分析和可视化它以获得更好的商业智能。