非结构大数据实现查询和即时计算,是不是最终还是以结构化数据实现的?
1.针对一堆非结构化数据,比如word里以表格形式存储的数据,想要对这些文档的数据进行查询和形成常见统计分析,是不是还要把非结构化的数据转化为结构化数据?
2.假设一个情景
教育厅每年会收到很多高校以word上报的数据,word中有一部分学生成绩数据是表格,类似:
这种数据背景下我想做一个查询功能,用户可以设置查询条件,并且设置计算结果(比如总计人数、成绩平均值之类的)
我的疑问:
1.要实现这个功能是不是还是要把word文档里的数据结构化存储?
2.用大数据架构如何实现?