非结构大数据实现查询和即时计算,是不是最终还是以结构化数据实现的?

qr_828 2018-12-07 05:26:58
1.针对一堆非结构化数据,比如word里以表格形式存储的数据,想要对这些文档的数据进行查询和形成常见统计分析,是不是还要把非结构化的数据转化为结构化数据? 2.假设一个情景 教育厅每年会收到很多高校以word上报的数据,word中有一部分学生成绩数据是表格,类似: 这种数据背景下我想做一个查询功能,用户可以设置查询条件,并且设置计算结果(比如总计人数、成绩平均值之类的) 我的疑问: 1.要实现这个功能是不是还是要把word文档里的数据结构化存储? 2.用大数据架构如何实现?
...全文
101 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
BriData 2019-02-08
  • 打赏
  • 举报
回复
1,严格意义上讲Word 里的不叫数据,只能叫文字。通常的做法时先将 Word 转换成 Excel 比如 (CSV) 格式,然后再进行其他处理 2,取决与上报的 Word 文件是不是统一的格式,如果是,就可以用Word 和 Excel 里的 小程序做批量处理了。 至于要不要将Excel 的数据结构化处理,那要看数据本身和什么样的系统方案了,如果是 T 或者 P 级别的数据,基本上不需要结构化(但是需要格式化),现在的大数据平台处理很容易。

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧