当前位置:首页 > 资源 > 产品资料

第3章 DataViz 核心模块

3.2 数据准备

数据准备是后续数据分析的基础。 DataViz产品具备强大的数据准备能力,业务人员可以在无任何IT背景的情况下,经过简单拖拽,轻松完成数据准备的整个过程。

3.2.1 多表关联

DataViz 支持可视化快速创建多表关联。用户可拖拽数据源中多个数据表搭建数据关联关系,当数据库表或视图中存在主外键关联时,系统将自动完成多个表之间的关联。产品提供的关联关系包括左连接、内连接、右连接以及全连接,并且可以修改或添加关联字段。表关联关系通过连接线清晰展现。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 5多表关联

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 6修改关联关系及关联字段

3.2.2 筛选过滤

在数据集中, DataViz提供了丰富的过滤筛选的功能,包括字符型过滤、时间型过滤、数值过滤。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 7字符型过滤条件

在字符型过滤条件中,可以进行多选,保留要分析的字段值,同时,也可以进行排除选择,即选中的字段不生效。与此同时,对于字符型过滤,也提供了更高级的通配符模式,可以进行模糊匹配,同样,在通配符中也可以进行排除操作。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 8时间过滤条件

时间过滤条件中,包含了相对时间和绝对时间两种模式。相对时间,即为动态时间,绝对时间为时间范围,可以单独设置开始时间或者结束时间。

数值过滤条件比较简单,提供了数值段的筛选。可以进行最大值最小值的设定。

3.2.3 新增字段

 DataViz产品提供新增字段功能,可以在数据集建模过程中,根据业务需要以现有字段为基础进行新增,新增字段包含多种格式类型,可以是字符类型、数值类型或者时间类型,新增字段类型可以作为基本的数据字段参与后续的统计分析计算。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 9新增自定义字段

3.2.4 丰富计算

在 DataViz的建模过程中,提供了丰富的计算能力,包括字符计算,如拼接字符串、修剪空白、截取文本、替换文字等;时间计算,如取年、取月、取日、计算星期等;数值计算,基本的四则运算、四舍五入、向上取整等;关系计算,如大于、小于、匹配文本等;逻辑计算,如与、或、非、逻辑取值、匹配取值等。除此之外,还可以在编辑窗口书写SQL函数。

3.2.5 格式转换

格式转换即为将字段的格式编码进行变更,转换为易于分析的格式或者符合业务逻辑的格式。如,将数据库中的ID转换为字符类型。在 DataViz产品中,可以进行多种格式的转换,包括字符型、数值型、时间型,除了系统内置的转换功能外,用户也可以自己书写SQL函数完成字段的格式编码转换。

3.2.6 SQL模式

SQL模式是一种高级模式,面向具有SQL技术背景的特定人群。可以在数据集建模阶段,自由编写SQL语句并执行预览结果。SQL模式中,提供了语法高亮、元数据等信息,辅助用户顺利编写SQL语句。SQL模式区别于拖拽式的多表关联建模,其更加灵活,自由度更高,可以创造出拖拽式无法实现的复杂模型。SQL模式独立于拖拽式模式,两者不互通。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 10 SQL模式

3.2.7 R语言算法对接

 DataViz做数据建模时,支持调用R语言的高级算法,并内置了时序预测、聚类分析、回归分析等多种R语言分析算法调用实例,使得用户在使用产品进行数据计算时能够更加灵活强大。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 11 R语言算法对接

3.2.8 大数据计算加速引擎

大数据计算加速引擎是在大数据版本中提供的高级功能,可以将存储在用户数据库中的业务数据同步至产品的数据存储中,之后利用产品的高性能查询分析引擎进行数据分析。大数据分析引擎主要针对非实时、高并发、高性能的场景,可以实现亿级数据的秒级响应。

DataViz,数据可视化,数据透析表,数据可视化工具,大数据可视化

图 12 两种数据连接方式