注意:此页面搜索的是所有试题
新疆开放大数据技术导论
如下关于大数据分析流程的哪一项是正确的( )。

A数据采集、数据清洗、数据管理、数据分析、数据呈现
B数据清洗、数据采集、数据呈现、数据分析、数据管理
C数据采集、数据呈现、数据分析、数据清洗、数据管理
D数据采集、数据分析、数据清洗、数据管理、数据呈现

在大数据生命周期的各个阶段,工作最多的是哪个阶段?( )

A数据收集和整理
B数据分析
C数据存储
D数据治理

下面哪一项不属于使用数据分析知识对数据进行探索。( )

A最大与最小值
B均值与标准差
C数据的分布
D方差

垃圾邮件的处理”场景属于哪种数据挖掘算法。( )

A分类
B聚类
C回归
D关联

下面哪个图表适合展现随时间而变化的数据()

A柱状图
B折线图
C饼图
D散点图

下面哪一项技术通常用于预测分析,确定两种或两种以上变量之间互相依赖的定量关系。( )

A分类
B聚类
C回归
D关联

以下哪种技术可以自动地抓取互联网公开信息?( )

A网页爬虫
B人工录入
C网页插码采集
D物联网设备采集

观察值的总和除以观测值的个数所得的商数是( )。

A平均数
B中位数
C众数
D方差

数据挖掘在建立模型时需要选择算法,一个模型只能使用一种算法。()

A对
B错

在数据挖掘流程中,准备数据这一环节看似简单,其实往往占据了工作的80%的工作量。()

A对
B错

聚类分析属于有监督学习类型。()

A对
B错

中位数是一组数据里面中间位置的数。()

A对
B错

大数据是一个业务领域的问题。

A对
B错

数据清洗的方法有 填充缺失值、修改错误值、消除重复记录。

A对
B错

大数据的最显著特征是数据处理速度快。

A对
B错