网友您好, 请在下方输入框内输入要搜索的题目:

新疆开放大数据技术导论
绘制频数直方图的一般包括以下几个步骤:
①分组;
②决定组数与组距;组距就是每组两个端点之间的距离;
③计算最大值与最小值的差,确定统计量的范围;
④画频数分布直方图;
⑤列频数分布表;
你认为正确步骤为( )。

A①②③④⑤
B①②④⑤③
C③②①④⑤
D③②①⑤④

当遇到连续数据或者量较多的离散数据时候,最好采用下面哪种图来展示。()

A柱状图
B折线图
C饼图
D散点图

“垃圾邮件的处理”场景属于哪种数据挖掘算法。( )

A分类
B聚类
C回归
D关联

数据挖掘是从数据集(可能是不完全的、有噪声的、不确定性的、各种存储形式的)中挖掘出隐含在其中的、人们事先不知的、对决策有用的( )的过程。

A语义网
B产生式
C知识与信息
D规则

“二手房价格预测”场景属于哪种数据挖掘算法。( )

A分类
B聚类
C回归
D关联

当离散数据较少,且需要类别比较,应该采用下面哪种图来展示。( )

A柱状图
B折线图
C饼图
D散点图

DBSCAN算法属于什么类型的聚类算法( )

A网格聚类算法
B层次聚类算法
C划分型聚类算法
D基于密度的聚类算法

下面哪一项不属于分类算法。( )

A决策树
BFM算法
C随机森林
D人工神经网络

不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别,这里使用的方法是( )。

A分类
B聚类
C回归
D关联

大数据环境下的隐私担忧,主要表现为( )

A个人信息的被识别与暴露
B用户画像的生成
C恶意广告的推送
D病毒入侵

在当前社会中,最为突出的大数据环境是综合国力。

A对
B错

众数不受分布数列的极大或极小值的影响。()

A对
B错

K-means算法属于分类算法。()

A对
B错

大数据有容量大、速度快、多样化的特征。

A对
B错

下面哪个图表适合比较两个或以上的数值,但只有一个变量的情况。()

A柱状图
B折线图
C饼图
D散点图