题库网
  • 首页
  • 所有科目
  • 关于本站
  • 账号设置 退出登录
    注册 登录
注意:此页面搜索的是所有试题
国家开放大学大数据预处理复习题
数量归约是指从所有样本中选择一个有代表性的子集,因此也称为样本归约。
将数据离散化后,可以克服连续型变量中隐藏的缺陷,使模型结果更加稳定,得到更加有意义的研究结论。
利用箱线图可以识别出异常值。
请简述数据特征缩放对数据分析的意义
请简述异常值的含义。
简述缺失值填补的思路。
请简述使用相关系数选择变量的思想和步骤。
请简述将变量缩放至区间[-1,1]时,Max-ABS缩放与Min-Max缩放的效果是否相同。
简述数据离散化的操作含义。
简述低频分类数据的特点、形成原因及影响。
简述等宽法的适用情况。
计算car_data数据集中的make变量每一个类别的频数,存储在make_count中:
make_count = car_data["make"].

对boston数据集中的变量LSTAT进行处理,随机生成了10个缺失值:
sample = random.sample( (boston.shape[0]), 10)
boston. [sample, "LSTAT"] = np.nan

对序列B进行中心化,结果保存在centralize_b中:
centralize_b = (B, with_std=False)

对数据集data中的所有变量进行Min-Max缩放,结果保存在data_scale中:
mm_scaler = ()
data_scale = mm_scaler. (data)

首页 <上一页 4 5 6 7 8 下一页> 尾页
随机试卷
平顶山学院-护理学(专升本)-精神科护理学(专升本)
郑州工业应用技术学院建筑识图与构造
陇东学院刑法分论(高起专)
江苏开放大学思想道德与法治作业3
伊犁师范-基础英语1
安徽农业大学债权法
国开个人理财
国家开放大学建筑施工
平顶山学院教育心理学
周口师范学院-代汉语语法
赣ICP备2023009414号-1