题库网
  • 首页
  • 所有科目
  • 关于本站
  • 账号设置 退出登录
    注册 登录
注意:此页面搜索的是所有试题
国家开放大学大数据预处理复习题
数量归约是指从所有样本中选择一个有代表性的子集,因此也称为样本归约。
将数据离散化后,可以克服连续型变量中隐藏的缺陷,使模型结果更加稳定,得到更加有意义的研究结论。
利用箱线图可以识别出异常值。
请简述数据特征缩放对数据分析的意义
请简述异常值的含义。
简述缺失值填补的思路。
请简述使用相关系数选择变量的思想和步骤。
请简述将变量缩放至区间[-1,1]时,Max-ABS缩放与Min-Max缩放的效果是否相同。
简述数据离散化的操作含义。
简述低频分类数据的特点、形成原因及影响。
简述等宽法的适用情况。
计算car_data数据集中的make变量每一个类别的频数,存储在make_count中:
make_count = car_data["make"].

对boston数据集中的变量LSTAT进行处理,随机生成了10个缺失值:
sample = random.sample( (boston.shape[0]), 10)
boston. [sample, "LSTAT"] = np.nan

对序列B进行中心化,结果保存在centralize_b中:
centralize_b = (B, with_std=False)

对数据集data中的所有变量进行Min-Max缩放,结果保存在data_scale中:
mm_scaler = ()
data_scale = mm_scaler. (data)

首页 <上一页 4 5 6 7 8 下一页> 尾页
随机试卷
河南理工大学-电气自动化技术(高起专)-电力系统概论
西安交通大学——软件工程概论
河南工业职业技术学院酒店英语
平顶山学院-法学(专升本)-民法(专升本)
遵义师范学院论文写作
河南医学高等专科学校--临床医学-组织胚胎学
四川农业大学宪法学
国家开放大学国家赔偿法
平顶山学院-保险学-国际结算(专升本)
安徽继续教育在线-高等数学线
赣ICP备2023009414号-1