【收藏级】数据科学 10 题速记卡
—— 3 分钟背完,考试不丢分
(长按保存,随时翻看)


67 数据标准化 = 同趋化 + 无量纲

67.数据标准化处理主要涉及两个方面,分别是( B.数据同趋化处理 C.无量纲化处理 )。


66 大数据采集三层楼

66.大数据的采集研究可以分为( A.智能感知层 C.基础支撑层 )主要层次。
(存储层、处理层是采集后的事,别混淆!)


64 分类算法三剑客

64.( A.贝叶斯分类法 B.支持向量机 E.决策树分类法 )是常用的分类计数。
k-均值是聚类,周期性分析是时序,看到就划掉。


63 标注团队三主力

63.( A.统一管理的标注生产团队 B.众包团队 C.校企团队 )是常用的标注团队。
私人团队太小众,考试不选。


59 质检三板斧

59.要进行数据的质量检查,可以使用( B.排查 C.抽查 )的方法。
普查太贵,检查太泛,记住 BC 准没错。


55 业务流程三结构

55.业务流程可以根据活动内容的不同被细分为( B.完全结构化业务流程 C.半结构化业务流程 D.非结构化业务流程 )三种类型。


50 决策树五件套

50.要使用决策树方法,需要具备( A.明确目标 B.≥2 个备选方案 C.≥2 种不可控状态 D.可算收益/损失 E.能估计概率 )。
五要素缺一则树不成,所以全选!


49 纵向抽取两大利器

49.( A.split( ) B.slice( ) )函数是纵向数据抽取中最常用的函数。
(JS 场景记忆法:split 拆列,slice 切列)


47 样本规约三约束

47.在样本规约过程中,确定子集大小时需要考虑( A.计算成本 B.存储要求 C.估计量的精度 )。


46 特征规约三步走

46.以下( A.搜索过程 C.评估过程 D.分类过程 )步骤是特征规约算法的一部分。
填补是数据清洗,不是规约流程。


45 平滑去噪三件套

45.( A.回归 B.分箱 D.离群点分析 )是常用的数据平滑去噪的技术。


📌 背完把文章甩进【收藏】,考前 30 秒再扫一眼,稳!