【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批

最近在准备数据分析岗位的笔试,整理了牛客网上的一些试题与答案方便查看(只摘部分) 。
1、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为
答案:简单随机抽样
参考解析:
简单随机抽样:对总体不做任何划分,随机抽取
分层抽样:挑选对总体影响较大的特征作为分层依据,在每层中抽取一定比例的样本,比如:抽取某小学学生的身高,可按照年纪划分成6层,在每层中抽取一定比例的学生组成样本 。
系统抽样:比如100个学生,给每个学生编号,平均分成5等分,每一份都选编号为1,5,9的学生
整群抽样:100个学生分成4个群,随机选择其中的2个群,群里所有学生都要参与抽样 。
2、一组数据,均值>中位数>众数,则这组数据
答案:右偏
参考解析:
左偏分布(负偏态)mean(平均数)
右偏分布(正偏态)mode(众数)
所以,偏态数据中,中位数更适合用来反应数据的集中趋势 。几何平均数:降低因数据本身的尺度不同对结果的影响
3、对一个特定情形的估计来说,置信水平越低,所对应的置信区间
答案:越小
4、关于回归算法,以下说法不正确的是
答案:B
参考解析:
回归,实际上是二分类算法;目标变量要求是离散值;
回归的输入特征:工业界中我们通常将连续变量离散化再带入回归 。
5、下列关于正态分布,不正确的是
答案:C
参考解析:
期望为0,标准差为1的是标准正态分布
6、样本中各观察值均加5后
答案:C D
参考解析:
方差表示数据围绕均值的波动大小,每个样本都加5,波动情况并没有改变,所以方差不变 。
标准差是方差的平方根,也不变 。
7、请写sql语句:
想要了解班级内同学的考试情况,现有一张成绩表表名为A,每行都包含以下内容(已知表中没有重复内容,但所有的考试结果都录入在了同一张表中,一个同学会有多条考试结果):
,,score
现在需要知道:
1. 每门课程得到成绩的同学人数

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批

文章插图
2. 每门课程的平均成绩
3. 如果对于每门课程来说,60分以下为不及格,高于60为及格,统计每门课程及格和不及格的人数
参考答案:
1、 ,COUNT( ) FROM A
WHERE score is not null
GROUP BY
2、 ,AVG(score) FROM A
GROUP BY
3、
,
SUM(CASE WHEN score>=60 THEN 1 ELSE 0 END) AS '及格人数',
SUM(CASE WHEN score
FROM A
GROUP BY
8、经一番研究后,我们开发出了一个新的商品详情页中'相关商品'模块的算法,并且打算通过AB Test(50%用户保留原先的算法逻辑为控制组,50%用户使用新的算法逻辑为实验组)来进行评估 。假如你是此次实验的数据分析师,请问你会怎么评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程 。
民间答案:
1.相关商品的点击率=相关商品链接点击次数/当前页面浏览次数
2.相关商品的购买率=购买行为发生次数/相关商品浏览行为次数
【【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第二批】3.当前商品与相关商品一同购买的概率=共同购买/当前商品购买