- .
- ..
网易数据分析专员笔试题目
一、根底题
1、中国现在有多少亿网民?
2、百度花多少亿美元收购了91无线?
3、app store排名的规那么和影响因素
4、豆瓣fm推荐算法
5、列举5个数据分析的博客或网站
二、计算题
1、关于简单移动平均和加权移动平均计算
2、两行数计算相关系数。〔2位小数,还不让用计算器,反正我没算〕
3、计算三个距离,欧几里德,曼哈顿,闵可夫斯基距离
三、简答题
1、离散的指标,优缺点
2、插补缺失值方法,优缺点及适用环境
3、数据仓库解决方案,优缺点
4、分类算法,优缺点
5、协同推荐系统和基于聚类系统的区别
四、分析题
关于网易邮箱用户流失的定义,挑选指标。然后要构建一个预警模型。
- .
- ..
五、算法题
记不得了,没做。。。反正是决策树和神经网络相关。
1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。
2、告诉我二个分析或者计算机科学相关工程?你是如何对其结果进展衡量的?
3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设计、2/8原那么?
4、什么是:协同过滤、n-grams, map reduce、余弦距离?
5、如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库?
6、如何设计一个解决抄袭的方案?
7、如何检验一个个人支付账户都多个人使用?
8、点击流数据应该是实时处理?为什么?哪局部应该实时处理?
- .
- ..
9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好〞?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?
10、什么是概率合并〔AKA模糊融合〕?使用SQL处理还是其它语言方便?对于处理半构造化的数据你会选择使用哪种语言?
11、你是如何处理缺少数据的?你推荐使用什么样的处理技术?
12、你最喜欢的编程语言是什么?为什么?
13、对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。
14、SAS, R, Python, Perl语言的区别是?
15、什么是大数据的诅咒?
16、你参与过数据库与数据模型的设计吗?
17、你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法?
18、你喜欢TD数据库的什么特征?
-
数据分析师笔试题目 来自淘豆网m.daumloan.com转载请标明出处.