大数据运营工程师考试题库

2个回答默认排序

默认排序

按时间排序

CSYMiracle

已采纳

我：Hadoop适合离线分析，是批处理；Spark适合实时分析，是近实时流，微批处理。

我：其实自己在平时使用的时候,并没有过度割裂开这两种，因为毕竟自己是结果导向所以无论Python的缩进格式还是Java的要加逗号，最后可以实现我的需求就可以了。补：如今，再来审视这个问题，会发现其实在使用过程中，Python，Java确实有一些需要你拐个弯注意下的，比如【Python】list的remove函数和【Java】list的remove方法，同名异能。以及Python一些轮子如何用Java去实现也是要注意的。

我：小于等于A表条数，也就是小于等于3条补：现在看来，当时陷入了工作中带来的一个误区，就是面试官可没说join的字段是主键，它可以不唯一哈，不唯一就会导致大于3条，因为有重复，而B表记录不足的地方均为NULL，所以可能小于吗？不信客官你看：例1 ： A表的记录数在B表中全都有且B表id唯一

例2 A表的记录在C表中有缺失但C表记录唯一：

例3 A表的记录在D表中全都有但D表id不唯一：

所以正解应该是大于等于A表的条数

大数据运营工程师考试题库

88 评论（10） 1小时前发布

温柔一刀半

大数据开发的面试题有spark开发，hadoop应用等内容，具体开发岗，分析工程师有不同的内容，千锋网有很多相关面试题。

151 评论（11） 6小时前发布

大数据运营工程师考试题库

2个回答 默认排序 默认排序 按时间排序

相关问答

工程师考试

向你推荐

热门问题

2个回答默认排序

默认排序

按时间排序