開學季
400-650-7353
首頁 > IT就業指南 > 面試題 > 【大數據面試題】常見的大數據面試題(三)

【大數據面試題】常見的大數據面試題(三)

2019-01-29 20:12:05 來源:互聯網 手機端入口

大數據行業熱度有增無減,下面是小編整理的一些大數據面試題,希望能夠對大家有所幫助。

【大數據面試題】常見的大數據面試題(三)

1、怎么在海量數據中找出重復次數最多的一個?

2、上千萬或上億數據(有重復),統計其中出現次數最多的錢 N 個數據。

3、一個文本文件,大約有一萬行,每行一個詞,要求統計出其中最頻繁出現的前 10 個詞,給出思想,給出時間復雜度分析。

4、100w 個數中找出最大的 100 個數。

5、有一千萬條短信,有重復,以文本文件的形式保存,一行一條,有重復。 請用 5 分鐘時間,找出重復出現最多的前 10 條。

6. 下面哪個程序負責 HDFS 數據存儲。

a)NameNode

b)Jobtracker

c)Datanode

d)secondaryNameNode

e)tasktracker

7. HDfS 中的 block 默認保存幾份?

a)3 份

b)2 份

c)1 份

d)不確定

8. 下列哪個程序通常與 NameNode 在一個節點啟動?

a)SecondaryNameNode

b)DataNode

c)TaskTracker

d)Jobtracker

9. Hadoop 作者

a)Martin Fowler

b)Kent Beck

c)Doug cutting

10. HDFS 默認 Block Size

a)32MB

b)64MB

c)128MB

相關推薦:

【優就業大數據培訓】從小白到大咖 打造大數據精英人才

【大數據培訓教程】把握時代風口,做大數據架構師

免責聲明:本文來源于網絡,由網友提供或網絡搜集,僅供個人交流學習參考使用,不涉及商業盈利目的。如有版權問題,請聯系本站管理員予以更改或刪除。謝謝合作!

相關推薦

俺去啦俺来也五月天,俺去啦-俺去也网,伊人香蕉香蕉在线28,大香蕉伊人综合网