
本題考查大數(shù)據(jù)。
大數(shù)據(jù)具有“4V”特性:
(1)數(shù)據(jù)量大【選項(xiàng)A】。
(2)數(shù)據(jù)多樣性【選項(xiàng)B】。
(3)價(jià)值密度低【選項(xiàng)C】。
(4)數(shù)據(jù)的產(chǎn)生和處理速度快。
因此,本題正確答案為選項(xiàng)D。

本題考查數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏在其中但又有潛在價(jià)值的信息和知識(shí)的過程。該定義包含以下幾層含義:
(1)數(shù)據(jù)源必須是真實(shí)的、大量的、有噪聲的【選項(xiàng)A錯(cuò)誤】。
(2)發(fā)現(xiàn)的是用戶感興趣的知識(shí)【選項(xiàng)B正確】。
(3)發(fā)現(xiàn)的知識(shí)是可接受、可理解、可運(yùn)用的【選項(xiàng)D正確】。
(4)并不要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的知識(shí),僅支持特定的發(fā)現(xiàn)問題【選項(xiàng)E正確】。
數(shù)據(jù)挖掘以解決實(shí)際問題為出發(fā)點(diǎn),融合了多學(xué)科領(lǐng)域的知識(shí),核心任務(wù)是對(duì)數(shù)據(jù)關(guān)系和特征進(jìn)行探索【選項(xiàng)C正確】。
因此,本題正確答案為選項(xiàng)BCDE。

本題考查數(shù)據(jù)挖掘。
【選項(xiàng)A錯(cuò)誤】文本歸類屬于常用的聚類方法之一,屬于無監(jiān)督學(xué)習(xí)。
【選項(xiàng)D錯(cuò)誤】因子分析屬于常用的降維方法之一,屬于無監(jiān)督學(xué)習(xí)。
常用的分類方法有邏輯斯特回歸【選項(xiàng)B】、決策樹、隨機(jī)森林【選項(xiàng)C】和支持向量機(jī)【選項(xiàng)E】等。
因此,本題正確答案為選項(xiàng)BCE。

本題考查數(shù)據(jù)挖掘。
【選項(xiàng)AB錯(cuò)誤】屬于監(jiān)督學(xué)習(xí)的典型任務(wù)中的分類。
【選項(xiàng)D錯(cuò)誤】屬于無監(jiān)督學(xué)習(xí)的典型任務(wù)中的聚類。
常用的降維方法包括主成分分析法【選項(xiàng)C】、因子分析法【選項(xiàng)E】等。
因此,本題正確答案為選項(xiàng)CE。

(2022年真題改編)下列屬于無監(jiān)督學(xué)習(xí)的是( )。
本題考查數(shù)據(jù)挖掘。
【選項(xiàng)ABD錯(cuò)誤】屬于監(jiān)督學(xué)習(xí)。
無監(jiān)督學(xué)習(xí)中有兩大類典型任務(wù):聚類和降維。因子分析屬于常用的降維方法之一。
因此,本題正確答案為選項(xiàng)C。

本題考查數(shù)據(jù)科學(xué)。
【選項(xiàng)A錯(cuò)誤】數(shù)據(jù)科學(xué)涉及的范圍非常廣泛,如統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)科學(xué)、可視化、人工智能、領(lǐng)域知識(shí)等。
因此,本題正確答案為選項(xiàng)BCDE。

