
本題考查數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱藏在其中但又有潛在價值的信息和知識的過程。該定義包含以下幾層含義:
(1)數(shù)據(jù)源必須是真實的、大量的、有噪聲的【選項A錯誤】。
(2)發(fā)現(xiàn)的是用戶感興趣的知識【選項B正確】。
(3)發(fā)現(xiàn)的知識是可接受、可理解、可運用的【選項D正確】。
(4)并不要求發(fā)現(xiàn)放之四海而皆準的知識,僅支持特定的發(fā)現(xiàn)問題【選項E正確】。
數(shù)據(jù)挖掘以解決實際問題為出發(fā)點,融合了多學科領(lǐng)域的知識,核心任務(wù)是對數(shù)據(jù)關(guān)系和特征進行探索【選項C正確】。
因此,本題正確答案為選項BCDE。

本題考查數(shù)據(jù)挖掘。
【選項A錯誤】文本歸類屬于常用的聚類方法之一,屬于無監(jiān)督學習。
【選項D錯誤】因子分析屬于常用的降維方法之一,屬于無監(jiān)督學習。
常用的分類方法有邏輯斯特回歸【選項B】、決策樹、隨機森林【選項C】和支持向量機【選項E】等。
因此,本題正確答案為選項BCE。

本題考查數(shù)據(jù)挖掘。
【選項AC錯誤】屬于監(jiān)督學習中的分類。
【選項D錯誤】屬于無監(jiān)督學習中的降維。
【選項B正確】回歸是通過特征變量確定觀測單位因變量的取值,因變量是定量變量。例如,根據(jù)鉆石的克拉數(shù)、顏色、切割工藝等信息預(yù)測鉆石的價格,根據(jù)房屋面積、位置、樓層等信息預(yù)測房價。
因此,本題正確答案為選項B。

(2022年真題改編)下列屬于無監(jiān)督學習的是( )。
本題考查數(shù)據(jù)挖掘。
【選項ABD錯誤】屬于監(jiān)督學習。
無監(jiān)督學習中有兩大類典型任務(wù):聚類和降維。因子分析屬于常用的降維方法之一。
因此,本題正確答案為選項C。

本題考查數(shù)據(jù)科學。
【選項A錯誤】數(shù)據(jù)科學涉及的范圍非常廣泛,如統(tǒng)計學、機器學習、計算機科學、可視化、人工智能、領(lǐng)域知識等。
因此,本題正確答案為選項BCDE。

下列各項中,不屬于大數(shù)據(jù)“4V”特性的是( )。
本題考查大數(shù)據(jù)。
大數(shù)據(jù)具有“4V”特性:
(1)數(shù)據(jù)量大【選項A】。
(2)數(shù)據(jù)多樣性【選項B】。
(3)價值密度低【選項C】。
(4)數(shù)據(jù)的產(chǎn)生和處理速度快。
因此,本題正確答案為選項D。

