資料探勘,機器學習,自然語言處理這三者是什麼關係?

資料探勘,機器學習,自然語言處理這三者是什麼關係?使用者18951752450077552019-12-25 23:04:58

資料探勘(英語:Data mining),又譯為資料探勘、資料採礦。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。資料探勘一般是指從大量的資料中透過演算法搜尋隱藏於其中資訊的過程。資料探勘通常與計算機科學有關,並透過統計、線上分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。 機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。 它是人工智慧的核心,是使計算機具有智慧的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演繹。 自然語言處理是計算機科學領域與人工智慧領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯絡,但又有重要的區別。自然語言處理並不是一般地研究自然語言,而在於研製能有效地實現自然語言通訊的計算機系統,特別是其中的軟體系統。因而它是計算機科學的一部分。 自然語言處理(NLP)是計算機科學,人工智慧,語言學關注計算機和人類(自然)語言之間的相互作用的領域。 他們之間的關係如下: 機器學習比較偏底層,也比較偏理論,機器學習本身不夠炫酷,結合了具體的自然語言處理以及資料探勘的問題才能炫酷。 機器學習好像內力一 樣,是一個武者的基礎,而自然語言和資料探勘的東西都是招式。如果你內功足夠深厚,招式對你來說都是小意思。但機器學習同時也要求很高的數學基礎。 這三項並不是獨立的選項,機器學習需要資料探勘和自然語處理的支撐,自然語處理需要資料探勘的支撐,資料探勘需要大資料的支撐。最終所有的根源 都要落實在大資料上,而這一切的頂點就是人工智慧。萊垍頭條