Supervised Learning, Unsupervised Learning và Reinforcement Learning là ba nhóm thuật toán quan trọng và phổ biến nhất trong Máy học. Vậy làm sao để phân biệt rõ chúng, hãy cùng tìm hiểu nhé.
Lượng dữ liệu được tạo ra trên thế giới ngày nay là rất lớn. Dữ liệu này không chỉ được tạo ra bởi con người mà còn được tạo ra bởi điện thoại thông minh, máy tính và các thiết bị khác. Dựa trên loại dữ liệu có sẵn và động cơ hiện tại, chắc chắn, một lập trình viên sẽ chọn cách đào tạo một thuật toán bằng cách sử dụng một mô hình học cụ thể.
Học máy là một phần của Khoa học máy tính, nơi hệ thống tự cải thiện hiệu quả bằng cách thực hiện lặp đi lặp lại các tác vụ bằng cách sử dụng dữ liệu, thay vì cần phải được lập trình rõ ràng. Hãy tìm hiểu sự khác biệt giữa ba kỹ thuật Supervised Learning (Học có giám sát), Unsupervised Learning (Học không giám sát) và Reinforcement Learning (Học tăng cường).
1/ Supervised Learning (Học có giám sát)
Hãy coi bạn như một học sinh đang ngồi trong lớp học, trong đó giáo viên của bạn đang giám sát bạn, “cách bạn có thể giải quyết vấn đề” hoặc “liệu bạn có làm đúng hay không” . Tương tự, trong Học tập có giám sát, đầu vào được cung cấp dưới dạng tập dữ liệu có nhãn, một mô hình có thể học từ đó để đưa ra kết quả của bài toán một cách dễ dàng.
Các dạng bài toán: Học có Giám sát giải quyết hai loại chính là bài toán phân loại và bài toán hồi quy.
– Bài toán phân loại: Thuật toán này giúp dự đoán một giá trị rời rạc. Có thể nghĩ, dữ liệu đầu vào như một thành viên của một lớp hoặc nhóm cụ thể. Ví dụ: lấy ảnh của tập dữ liệu trái cây, mỗi ảnh được dán nhãn cụ thể ví dụ là xoài, táo, v.v. Ở đây, thuật toán phải phân loại các ảnh mới thành bất kỳ danh mục nào trong số này. Ví dụ:
- Naive Bayes Classifier
- Support Vector Machines
- Logistic Regression
– Bài toán hồi quy: Những bài toán này được sử dụng cho dữ liệu liên tục (cập nhật liên tục). Ví dụ, dự đoán giá của một mảnh đất trong thành phố, cho biết diện tích, vị trí, số lượng phòng, … Và sau đó đầu vào được gửi đến máy tính giá đất theo các ví dụ trước đó. Ví dụ:
- Linear Regression
- Nonlinear Regression
- Bayesian Linear Regression
2/ Unsupervised Learning (Học không giám sát)
Thuật toán học tập này hoàn toàn trái ngược với Học tập có giám sát. Nói tóm lại, không có tập dữ liệu được gắn nhãn hoàn chỉnh và sạch sẽ trong học tập không có giám sát . Học tập không giám sát là học tập tự tổ chức. Mục đích chính của nó là khám phá các mô hình cơ bản và dự đoán kết quả đầu ra. Ở đây về cơ bản, chúng ta cung cấp cho máy dữ liệu và yêu cầu tìm kiếm các thuộc tính ẩn và phân cụm dữ liệu theo cách có ý nghĩa. Ví dụ:
- K – Means Clustering
- Neural Networks
- Principal Component Analysis
3/ Reinforcement Learning (Học tăng cường)
Nó không dựa trên việc học có giám sát hay không được giám sát. Ở đây các thuật toán học cách tự phản ứng với môi trường. Phương pháp học này đang phát triển nhanh chóng và tạo ra nhiều thuật toán học tập. Các thuật toán này rất hữu ích trong lĩnh vực Robot, Trò chơi, Hệ thống tự động thông minh v.v.
Đối với một tác nhân học tập, luôn có trạng thái bắt đầu và trạng thái kết thúc. Tuy nhiên, để đạt được trạng thái cuối, có thể có một con đường khác. Trong Học tăng cường , một tác nhân cố gắng thao túng môi trường . Tác nhân đi từ tiểu bang này sang tiểu bang khác. Người đại diện nhận được phần thưởng (đánh giá cao) khi thành công nhưng sẽ không nhận được bất kỳ phần thưởng hoặc sự đánh giá nào khi thất bại. Bằng cách này, tác nhân học hỏi từ môi trường.
Sự khác biệt chính giữa Supervised Learning, Unsupervised Learning và Reinforcement Learning
- Học có giám sát giải quyết hai bài toán chính là Hồi quy và Phân loại. Học không giám sát giải quyết các vấn đề phân cụm và khai thác quy tắc liên kết. Trong khi Học tăng cường liên quan đến khai thác hoặc thăm dò, các quy trình quyết định của Markov, Policy Learning, Deep Learning và Value Learning.
- Học có giám sát hoạt động với dữ liệu được gắn nhãn và ở đây hệ thống đã biết các mẫu dữ liệu đầu ra. Tuy nhiên, việc Học không có giám sát xử lý dữ liệu không được gắn nhãn, nơi đầu ra dựa trên việc thu thập các nhận thức. Trong khi trong Học tăng cường, tập trung vào quy trình Ra quyết định của Markov- tác nhân tương tác với môi trường theo các bước rời rạc.
- Bản thân cái tên đã nói lên rằng, Học có giám sát được giám sát rất cao. Và Học không giám sát không được giám sát. Ngược lại, Reinforcement Learning ít được giám sát hơn, điều này phụ thuộc vào tác nhân trong việc xác định đầu ra.
- Dữ liệu đầu vào trong Học có giám sát ở dạng dữ liệu được gắn nhãn. Trong khi đó, trong Học không giám sát, dữ liệu không được gắn nhãn. Trong khí đó, dữ liệu không được xác định trước trong Học tăng cường.
- Học có giám sát dự đoán dựa trên phân loại (class type). Học không giám sát khám phá các mẫu ẩn (underlying pattern). Và trong Học tập tăng cường, tác nhân học tập dựa trên một hệ thống quy tắc thưởng phạt (reward and action system).
- Bản đồ học có giám sát được gắn nhãn dữ liệu cho đầu ra đã biết. Trong khi, Học không giám sát khám phá các mẫu và dự đoán đầu ra. Học tăng cường lại dựa trên phương pháp thử và sai.
- Tóm lại, trong Học có giám sát, mục tiêu là tạo công thức dựa trên các giá trị đầu vào và đầu ra. Trong Học không giám sát là tìm ra mối liên hệ giữa các giá trị đầu vào và gom nhóm chúng lại. Trong Học tập tăng cường, một tác nhân học thông qua phản hồi trễ (delayed feedback) bằng cách tương tác với môi trường.
Bảng so sánh
Tiêu chuẩn | Học có giám sát | Học không giám sát | Học tăng cường |
Định nghĩa | Học bằng cách sử dụng dữ liệu được gắn nhãn | Được đào tạo bằng cách sử dụng dữ liệu không được gắn nhãn mà không có bất kỳ hướng dẫn nào | Hoạt động dựa trên tương tác với môi trường |
Loại dữ liệu | Dữ liệu được gắn nhãn | Dữ liệu chưa được gắn nhãn | Dữ liệu không được xác định trước |
Loại bài toán | Hồi quy và phân loại | Liên kết và phân cụm | Khai thác hoặc thăm dò |
Sự giám sát | Giám sát bổ sung | Không có giám sát | Không có giám sát |
Các thuật toán | Linear Regression, Logistic Regression, SVM, KNN etc | K – Means, C – Means, Apriori | Q – Learning, SARSA |
Mục đích | Tính toán kết quả | Khám phá các mẫu cơ bản | Học một chuỗi hoạt động |
Ứng dụng | Đánh giá rủi ro, dự báo doanh số bán hàng | Hệ thống đề xuất, phát hiện bất thường | Ô tô tự lái, Trò chơi, Chăm sóc sức khỏe |
Nắm vững sự khác biệt cơ bản của Supervised Learning, Unsupervised Learning và Reinforcement Learning phần nào giúp bạn hiểu rõ hơn các bài toán ứng dụng trong thực tế và xác định được các nhóm thuật toán cần học.
(Nguồn Tổng hợp)