Danh mục
  • Tin tức
  • Sự kiện tech
  • Giải pháp công nghệ
  • Kinh doanh số
  • Hướng dẫn – Thủ thuật
  • Phát triển nghề nghiệp
    • Khóa học IT
      • Trí tuệ nhân tạo
      • Phân tích dữ liệu
      • Khác
    • Khóa học khác
    • Cẩm nang công việc
    • Việc làm – Tuyển dụng
    • Sách hay
  • Bài viết đề cử
  • Diễn đàn
  • Xem thêm
    • Sản phẩm công nghệ
    • Chia sẻ kiến thức
    • Quote hay học tập
    • Góc giải trí

4TechNews  |  Tin tức, đào tạo, sản phẩm và các giải pháp công nghệ

Home
Bài viết đề cử
Phân biệt Supervised Learning, Unsupervised Learning và Reinforcement Learning

Phân biệt Supervised Learning, Unsupervised Learning và Reinforcement Learning

Bài viết đề cử Chia sẻ kiến thức 17/08/2022 03/11/2022 1,228 views Tran Hai
##

[Hot]   Tìm hiểu về AI & Data Science tại AI4vietnam

[Upcoming]   Tổng hợp các khóa học cho người làm IT

Supervised Learning, Unsupervised Learning và Reinforcement Learning là ba nhóm thuật toán quan trọng và phổ biến nhất trong Máy học. Vậy làm sao để phân biệt rõ chúng, hãy cùng tìm hiểu nhé.

Lượng dữ liệu được tạo ra trên thế giới ngày nay là rất lớn. Dữ liệu này không chỉ được tạo ra bởi con người mà còn được tạo ra bởi điện thoại thông minh, máy tính và các thiết bị khác. Dựa trên loại dữ liệu có sẵn và động cơ hiện tại, chắc chắn, một lập trình viên sẽ chọn cách đào tạo một thuật toán bằng cách sử dụng một mô hình học cụ thể.

Phân biệt Supervised Learning, Unsupervised Learning và Reinforcement Learning - 4TechNews

Học máy là một phần của Khoa học máy tính, nơi hệ thống tự cải thiện hiệu quả bằng cách thực hiện lặp đi lặp lại các tác vụ bằng cách sử dụng dữ liệu, thay vì cần phải được lập trình rõ ràng. Hãy tìm hiểu sự khác biệt giữa ba kỹ thuật Supervised Learning (Học có giám sát), Unsupervised Learning (Học không giám sát) và Reinforcement Learning (Học tăng cường).

1/ Supervised Learning (Học có giám sát)

Hãy coi bạn như một học sinh đang ngồi trong lớp học, trong đó giáo viên của bạn đang giám sát bạn, “cách bạn có thể giải quyết vấn đề” hoặc “liệu ​​bạn có làm đúng hay không” . Tương tự, trong Học tập có giám sát, đầu vào được cung cấp dưới dạng tập dữ liệu có nhãn, một mô hình có thể học từ đó để đưa ra kết quả của bài toán một cách dễ dàng.

Các dạng bài toán: Học có Giám sát giải quyết hai loại chính là bài toán phân loại và bài toán hồi quy.

– Bài toán phân loại: Thuật toán này giúp dự đoán một giá trị rời rạc. Có thể nghĩ, dữ liệu đầu vào như một thành viên của một lớp hoặc nhóm cụ thể. Ví dụ: lấy ảnh của tập dữ liệu trái cây, mỗi ảnh được dán nhãn cụ thể ví dụ là xoài, táo, v.v. Ở đây, thuật toán phải phân loại các ảnh mới thành bất kỳ danh mục nào trong số này. Ví dụ:

  • Naive Bayes Classifier
  • Support Vector Machines
  • Logistic Regression

– Bài toán hồi quy: Những bài toán này được sử dụng cho dữ liệu liên tục (cập nhật liên tục). Ví dụ, dự đoán giá của một mảnh đất trong thành phố, cho biết diện tích, vị trí, số lượng phòng, … Và sau đó đầu vào được gửi đến máy tính giá đất theo các ví dụ trước đó. Ví dụ:

  • Linear Regression
  • Nonlinear Regression
  • Bayesian Linear Regression

2/ Unsupervised Learning (Học không giám sát)

Thuật toán học tập này hoàn toàn trái ngược với Học tập có giám sát. Nói tóm lại, không có tập dữ liệu được gắn nhãn hoàn chỉnh và sạch sẽ trong học tập không có giám sát . Học tập không giám sát là học tập tự tổ chức. Mục đích chính của nó là khám phá các mô hình cơ bản và dự đoán kết quả đầu ra. Ở đây về cơ bản, chúng ta cung cấp cho máy dữ liệu và yêu cầu tìm kiếm các thuộc tính ẩn và phân cụm dữ liệu theo cách có ý nghĩa. Ví dụ:

  • K – Means Clustering
  • Neural Networks
  • Principal Component Analysis

3/ Reinforcement Learning (Học tăng cường)

Nó không dựa trên việc học có giám sát hay không được giám sát. Ở đây các thuật toán học cách tự phản ứng với môi trường. Phương pháp học này đang phát triển nhanh chóng và tạo ra nhiều thuật toán học tập. Các thuật toán này rất hữu ích trong lĩnh vực Robot, Trò chơi, Hệ thống tự động thông minh v.v.

Đối với một tác nhân học tập, luôn có trạng thái bắt đầu và trạng thái kết thúc. Tuy nhiên, để đạt được trạng thái cuối, có thể có một con đường khác. Trong Học tăng cường , một tác nhân cố gắng thao túng môi trường . Tác nhân đi từ tiểu bang này sang tiểu bang khác. Người đại diện nhận được phần thưởng (đánh giá cao) khi thành công nhưng sẽ không nhận được bất kỳ phần thưởng hoặc sự đánh giá nào khi thất bại. Bằng cách này, tác nhân học hỏi từ môi trường.

Sự khác biệt chính giữa Supervised Learning, Unsupervised Learning và Reinforcement Learning

  1. Học có giám sát giải quyết hai bài toán chính là Hồi quy và Phân loại. Học không giám sát giải quyết các vấn đề phân cụm và khai thác quy tắc liên kết. Trong khi Học tăng cường liên quan đến khai thác hoặc thăm dò, các quy trình quyết định của Markov, Policy Learning, Deep Learning và Value Learning.
  2. Học có giám sát hoạt động với dữ liệu được gắn nhãn và ở đây hệ thống đã biết các mẫu dữ liệu đầu ra. Tuy nhiên, việc Học không có giám sát xử lý dữ liệu không được gắn nhãn, nơi đầu ra dựa trên việc thu thập các nhận thức. Trong khi trong Học tăng cường, tập trung vào quy trình Ra quyết định của Markov- tác nhân tương tác với môi trường theo các bước rời rạc.
  3. Bản thân cái tên đã nói lên rằng, Học có giám sát được giám sát rất cao. Và Học không giám sát không được giám sát. Ngược lại, Reinforcement Learning ít được giám sát hơn, điều này phụ thuộc vào tác nhân trong việc xác định đầu ra.
  4. Dữ liệu đầu vào trong Học có giám sát ở dạng dữ liệu được gắn nhãn. Trong khi đó, trong Học không giám sát, dữ liệu không được gắn nhãn. Trong khí đó, dữ liệu không được xác định trước trong Học tăng cường.
  5. Học có giám sát dự đoán dựa trên phân loại (class type). Học không giám sát khám phá các mẫu ẩn (underlying pattern). Và trong Học tập tăng cường, tác nhân học tập dựa trên một hệ thống quy tắc thưởng phạt (reward and action system).
  6. Bản đồ học có giám sát được gắn nhãn dữ liệu cho đầu ra đã biết. Trong khi, Học không giám sát khám phá các mẫu và dự đoán đầu ra. Học tăng cường lại dựa trên phương pháp thử và sai.
  7. Tóm lại, trong Học có giám sát, mục tiêu là tạo công thức dựa trên các giá trị đầu vào và đầu ra. Trong Học không giám sát là tìm ra mối liên hệ giữa các giá trị đầu vào và gom nhóm chúng lại. Trong Học tập tăng cường, một tác nhân học thông qua phản hồi trễ (delayed feedback) bằng cách tương tác với môi trường.

Bảng so sánh

Tiêu chuẩn

Học có giám sát

Học không giám sát

Học tăng cường

Định nghĩa

Học bằng cách sử dụng dữ liệu được gắn nhãn

Được đào tạo bằng cách sử dụng dữ liệu không được gắn nhãn mà không có bất kỳ hướng dẫn nào

Hoạt động dựa trên tương tác với môi trường

Loại dữ liệu

Dữ liệu được gắn nhãn

Dữ liệu chưa được gắn nhãn

Dữ liệu không được xác định trước

Loại bài toán

Hồi quy và phân loại

Liên kết và phân cụm

Khai thác hoặc thăm dò

Sự giám sát

Giám sát bổ sung

Không có giám sát

Không có giám sát

Các thuật toán

Linear Regression, Logistic Regression, SVM, KNN etc

K – Means, C – Means, Apriori

Q – Learning, SARSA

Mục đích

Tính toán kết quả

Khám phá các mẫu cơ bản

Học một chuỗi hoạt động

Ứng dụng

Đánh giá rủi ro, dự báo doanh số bán hàng

Hệ thống đề xuất, phát hiện bất thường

Ô tô tự lái, Trò chơi, Chăm sóc sức khỏe

Nắm vững sự khác biệt cơ bản của Supervised Learning, Unsupervised Learning và Reinforcement Learning phần nào giúp bạn hiểu rõ hơn các bài toán ứng dụng trong thực tế và xác định được các nhóm thuật toán cần học.

(Nguồn Tổng hợp)

Tweet

Bài viết liên quan

  • Lập trình viên sẽ làm gì trong kỷ nguyên AI - Phần mềm 2.0 - 4TechNews
    Lập trình viên sẽ làm gì trong kỷ nguyên AI – Phần mềm 2.0?
    20/12/2022 0
  • 11-Ung-dung-Xu-ly-Ngon-ngu-Tu-nhien-NLP-trong-Kinh-doanh-4TechNews
    11 Ứng dụng Xử lý Ngôn ngữ Tự nhiên (NLP) trong Kinh doanh
    21/07/2022 0
  • ChatGPT có thể thay thế và soán ngôi Google - 4TechNews
    ChatGPT có thể thay thế và soán ngôi Google?
    24/12/2022 0
  • Vẽ hoa với Python Turtle Graphics
    08/07/2022 0

Để lại bình luận

Cancel reply

DMCA.com Protection Status

Xem nhiều nhất

  • Ứng viên và cơ hội việc làm nhân đôi nhờ sử dụng ChatGPT - 4TechNews
    Ứng viên và cơ hội việc làm nhân đôi nhờ sử dụng ChatGPT
  • Đối thủ của ChatGPT, Claude AI có thể hiểu cuốn sách 75000 từ chỉ trong vài giây - 4TechNews
    Đối thủ của ChatGPT, Claude AI có thể hiểu cuốn sách 75.000 từ chỉ trong vài giây
  • Khai thác sức mạnh của AI Sự trỗi dậy của Prompt Engineering - 4TechNews
    Khai thác sức mạnh của AI: Sự trỗi dậy của Prompt Engineering
  • Các chuyên gia AI hàng đầu và CEO cảnh báo về nguy cơ tuyệt chủng - 4TechNews
    Các chuyên gia AI hàng đầu và CEO cảnh báo về “nguy cơ tuyệt chủng”
  • Cô gái kiếm 71.610$ chỉ trong 1 tuần từ mô hình kinh doanh bằng GPT-4 - 4TechNews
    Cô gái kiếm 71.610$ chỉ trong 1 tuần từ mô hình kinh doanh bằng GPT-4
  • Nvidia giới thiệu Neuralangelo Mô hình AI biến video 2D thành cấu trúc 3D - 4TechNews
    Nvidia giới thiệu Neuralangelo: Mô hình AI biến video 2D thành cấu trúc 3D

4TechNewsAds

Facebook

4TechNews

Giới thiệu

Giới thiệu - Liên hệ - Chính sách bảo mật

Liên kết

Đối tác

4TechNews | Tin tức, đào tạo, sản phẩm và các giải pháp công nghệ
Copyright © 2023
  • Tiếng Việt