Nếu bạn đã từng nghe ở đâu đó cụm từ “máy học” hoặc “học máy” hoặc “machine learning” và bạn không hề hiểu hoặc chưa rõ khái niệm nó nói về cái gì thì bài viết này sẽ cho bạn biết nó là cái gì, nó ra sao một cách dễ hiểu và đơn giản nhất.

Bài viết này sẽ dựa trên bài viết “Machine Learning is Fun!” ở Medium.

Nào, chúng ta cùng bắt đầu!

******************

 
1. Machine Learning là gì?

Machine Learning ở Việt Nam thường dịch là máy học hoặc học máy, nhưng cụm từ này đôi lúc dịch sang tiếng Việt nó nghe khá củ chuối nên bài viết này tôi sẽ dùng từ gốc là machine learning (viết tắt là ML) để trình bày.

Machine learning là một ý tưởng dùng một tập hoặc một họ các thuật toán nào đó để tìm ra điểm lý thú nào đó từ một bộ dữ liệu mà bạn hoặc ai đó cung cấp. Lấy ví dụ cho dễ hiểu, khi bạn nhận email, làm thế nào để đưa email bạn nhận được từ ai đó vào hộp mail của bạn hay đưa nó vào mục spam? Tất nhiên máy tính tự động làm rồi. Nhưng máy tính làm bằng cách nào? Câu trả lời là nó dùng machine learning để phân loại email từ dữ liệu bên trong email. Hoặc khi bạn đưa một bộ chữ số viết bằng tay thì máy tính làm sao biết được chữ số đó là chữ số nào? Tất nhiên nó cũng dùng machine learning rồi.

 

Tóm lại, machine learning là một thuật ngữ dùng để chỉ một hoặc một họ thuật toán để giúp máy tính có thể khám phá hoặc học hỏi từ dữ liệu được cung cấp.

 

 
2. Hai loại machine learning
 

 

Machine learning được chia làm hai loại là supervised learning (học có giám sát) và unsupervised learning (học không có giám sát). Nghe có vẻ như quá trình học của máy tính giống như đứa trẻ học có thầy cô, cha mẹ đứng giám sát kế bên nhỉ? Vậy thực ra nó là gì?

a. Supervised learning (học có giám sát)
Để cho dễ hiểu chúng ta có thể lấy ví dụ sau:

training_set

Bảng trên biểu diễn các yếu tố ảnh hưởng đến quyết định chơi đá bóng hay không dựa trên các số liệu về Quang cảnh, Nhiệt độ, Độ ẩm và Gió.

Vậy với một yếu tố chưa có trong bảng trên thì quyết định thế nào? Ví dụ mẫu như sau:
new_object_classification

Đây được gọi là học có giám sát, nghĩa là dựa vào những dữ liệu đã được cung cấp, các thuật toán ML sẽ tìm ra quyết định có chơi đá bóng hay không.
Nó cũng tương tự như khi bạn giải bài toán sau:

Bạn đã có những dữ liệu biết trước và bạn tìm ra được con số cần tìm dựa vào những liên hệ ở những dữ liệu biết trước, máy tính cũng học theo phương pháp học có giám sát cũng làm điều tương tự.

b. Unsupervised learning (học không có giám sát)
Quay trở lại với ví dụ quyết định chơi đá bóng ở trên, ở trường hợp này bộ dữ liệu bạn có không có dữ liệu quyết định có đá bóng hay không mà chỉ có các yếu tố thời tiết, vậy bạn làm gì với bộ dữ liệu như thế này?

Việc đầu tiên là bạn tìm ra sự tương đồng của các dòng dữ liệu và gom chúng thành các nhóm tương đồng với nhau. Nhưng gom xong rồi thì làm gì? Câu trả lời là tuỳ vào mục đích sử dụng, có thể gom thành các nhóm tương đồng rồi thì khi có một dữ liệu mới thì chúng ta cũng xác định nó thuộc nhóm nào rồi đưa nó vào nhóm đó chứ không thể biết câu trả lời là nhóm dữ liệu đó là có quyết định chơi đá bóng hay không.
Trong ML, máy tính cũng làm điều tương tự như vậy và đây gọi là Học không có giám sát.

Vậy học có giám sát hay học không có giám sát cái nào quan trọng hơn? Câu trả lời là tuỳ vào ngữ cảnh và mục đích sử dụng của bạn và bộ dữ liệu mà bạn có.

3. Học Machine Learning thế nào?
Với những bạn học chuyên ngành Khoa học máy tính (Computer Science) thì chắc chắn có môn này trong chương trình đại học của bạn rồi, nhưng còn những bạn không có học thì sao?
Rất đơn giản, bạn có thể vào Coursera để tham gia khoá học về Machine Learning của Andrew Ng (giáo sư Đại học Stanford), khoá học này hoàn toàn miễn phí, tất nhiên là bằng tiếng Anh, địa chỉ cho các bạn vào đăng ký khoá này như sau:

https://www.coursera.org/learn/machine-learning

PS: Chúng ta đang ở thời đại Cách mạng công nghiệp lần thứ 4, là cuộc cách mạng của công nghệ tri thức, trí tuệ nhân tạo, do đó, học về các kiến thức về Machine Learning không bao giờ là thừa cả. Chúc các bạn học có kết quả tốt.

Leave a Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>