[Giải nén AI] Machine Learning từ A-Z

Mặc dù cách xa ý tưởng ban đầu của trí tuệ nhân tạo, Machine Learning (học máy) đã đưa chúng ta gần hơn với mục tiêu cuối cùng là tạo ra những máy tính có khả năng suy nghĩ. Hãy tìm hiểu về cách nó hoạt động qua bài viết của Tothost nhé!

Mục lục

1. Khởi đầu của Machine Learning

Vào tháng 12 năm 2017, DeepMind, phòng thí nghiệm nghiên cứu được Google mua lại vào năm 2014, giới thiệu AlphaZero, một chương trình trí tuệ nhân tạo có thể đánh bại các nhà vô địch thế giới ở một số môn cờ.

Thú vị là, AlphaZero không nhận được bất kỳ hướng dẫn nào từ con người về cách chơi các trò chơi đó. Thay vào đó, nó sử dụng machine learning, một nhánh của trí tuệ nhân tạo phát triển hành vi của mình thông qua kinh nghiệm thay vì các lệnh cụ thể.

Trong vòng 24 giờ, AlphaZero đạt được hiệu suất siêu phàm trong cờ vua và đánh bại chương trình cờ vua vô địch thế giới trước đó. Không lâu sau đó, thuật toán học máy của AlphaZero cũng vượt qua Shogi (cờ vua Nhật Bản) và cờ vây, và nó đánh bại tiền nhiệm của nó, AlphaGo, với tỷ số 100-0.

Machine learning đã trở nên phổ biến trong những năm gần đây và giúp máy tính giải quyết các vấn đề trước đây được coi là lĩnh vực độc quyền của trí thông minh con người. Và mặc dù nó vẫn cách xa khá xa ý tưởng ban đầu của trí tuệ nhân tạo, học máy đã đưa chúng ta gần hơn tới mục tiêu cuối cùng của việc tạo ra những máy tính có khả năng suy nghĩ.

2. Sự khác biệt giữa Trí tuệ nhân tạo (AI) và Học máy (Machine Learning) là gì?

Các phương pháp truyền thống để phát triển trí tuệ nhân tạo liên quan đến việc viết mã một cách tỉ mỉ để xác định tất cả các quy tắc và kiến thức mô tả hành vi của một trí tuệ nhân tạo. Khi tạo ra trí tuệ nhân tạo dựa trên quy tắc, các nhà phát triển phải viết hướng dẫn chỉ định cách mà trí tuệ nhân tạo phải hành động trong mọi tình huống có thể xảy ra.

[Giải nén AI] Nói về Trí Tuệ Nhân Tạo (2023)

Phương pháp dựa trên quy tắc này, còn được gọi là trí tuệ nhân tạo kiểu cũ (GOFAI) hoặc Symbolic AI, cố gắng bắt chước các chức năng lập luận và đại diện kiến thức của trí não con người.

2.1. Ví dụ về GOFAI

Một ví dụ hoàn hảo về trí tuệ nhân tạo biểu tượng là Stockfish, một chương trình chơi cờ vua mã nguồn mở hàng đầu được phát triển trong hơn 10 năm. Hàng trăm lập trình viên và người chơi cờ đã đóng góp cho Stockfish và giúp phát triển logic của nó bằng cách viết các quy tắc cho nó – ví dụ như những gì trí tuệ nhân tạo nên làm khi đối thủ di chuyển quân mã từ B1 đến C3.

Tuy nhiên, trí tuệ nhân tạo dựa trên quy tắc thường gặp phải sự cố khi xử lý các tình huống mà các quy tắc quá phức tạp và ngầm định. Ví dụ, việc nhận dạng giọng nói và các đối tượng trong hình ảnh là các hoạt động tiên tiến mà không thể được thể hiện bằng các quy tắc logic.

2.2. Ví dụ về Symbolic AI

Ngược lại với Symbolic AI, các mô hình trí tuệ nhân tạo dựa trên học máy được phát triển không phải bằng cách viết các quy tắc mà bằng cách thu thập các ví dụ. Ví dụ, để tạo ra một chương trình chơi cờ vua dựa trên machine learning, một nhà phát triển tạo ra một thuật toán cơ bản và sau đó “huấn luyện” nó với dữ liệu từ hàng nghìn ván cờ chơi trước đó. Bằng cách phân tích dữ liệu, trí tuệ nhân tạo tìm ra các mẫu phổ biến xác định các chiến lược thắng, mà nó có thể sử dụng để đánh bại đối thủ thực sự.

Càng nhiều trận đấu mà trí tuệ nhân tạo xem xét, nó càng trở nên tốt hơn trong việc dự đoán các nước đi chiến thắng trong quá trình chơi. Đây là lý do tại sao học máy được định nghĩa là một chương trình mà hiệu suất của nó cải thiện với kinh nghiệm.

Học máy được áp dụng cho nhiều tác vụ thực tế, bao gồm phân loại hình ảnh, nhận dạng giọng nói, đề xuất nội dung, phát hiện gian lận và xử lý ngôn ngữ tự nhiên.

3. Các loại Machine Learning

3.1. Học có giám sát (Supervised Learning)

Tùy vào vấn đề mà họ muốn giải quyết, các nhà phát triển sẽ chuẩn bị dữ liệu phù hợp để xây dựng mô hình học máy. Ví dụ, nếu họ muốn sử dụng học máy để phát hiện các giao dịch ngân hàng gian lận, các nhà phát triển sẽ tổng hợp một danh sách các giao dịch hiện có và gán nhãn chúng với kết quả của chúng (gian lận hoặc hợp lệ). Khi đưa dữ liệu vào thuật toán, nó phân tách các giao dịch gian lận và hợp lệ và tìm ra các đặc điểm chung trong mỗi lớp. Quá trình huấn luyện mô hình với dữ liệu được chú thích được gọi là “học có giám sát” và hiện nay là hình thức chủ đạo của học máy.

Hiện nay đã có nhiều kho dữ liệu trực tuyến có nhãn cho các nhiệm vụ khác nhau. Một số ví dụ phổ biến là ImageNet, một bộ dữ liệu mã nguồn mở gồm hơn 14 triệu hình ảnh có nhãn, và MNIST, một bộ dữ liệu gồm 60.000 chữ số viết tay có nhãn. Các nhà phát triển học máy cũng sử dụng các nền tảng như Amazon’s Mechanical Turk, một trung tâm tuyển dụng trực tuyến theo yêu cầu để thực hiện các nhiệm vụ nhận thức như đánh nhãn hình ảnh và mẫu âm thanh. Và một ngành công nghiệp mới đang phát triển chuyên về đánh dấu dữ liệu.

3.2. Học không có giám sát (Unsupervised Learning)

Tuy nhiên, không phải tất cả các vấn đề đều yêu cầu dữ liệu đã được gán nhãn. Một số vấn đề của machine learning có thể được giải quyết thông qua “unsupervised learning,” trong đó bạn cung cấp cho mô hình trí tuệ nhân tạo dữ liệu thô và để cho nó tự tìm ra các mẫu liên quan.

Một ứng dụng phổ biến của unsupervised learning là phát hiện bất thường. Ví dụ, một thuật toán machine learning có thể được huấn luyện trên dữ liệu lưu lượng mạng thô của một thiết bị kết nối internet, ví dụ như một tủ lạnh thông minh. Sau khi được huấn luyện, trí tuệ nhân tạo sẽ xác lập một ngưỡng cơ sở cho thiết bị và có thể đánh dấu các hành vi ngoại lai. Nếu thiết bị bị lây nhiễm malware và bắt đầu giao tiếp với các máy chủ độc hại, mô hình machine learning sẽ có thể phát hiện được điều đó, vì lưu lượng mạng khác với hành vi bình thường được quan sát trong quá trình huấn luyện.

3.3. Học tăng cường (Reinforcement Learning)

Bây giờ, bạn đã biết rằng dữ liệu đào tạo chất lượng đóng một vai trò quan trọng trong hiệu quả của các mô hình học máy. Tuy nhiên, học tăng cường là một loại học máy chuyên môn, trong đó trí tuệ nhân tạo phát triển hành vi của nó mà không sử dụng dữ liệu trước đó.

Các mô hình học tăng cường bắt đầu với một trang trắng. Chúng chỉ được hướng dẫn về các quy tắc cơ bản của môi trường và nhiệm vụ đang đối diện. Qua thử và sai, chúng học cách tối ưu hành động của mình cho mục tiêu của chúng.

AlphaZero của DeepMind là một ví dụ thú vị về học tăng cường. Khác với các mô hình học máy khác, phải xem cách con người chơi cờ vua và học hỏi từ họ, AlphaZero chỉ biết về các nước đi của các quân cờ và điều kiện thắng cuộc của trò chơi. Sau đó, nó đã chơi hàng triệu trận đấu với chính nó, bắt đầu bằng các hành động ngẫu nhiên và dần phát triển các mô hình hành vi.

Học tăng cường là một lĩnh vực nghiên cứu hot. Đây là công nghệ chính được sử dụng để phát triển các mô hình trí tuệ nhân tạo có thể chinh phục các trò chơi phức tạp như Dota 2 và StarCraft 2 và cũng được sử dụng để giải quyết các vấn đề thực tế như quản lý tài nguyên trung tâm dữ liệu và tạo ra các bàn tay robot có thể xử lý đối tượng với độ khéo léo giống con người.

3.4. Học sâu (Deep Learning)

Deep Learning là một phần con rất phổ biến của Machine Learning. Nó sử dụng các mạng nơ-ron nhân tạo, các cấu trúc phần mềm được lấy cảm hứng từ cấu trúc sinh học của não người.

Mạng nơ-ron tuyệt vời trong việc xử lý dữ liệu không có cấu trúc như hình ảnh, video, âm thanh và đoạn văn dài như bài báo và nghiên cứu.

Trước khi có Deep Learning, các chuyên gia Machine Learning phải đầu tư rất nhiều công sức để trích xuất đặc trưng từ hình ảnh và video, và chạy thuật toán của họ dựa trên đặc trưng đó. Mạng nơ-ron tự động phát hiện những đặc trưng đó mà không yêu cầu nhiều nỗ lực từ các kỹ sư.

Nó đứng sau nhiều công nghệ AI hiện đại như ô tô tự lái, hệ thống dịch thuật tiên tiến và công nghệ nhận diện khuôn mặt trên smartphone của bạn.

4. Giới hạn của Machine Learning

Người ta thường nhầm lẫn Machine Learning với trí tuệ nhân tạo tương đương với con người. Tuy nhiên, trong khi Machine Learning đã đạt được nhiều bước tiến đáng kể trong giải quyết các vấn đề phức tạp, nó vẫn cách xa trong việc tạo ra các máy tính có thể suy nghĩ được như các nhà tiên phong của trí tuệ nhân tạo đã mơ ước.

4.1. Lập luận

Ngoài việc học từ kinh nghiệm, trí tuệ thực sự cần có lập luận, suy nghĩ trừu tượng – những lĩnh vực mà các mô hình Machine Learning thực hiện rất kém.

Khả năng suy luận yếu của machine learning làm cho nó kém trong việc tổng quát hóa kiến thức của mình. Ví dụ, một tác nhân học máy có thể chơi game Super Mario 3 như một chuyên gia sẽ không thể chiến thắng được một trò chơi nền tảng khác hoặc thậm chí là một phiên bản khác của Super Mario. Nó sẽ cần phải được đào tạo lại từ đầu.

4.2. Gia tăng kiến thức từ kinh nghiệm

Machine learning, không có khả năng rút trích kiến thức khái niệm từ kinh nghiệm, yêu cầu rất nhiều dữ liệu đào tạo để hoạt động. Thật không may, nhiều lĩnh vực thiếu đủ dữ liệu đào tạo hoặc không có kinh phí để mua thêm dữ liệu. Deep learning, là dạng phổ biến của machine learning hiện nay, cũng đối mặt với vấn đề cần giải thích: Neural networks (mạng thần kinh) hoạt động theo cách phức tạp, thậm chí cả người tạo ra chúng cũng gặp khó khăn trong việc theo dõi quá trình ra quyết định của chúng.

May mắn thay, nỗ lực đang được thực hiện để vượt qua giới hạn của machine learning. Một ví dụ đáng chú ý là một sáng kiến lan rộng của DARPA, cơ quan nghiên cứu của Bộ Quốc phòng Mỹ, để tạo ra các mô hình trí tuệ nhân tạo có thể giải thích được.

Các dự án khác nhằm giảm sự phụ thuộc quá mức vào dữ liệu được chú thích và làm cho công nghệ trở nên truy cập được đối với các lĩnh vực có dữ liệu huấn luyện hạn chế. Những nhà nghiên cứu tại IBM và MIT đã gần đây đạt được tiến bộ trong lĩnh vực này bằng cách kết hợp Symbolic AI với các mạng nơ-ron. Các mô hình Hybrid AI yêu cầu ít dữ liệu huấn luyện hơn và có thể cung cấp giải thích từng bước về quá trình ra quyết định của chúng.

Lời kết

Việc tiến hóa của machine learning cuối cùng sẽ giúp chúng ta đạt được mục tiêu vô cùng khó khăn của việc tạo ra trí tuệ nhân tạo cùng cấp với con người hay không vẫn còn chưa rõ. Tuy nhiên, điều chắc chắn là nhờ các tiến bộ trong lĩnh vực machine learning, các thiết bị đang đặt trên bàn làm việc và trong túi của chúng ta đang thông minh hơn mỗi ngày.