Đang Tải...

Trang chủ
Tot Blog

Kiến thức & Tin công nghệ

[Giải nén AI] Deep Learning từ A-Z

12/05/2023

icon

Học sâu (deep learning) là một phần con của học máy, một nhánh của trí tuệ nhân tạo giúp cấu hình các máy tính để thực hiện các tác vụ thông qua kinh nghiệm – Đây là một cái nhìn sâu hơn tại bài viết này của Tothost.

Mục lục

Mục lục

1. Deep Learning là gì?

Deep learning hay còn gọi là học sâu, một kỹ thuật trí tuệ nhân tạo tiên tiến, đã trở nên ngày càng phổ biến trong vài năm qua, nhờ vào sự dồi dào của dữ liệu và sức mạnh tính toán tăng lên. Đó là công nghệ chính đứng sau nhiều ứng dụng chúng ta sử dụng hàng ngày, bao gồm dịch ngôn ngữ trực tuyến, gắn thẻ khuôn mặt tự động trên các trang mạng xã hội, phản hồi thông minh trong email của bạn và là một trong những phương pháp sinh mẫu mới. Mặc dù deep learning không phải là cái gì mới, nhưng nó đã được hưởng lợi nhiều từ sự sẵn có của dữ liệu và các tiến bộ trong tính toán.

Deep Learning là gì?

ChatGPT, chatbot được trang bị trí tuệ nhân tạo và đã trở thành ứng dụng phát triển nhanh nhất mọi thời đại, được vận hành bởi một mô hình deep-learning đã được huấn luyện trên hàng tỉ từ được thu thập từ internet. DALL-E, Midjourney và Stable Diffusion, các hệ thống trí tuệ nhân tạo có thể tạo ra hình ảnh từ mô tả văn bản, là các hệ thống deep-learning mô hình hóa mối quan hệ giữa hình ảnh và mô tả văn bản.

2. Deep Learning vs Machine Learning

Deep learning và Machine learning là hai khái niệm khác nhau. Deep learning là một phần con của machine learning, một nhánh của trí tuệ nhân tạo giúp cấu hình các máy tính để thực hiện các tác vụ thông qua kinh nghiệm. Khác với các hệ thống trí tuệ nhân tạo cổ điển dựa trên luật lệ, các thuật toán học máy phát triển hành vi của chúng bằng cách xử lý các ví dụ được chú thích, quá trình được gọi là “huấn luyện”.

Đọc thêm: [Giải nén AI] Machine Learning từ A-Z

Deep Learning vs Machine Learning

Ví dụ, để tạo ra một chương trình phát hiện gian lận, bạn sẽ huấn luyện một thuật toán học máy với một danh sách các giao dịch ngân hàng và kết quả cuối cùng của chúng (hợp lệ hoặc gian lận). Mô hình học máy xem xét các ví dụ và phát triển một biểu diễn thống kê của các đặc điểm chung giữa các giao dịch hợp lệ và giao dịch gian lận.

Sau đó, khi bạn cung cấp cho thuật toán dữ liệu của một giao dịch ngân hàng mới, nó sẽ phân loại nó là hợp lệ hoặc gian lận dựa trên các mô hình mà nó đã học được từ các ví dụ huấn luyện. Như một nguyên tắc chung, càng cung cấp cho thuật toán học máy nhiều dữ liệu chất lượng cao, thì thuật toán học máy sẽ trở nên chính xác hơn trong việc thực hiện nhiệm vụ của nó.

Học máy đặc biệt hữu ích trong việc giải quyết các vấn đề mà các quy tắc không được xác định rõ ràng và không thể được mã hóa thành các lệnh cụ thể. Các loại thuật toán khác nhau có thể vượt trội ở các nhiệm vụ khác nhau.

3. Deep Learning và Neutral Networks

Trong khi các thuật toán máy học cổ điển giải quyết nhiều vấn đề mà các chương trình dựa trên quy tắc đã gặp khó khăn, chúng vẫn không tốt trong việc xử lý dữ liệu mềm như hình ảnh, video, tệp âm thanh và văn bản không có cấu trúc.

Các thuật toán học sâu giải quyết cùng một vấn đề bằng cách sử dụng các mạng thần kinh sâu, loại kiến trúc phần mềm lấy cảm hứng từ não bộ con người (tuy nhiên mạng thần kinh khác với các tế bào thần kinh sinh học). Mạng thần kinh (Neutral Networks) là lớp trên lớp các biến số được điều chỉnh để phù hợp với các đặc tính của dữ liệu mà chúng được đào tạo và trở nên có khả năng thực hiện các nhiệm vụ như phân loại hình ảnh và chuyển đổi lời nói thành văn bản.

Đọc thêm: [Giải nén AI] Neural Networks: Mạng nơ-ron nhân tạo

Đặc biệt, mạng thần kinh rất tốt trong việc tự độc lập tìm ra các mẫu chung trong dữ liệu không có cấu trúc. Ví dụ, khi bạn huấn luyện một mạng thần kinh sâu trên các hình ảnh của các đối tượng khác nhau, nó tìm cách trích xuất các đặc trưng từ những hình ảnh đó. Mỗi lớp của mạng thần kinh phát hiện các đặc trưng cụ thể như cạnh, góc, khuôn mặt, đôi mắt, và cứ như vậy.

Các layer trong Neutral Networks

Mạng thần kinh đã tồn tại từ những năm 1950 (ít nhất là về mặt khái niệm). Nhưng cho đến gần đây, cộng đồng trí tuệ nhân tạo lớn mức đóng góp của chúng đã bị coi thường vì chúng yêu cầu lượng dữ liệu và khả năng tính toán rất lớn. Trong những năm gần đây, tính sẵn có và chi phí phải chăng của bộ nhớ, dữ liệu và tài nguyên tính toán đã đẩy mạng thần kinh lên hàng đầu của sự đổi mới trong lĩnh vực trí tuệ nhân tạo.

Hiểu đơn giản, hiện nay có nhiều kiến trúc học sâu khác nhau, mỗi kiến trúc phù hợp với một nhiệm vụ cụ thể. Mạng nơ-ron tích chập (CNNs) đặc biệt tốt trong việc phát hiện các mẫu trong ảnh; Mạng nơ-ron truy hồi (RNNs) tốt trong xử lý dữ liệu tuần tự như giọng nói, văn bản và nhạc; Mạng nơ-ron đồ thị (GNNs) có thể học và dự đoán mối quan hệ giữa dữ liệu đồ thị, chẳng hạn như mạng xã hội và mua sắm trực tuyến.

Kiến trúc deep-learning trở nên rất phổ biến gần đây là transformer, được sử dụng trong các mô hình ngôn ngữ lớn (LLM) như GPT-4 và ChatGPT. Transformers đặc biệt tốt trong các tác vụ ngôn ngữ và chúng có thể được huấn luyện trên lượng lớn văn bản nguyên thủy.

4. Sử dụng Deep Learning để làm gì?

Deep Learning được sử dụng trong một số lĩnh vực giúp máy tính giải quyết các vấn đề trước đây không thể giải quyết được:

4.1. Tầm nhìn máy tính

Computer Vision (Tầm nhìn máy tính) là khoa học sử dụng phần mềm để hiểu nội dung của hình ảnh và video. Đây là một trong những lĩnh vực mà Deep Learning đã tiến bộ rất nhiều. Ngoài việc phát hiện ung thư vú, các thuật toán xử lý hình ảnh Deep Learning có thể phát hiện được các loại ung thư khác (Mở trong cửa sổ mới) và giúp chẩn đoán các bệnh khác (Mở trong cửa sổ mới).

Điều này cũng được tích hợp trong nhiều ứng dụng mà bạn sử dụng hàng ngày. Face ID của Apple sử dụng thị giác máy tính để nhận ra khuôn mặt của bạn, cũng như Google Photos cho các tính năng khác nhau như tìm kiếm đối tượng và cảnh quan cũng như chỉnh sửa ảnh. Facebook đã sử dụng deep learning để tự động đánh dấu những người trong các bức ảnh bạn tải lên, trước khi tính năng này bị đóng cửa vào năm 2021.

Deep learning cũng giúp cho các công ty mạng xã hội tự động nhận diện và chặn nội dung đáng ngờ, chẳng hạn như bạo lực và nội dung khiêu dâm. Cuối cùng, deep learning đóng vai trò rất quan trọng trong việc cho phép các xe tự lái hiểu được môi trường xung quanh của chúng.

4.2. Nhận diện giọng nói và lời nói

Khi bạn ra lệnh bằng giọng nói đến loa thông minh Amazon Echo hoặc Google Assistant của mình, các thuật toán học sâu chuyển đổi giọng nói của bạn thành các lệnh văn bản. Nhiều ứng dụng trực tuyến cũng sử dụng học sâu để chuyển đổi các tập tin âm thanh và video thành văn bản. Ứng dụng bàn phím của Google, Gboard, sử dụng học sâu để cung cấp chuyển đổi giọng nói thời gian thực trên thiết bị cho việc gõ văn bản khi bạn nói.

4.3. Xử lý và Tạo Ngôn Ngữ Tự Nhiên

Xử lý ngôn ngữ tự nhiên – Natural Language Processing (NLP), khoa học trích xuất ý nghĩa của văn bản không cấu trúc, đã là vấn đề đau đầu trong lịch sử phần mềm cổ điển. Định nghĩa tất cả các nghĩa khác nhau và ý nghĩa ẩn của ngôn ngữ viết bằng các quy tắc máy tính là vô cùng khó khăn. Nhưng mạng thần kinh được đào tạo trên các tập dữ liệu lớn có thể thực hiện chính xác nhiều tác vụ NLP.

Dịch vụ dịch thuật của Google đã thấy một bước nhảy vọt đáng kể về hiệu suất khi công ty chuyển sang sử dụng deep learning. Các loa thông minh sử dụng NLP deep-learning để hiểu được các sắc thái khác nhau của các lệnh, chẳng hạn như các cách khác nhau để hỏi thời tiết hoặc đường đi.

Deep learning cũng rất hiệu quả trong việc tạo ra văn bản có ý nghĩa, còn được gọi là tự động tạo ngôn ngữ (NLG). Smart Reply và Smart Compose của Gmail sử dụng deep learning để đưa ra các phản hồi liên quan đến email của bạn và đề xuất hoàn tất câu của bạn. Một mô hình tạo văn bản được phát triển bởi OpenAI đã tạo ra các đoạn văn bản liên tục có ý nghĩa.

Điểm nổi bật của các mô hình ngôn ngữ lớn (LLMs) như ChatGPT của OpenAI là chúng có thể thực hiện một loạt các tác vụ, bao gồm tóm tắt văn bản, trả lời câu hỏi, viết bài báo và tạo mã phần mềm. Các LLMs đang được tích hợp trong nhiều ứng dụng khác nhau, bao gồm các ứng dụng nhắn tin và email trong doanh nghiệp, các ứng dụng tăng năng suất và các công cụ tìm kiếm.

4.4. Sáng tạo tác phẩm nghệ thuật

Deep learning cũng rất hữu ích trong việc tạo ra những tác phẩm nghệ thuật. Các mô hình như DALL-E và Stable Diffusion có thể tạo ra những bức tranh đẹp từ mô tả văn bản. Microsoft đã sử dụng DALL-E trong một số sản phẩm, bao gồm Designer. Adobe cũng đang sử dụng các mô hình sinh trong nhiều ứng dụng của mình.

Hình ảnh được tạo ra bởi AI

5. Hạn chế của Deep Learning 

5.1. Sự phụ thuộc vào dữ liệu

Nhìn chung, các thuật toán deep learning đòi hỏi lượng dữ liệu huấn luyện rất lớn để thực hiện các nhiệm vụ của chúng một cách chính xác. Rất tiếc, không có đủ dữ liệu huấn luyện chất lượng để tạo ra các mô hình deep-learning có thể giải quyết nhiều loại vấn đề.

5.2. Khả năng giải thích

Mạng thần kinh phát triển hành vi của chúng theo cách vô cùng phức tạp – ngay cả người tạo ra chúng cũng gặp khó khăn trong việc hiểu hành động của chúng. Sự thiếu khả năng giải thích khiến việc khắc phục lỗi và sửa sai trong các thuật toán deep-learning trở nên vô cùng khó khăn.

5.3. Xu hướng thuật toán

Các thuật toán deep-learning chỉ tốt như dữ liệu được huấn luyện. Vấn đề là dữ liệu huấn luyện thường chứa các xu hướng rõ ràng hoặc ẩn. Ví dụ, một thuật toán nhận diện khuôn mặt được huấn luyện chủ yếu trên các bức ảnh của người da trắng sẽ hoạt động kém chính xác đối với những người không da trắng.

5.4. Thiếu khả năng tổng quát hóa

Các thuật toán deep-learning tốt trong việc thực hiện các nhiệm vụ tập trung nhưng kém trong việc tổng quát hóa kiến thức của chúng. Khác với con người, một mô hình deep-learning được huấn luyện để chơi StarCraft sẽ không thể chơi được một trò chơi tương tự – ví dụ, WarCraft.

Hơn nữa, deep learning kém trong việc xử lý dữ liệu không giống với các ví dụ huấn luyện của nó, còn được gọi là “edge cases”. Điều này có thể trở nên nguy hiểm trong những tình huống như xe tự lái, nơi các sai sót có thể có hậu quả chết người.

6. Tương lai của Deep Learning

Năm 2019, những nhà tiên phong của Deep Learning đã được trao Giải Turing, tương đương với Giải Nobel trong lĩnh vực khoa học máy tính. Nhưng công việc về Deep Learning và mạng thần kinh vẫn chưa kết thúc. Nhiều nỗ lực đang được thực hiện để cải thiện Deep Learning.

Một số công trình nghiên cứu thú vị bao gồm các mô hình deep learning có thể giải thích được hoặc dễ hiểu, các mạng neuron có thể phát triển hành vi của chúng với ít dữ liệu huấn luyện hơn và các mô hình Edge AI, các thuật toán deep learning có thể thực hiện nhiệm vụ của chúng mà không phải dựa vào tài nguyên tính toán đám mây lớn.

Và mặc dù deep learning hiện đang là kỹ thuật trí tuệ nhân tạo tiên tiến nhất, nhưng nó không phải là điểm đến cuối cùng của ngành AI. Sự tiến hóa của deep learning và mạng neuron có thể đưa chúng ta đến kiến trúc hoàn toàn mới.

TelegramCommunity
scroll top
Thông báo
Đóng