Làm thế nào để Chat-GPT, Google Bard hiểu được ngôn ngữ của con người?

Làm thế nào để Chat-GPT, Google Bard hiểu được ngôn ngữ của con người?

4 Tháng chín 2024 - 2:49 sáng
Các nghiên cứu về ngôn ngữ học, tâm lý học con người đã đạt được thành tựu rất sớm... Tuy nhiên, mãi cho đến gần đây việc ứng dụng các lý thuyết này vào lĩnh vực máy học, khoa học máy tính mới có những tiến bộ rõ ràng. Việc này cũng không có gì lạ: thường thì các nhà khoa học không biết lập trình, còn các kỹ sư lập trình thì không hiểu gì về ngôn ngữ học và tâm lý học.

Sau hiện tượng Chat-GPT, Google Bard... chắc có lẽ chúng ta đã từng đặt câu hỏi thắc mắc: Bằng cách nào Chatbot AI có thể học được cách giao tiếp giống ngôn ngữ của con người? Tiếng nói của nhân loại đã được định hình trong máy học như thế nào? Trong bài viết này chúng tôi sẽ giới thiệu một trong nhiều các lý thuyết ngôn ngữ học được ứng dụng vào bài toán xử lý ngôn ngữ tự nhiên.

Các nghiên cứu về ngôn ngữ học, tâm lý học con người đã đạt được thành tựu rất sớm... Tuy nhiên, mãi cho đến gần đây việc ứng dụng các lý thuyết này vào lĩnh vực máy học, khoa học máy tính mới có những tiến bộ rõ ràng. Việc này cũng không có gì lạ: thường thì các nhà khoa học không biết lập trình, còn các kỹ sư lập trình thì không hiểu gì về ngôn ngữ học và tâm lý học.

Nhận thấy rõ rào cản này, các công ty công nghệ lớn như Microsoft, Google... đã tập hợp các nhà khoa học, các nhà nghiên cứu ngôn ngữ, các chuyên gia tâm lý, các bác sĩ. Và thành lập một nhóm chuyên gia đi tìm giải pháp chung cho vấn đề xử lý ngôn ngữ tự nhiên đang gặp bế tắc.

Một trong số nhiều các lý thuyết ngôn ngữ học được ứng dụng là: Lý thuyết Mồi cấu trúc (Structural Priming).

Lý thuyết Mồi cấu trúc (Structural Priming) và giải pháp đào tạo Chatbot AI

Năm 1986, nữ khoa học gia J. Kathryn Bock đã công bố một nghiên cứu về cấu trúc ngôn ngữ trong bài báo với tiêu đề “Syntactic Persistence in Language Production” và khái niệm về Mồi cấu trúc (Structural Priming) đã được nhắc đến.

Lý thuyết này mô tả rằng: Trong giao tiếp, con người có xu hướng tái sử dụng cấu trúc câu từ người đối thoại.

Ví dụ:
AChuyện ấy đã xử lý xong chưa?
BChuyện ấy đã xong rồi!

AĐi xem phim Đất Rừng Phương Nam không?
BChưa xem. Nhưng mà có lẽ không xem! 

Việc não có xu hướng tái sử dụng cấu trúc trong một cuộc đối thoại được giải thích là giúp nó không cần phải tốn nhiều thời gian suy nghĩ, và mô tả này cũng giống như các lý thuyết được công bố trước đó: cú pháp ngôn ngữ được định hình từ bên trong não bộ của con người.

Mô tả rõ hơn về tiến trình định hình lời nói, Levelt (1989) cho rằng:

(1) Não hình thành thông điệp phi ngôn ngữ;

(2) Thông điệp được sắp xếp với các cấu trúc ngữ pháp phù hợp;

(3) Quá trình chuyển đổi từ suy nghĩ thành cấu trúc âm thanh;

(4) Các cơ khớp được điều khiển để phát hành lời nói.

Các nghiên cứu trước đó của Chomsky (1965) cũng cho rằng quá trình kết xuất ngôn ngữ được hình thành qua từng lớp riêng biệt: lớp thông điệp, lớp hình thành từ ngữ và lớp ngữ pháp.

Ví dụ như câu: Tôi bị kèn xe tải làm giật mình.
Câu này được định hình từ cấu trúc: Tôi bị _______ làm _____.

Từ ngôn ngữ học đến các mô hình ngôn ngữ chuyển đổi

Các mô hình ngôn ngữ máy học ứng dụng như Transformer được hoạt động trên nguyên lý: sử dụng câu đầu vào để dự đoán câu đầu ra, đồng thời, các mô hình được huấn luyện với dữ liệu chứa hàng tỷ câu.

Chính vị vậy, nhiều người bị đánh lừa rằng họ đang đối thoại một thứ gì đó thông minh rất giống con người.

Nguyễn Văn Hiến

Tôi là Nguyễn Văn Hiến, Founder của Tummosoft. Tôi có hơn 20 năm lập trình, vào thời điểm máy vi tính còn là tài sản quý giá của người giàu. Nhưng sức đam mê công nghệ của tôi đã giúp tôi vượt qua những khó khăn và theo đuổi nghề lập trình. Đối với tôi, sáng tạo các sản phẩm công nghệ bằng ngôn ngữ cũng giống như người nghệ sĩ sáng tác những họa phẩm.

Bài viết liên quan