Tìm hiểu về mạng lưới thần kinh nhân tạo (ANN) đầu tiên – Mô hình McCulloch Pitt

Tìm hiểu về mạng lưới thần kinh nhân tạo (ANN) đầu tiên – Mô hình McCulloch Pitt

4 Tháng chín 2024 - 2:59 sáng
Vào những năm 1940, Warren McCulloch là một trong những nhà khoa của nước Mỹ tiên phong tham gia nghiên cứu đổi mới khoa học với nhiều vai trò như bác sĩ tâm lý, sinh lý học thần kinh, triết gia và kỹ sư máy tính. Ngoài sự hiểu biết đa lĩnh vực, Warren McCulloch là một nhà khoa học "lạ", từ phong cách thời trang với chòm râu dài và đẹp, ngoài ông ra còn có những bài viết gây tranh cãi trên các tạp chí khoa học.

Nhiều người lầm tưởng Perceptron là mạng thần kinh nhân tạo đầu tiên. Tuy nhiên, sự thật là Perceptron chỉ đóng vai trò là một mắt xích cơ bản nhất của mạng thần kinh nhân tạo hiện đại. Perceptron không phải là Mạng lưới Thần kinh Nhân tạo đầu tiên.

Warren McCulloch và Warren Pitts là ai?

Vào những năm 1940, Warren McCulloch là một trong những nhà khoa của nước Mỹ tiên phong tham gia nghiên cứu đổi mới khoa học với nhiều vai trò như bác sĩ tâm lý, sinh lý học thần kinh, triết gia và kỹ sư máy tính. Ngoài sự hiểu biết đa lĩnh vực, Warren McCulloch là một nhà khoa học "lạ", từ phong cách thời trang với chòm râu dài và đẹp, ngoài ông ra còn có những bài viết gây tranh cãi trên các tạp chí khoa học.

Nhờ tài năng văn chương, các bài viết của Warren McCulloch trên các tạp chí có các tiêu đề rất cuốn hút, như là: "Tạo sao trí tuệ hiện hữu trong đầu?", "Con số là gì? Vì sao con người biết nó như là một con số?" hoặc cuốn "Hiện thân của toán học" vẫn hấp dẫn người đọc thời hiện đại dù quyển sách được xuất bản đã gần nửa thế kỷ.

Đồng sáng tạo mạng lưới thần kinh nhân tạo đầu tiên với Warren McCulloch là nhà khoa học thiên tài lập dị Warren Pitts.

Năm 12 tuổi, Warren Pitts đọc được quyển Principia Mathematica (Russell, Whitehead) và thần tượng Bertrand Russell. Ông hâm mộ cuồng nhiệt giáo sư Bertrand Russell đến mức phải bỏ nhà đi rong ruỗi từ năm 15 tuổi. Ông đến Đại học Chicago và sồng quanh quẩn ớ đó, đi làm thuê để có cơ hội nghe các bài giảng của giáo sư Bertrand Russell. Nhưng thật không may, chỉ một thời gian ngắn, giáo sư Bertrand Russell phải trở về nước Anh sinh sống.

Năm 1942, Warren McCulloch gặp Warren Pitts tại Chicago và mời Pitts đến nhà ông sinh sống để cùng hợp tác nghiên cứu học thuật. Năm đó Pitts mới 18 tuổi và chưa có bằng cấp học thuật nào.

Vào thời điểm những năm 1943, giai đoạn mà chưa có nhiều công trình nghiên cứu về tế bào thần kinh. Chỉ có các công bố sơ khởi của Renshaw, Forbes và Morriso về thần kinh ngoại biên nhưng chưa được ứng dụng cụ thể. Là người khởi sự đầu tiên, McCulloch và Pitts nghiên cứu các tế bào thần kinh dựa trên các kiến thức về logic học.

Họ mô tả, mỗi nơ-ron khi tiếp nhận sự vật, hiện tượng nó có cách thức hoạt động giống như một mệnh đề logic. Một tế bào thần kinh bên ngoài có thể kết nối đến hàng triệu tế bào thần kinh khác. Sau khi tiếp nhận đầu vào nó sẽ truyền thông tin đến các tế bào khác khi có một tín hiệu điện thế kích hoạt. Tín hiệu điện thể này chỉ có thể hoạt động khi nó có đủ năng lượng để vượt qua một ngưỡng điện áp nhất định. Việc quyết định xem một tế bào có đủ năng lượng vượt ngưỡng hay không là các tế bào ở cổng (gate) quyết định.

Nói theo hướng toán học, tế bào thần kinh sẽ tiếp nhận đầu vào qua cổng logic (ví dụ AND, NOT hoặc OR) và nó sẽ tự lựa chọn và quyết định áp dụng một loại thuật toán nào đó mà xác định là phù hợp.

Cụ thể tiến trình hoạt động của mạng lưới thần kinh McCulloch Pitts như sau:

(1) Nơ-ron thần kinh nhị phân quyết định có kích thích điện thế hay không.

(2) Điều kiện để kích hoạt nơ-ron thần kinh là tổng trọng số đầu vào phải bằng hoặc lớn hơn ngưỡng (Threshold / θ) được xác định trước.

(3) Nếu nhiều đầu vào và bị ức chế thì nơ-ron không kích hoạt.

(4) Phải mất một bước cố định thì tín hiệu mới được truyền đi;

(5) Cả cấu trúc và trọng lượng đều không thay đổi theo thời gian;

Lý thuyết của McCulloch Pitts có ảnh hưởng sâu rộng trong nhiều lĩnh vực sau này nhưng quan trọng nhất có lẽ là khoa học máy tính. Tuy nhiên, tính ứng dụng của nó vẫn phải gặp nhiều thách thức trong giai đoạn đầu.

- Lý thuyết chỉ xử lý tín hiệu logic, còn các tín hiệu khác (như số thực) thì sao?

- Có thể thiết lập ngưỡng theo cách thủ công?

- Có phải tất cả đầu vào đều quan trọng như nhau không?

- Chúng ta có thể chỉ định các trọng số khác nhau không?

- Cách xử lý các hàm phi tuyến tính như thế nào?

Một thời gian sau đó, nhà tâm lý học người Mỹ Frank Rosenblatt đã phát triển lý thuyết của McCulloch thành mô hình mạng lưới thần kinh Perceptron. Và đây được xem là giai đoạn hoàn thiện mô hình hệ thống thần kinh nhân tạo đơn giản.

Một ví dụ về hệ thống nơ-ron nhân tạo

Bây giờ chúng ta thử xem xét một ví dụ thực tế: Một ngân hàng muốn sử dụng AI để quyết định xem có nên cho khách hàng vay hay không. Điều kiện quyết định cho vay là: Có thu nhập từ lương và Điểm tín dụng tốt.

Như vậy, có thể có 4 kịch bản để đánh giá:

(1) Mức lương cao và điểm tín dụng tốt;

(2) Lương cao và điểm tín dụng kém;

(3) Mức lương thấp và điểm tín dụng tốt;

(4) Lương thấp và điểm tín dụng kém

Ta gọi:

Mức lương cao: X1 = 1;

Mức lương thấp: X1 = 0;

Điểm tín dụng tốt: X2 = 1;

Điểm tín dụng xấu: X2 = 0

Và ngưỡng của bài toán này là 2. 

Tổng kết lại ta có bảng quyết định sau:

Nguyễn Văn Hiến

Tôi là Nguyễn Văn Hiến, Founder của Tummosoft. Tôi có hơn 20 năm lập trình, vào thời điểm máy vi tính còn là tài sản quý giá của người giàu. Nhưng sức đam mê công nghệ của tôi đã giúp tôi vượt qua những khó khăn và theo đuổi nghề lập trình. Đối với tôi, sáng tạo các sản phẩm công nghệ bằng ngôn ngữ cũng giống như người nghệ sĩ sáng tác những họa phẩm.

Bài viết liên quan