Tìm hiểu về mạng lưới thần kinh nhân tạo (ANN) đầu tiên - Mô hình McCulloch Pitt

Vào những năm 1940, Warren McCulloch là một trong những nhà khoa của nước Mỹ tiên phong tham gia nghiên cứu đổi mới khoa học với nhiều vai trò như bác sĩ tâm lý, sinh lý học thần kinh, triết gia và kỹ sư máy tính. Ngoài sự hiểu biết đa lĩnh vực, Warren McCulloch là một nhà khoa học "lạ", từ phong cách thời trang với chòm râu dài và đẹp, ngoài ông ra còn có những bài viết gây tranh cãi trên các tạp chí khoa học.
Tìm hiểu về mạng lưới thần kinh nhân tạo (ANN) đầu tiên - Mô hình McCulloch Pitt
Tìm hiểu về mạng lưới thần kinh nhân tạo (ANN) đầu tiên - Mô hình McCulloch Pitt
Nguyễn Văn Hiến
16:05 ngày 15/11/2023
0
0

Nhiều người lầm tưởng Perceptron là mạng thần kinh nhân tạo đầu tiên. Tuy nhiên, sự thật là Perceptron chỉ đóng vai trò là một mắt xích cơ bản nhất của mạng thần kinh nhân tạo hiện đại. Perceptron không phải là Mạng lưới Thần kinh Nhân tạo đầu tiên.

Warren McCulloch và Warren Pitts là ai?

Vào những năm 1940, Warren McCulloch là một trong những nhà khoa của nước Mỹ tiên phong tham gia nghiên cứu đổi mới khoa học với nhiều vai trò như bác sĩ tâm lý, sinh lý học thần kinh, triết gia và kỹ sư máy tính. Ngoài sự hiểu biết đa lĩnh vực, Warren McCulloch là một nhà khoa học "lạ", từ phong cách thời trang với chòm râu dài và đẹp, ngoài ông ra còn có những bài viết gây tranh cãi trên các tạp chí khoa học.

Nhờ tài năng văn chương, các bài viết của Warren McCulloch trên các tạp chí có các tiêu đề rất cuốn hút, như là: "Tạo sao trí tuệ hiện hữu trong đầu?", "Con số là gì? Vì sao con người biết nó như là một con số?" hoặc cuốn "Hiện thân của toán học" vẫn hấp dẫn người đọc thời hiện đại dù quyển sách được xuất bản đã gần nửa thế kỷ.

Đồng sáng tạo mạng lưới thần kinh nhân tạo đầu tiên với Warren McCulloch là nhà khoa học thiên tài lập dị Warren Pitts.

Năm 12 tuổi, Warren Pitts đọc được quyển Principia Mathematica (Russell, Whitehead) và thần tượng Bertrand Russell. Ông hâm mộ cuồng nhiệt giáo sư Bertrand Russell đến mức phải bỏ nhà đi rong ruỗi từ năm 15 tuổi. Ông đến Đại học Chicago và sồng quanh quẩn ớ đó, đi làm thuê để có cơ hội nghe các bài giảng của giáo sư Bertrand Russell. Nhưng thật không may, chỉ một thời gian ngắn, giáo sư Bertrand Russell phải trở về nước Anh sinh sống.

Năm 1942, Warren McCulloch gặp Warren Pitts tại Chicago và mời Pitts đến nhà ông sinh sống để cùng hợp tác nghiên cứu học thuật. Năm đó Pitts mới 18 tuổi và chưa có bằng cấp học thuật nào.

Vào thời điểm những năm 1943, giai đoạn mà chưa có nhiều công trình nghiên cứu về tế bào thần kinh. Chỉ có các công bố sơ khởi của Renshaw, Forbes và Morriso về thần kinh ngoại biên nhưng chưa được ứng dụng cụ thể. Là người khởi sự đầu tiên, McCulloch và Pitts nghiên cứu các tế bào thần kinh dựa trên các kiến thức về logic học.

Họ mô tả, mỗi nơ-ron khi tiếp nhận sự vật, hiện tượng nó có cách thức hoạt động giống như một mệnh đề logic. Một tế bào thần kinh bên ngoài có thể kết nối đến hàng triệu tế bào thần kinh khác. Sau khi tiếp nhận đầu vào nó sẽ truyền thông tin đến các tế bào khác khi có một tín hiệu điện thế kích hoạt. Tín hiệu điện thể này chỉ có thể hoạt động khi nó có đủ năng lượng để vượt qua một ngưỡng điện áp nhất định. Việc quyết định xem một tế bào có đủ năng lượng vượt ngưỡng hay không là các tế bào ở cổng (gate) quyết định.

Nói theo hướng toán học, tế bào thần kinh sẽ tiếp nhận đầu vào qua cổng logic (ví dụ AND, NOT hoặc OR) và nó sẽ tự lựa chọn và quyết định áp dụng một loại thuật toán nào đó mà xác định là phù hợp.

Cụ thể tiến trình hoạt động của mạng lưới thần kinh McCulloch Pitts như sau:

(1) Nơ-ron thần kinh nhị phân quyết định có kích thích điện thế hay không.

(2) Điều kiện để kích hoạt nơ-ron thần kinh là tổng trọng số đầu vào phải bằng hoặc lớn hơn ngưỡng (Threshold / θ) được xác định trước.

(3) Nếu nhiều đầu vào và bị ức chế thì nơ-ron không kích hoạt.

(4) Phải mất một bước cố định thì tín hiệu mới được truyền đi;

(5) Cả cấu trúc và trọng lượng đều không thay đổi theo thời gian;

Lý thuyết của McCulloch Pitts có ảnh hưởng sâu rộng trong nhiều lĩnh vực sau này nhưng quan trọng nhất có lẽ là khoa học máy tính. Tuy nhiên, tính ứng dụng của nó vẫn phải gặp nhiều thách thức trong giai đoạn đầu.

- Lý thuyết chỉ xử lý tín hiệu logic, còn các tín hiệu khác (như số thực) thì sao?

- Có thể thiết lập ngưỡng theo cách thủ công?

- Có phải tất cả đầu vào đều quan trọng như nhau không?

- Chúng ta có thể chỉ định các trọng số khác nhau không?

- Cách xử lý các hàm phi tuyến tính như thế nào?

Một thời gian sau đó, nhà tâm lý học người Mỹ Frank Rosenblatt đã phát triển lý thuyết của McCulloch thành mô hình mạng lưới thần kinh Perceptron. Và đây được xem là giai đoạn hoàn thiện mô hình hệ thống thần kinh nhân tạo đơn giản.

Một ví dụ về hệ thống nơ-ron nhân tạo

Bây giờ chúng ta thử xem xét một ví dụ thực tế: Một ngân hàng muốn sử dụng AI để quyết định xem có nên cho khách hàng vay hay không. Điều kiện quyết định cho vay là: Có thu nhập từ lương và Điểm tín dụng tốt.

Như vậy, có thể có 4 kịch bản để đánh giá:

(1) Mức lương cao và điểm tín dụng tốt;

(2) Lương cao và điểm tín dụng kém;

(3) Mức lương thấp và điểm tín dụng tốt;

(4) Lương thấp và điểm tín dụng kém

Ta gọi: 

Mức lương cao: X1 = 1;

Mức lương thấp: X1 = 0;

Điểm tín dụng tốt: X2 = 1;

Điểm tín dụng xấu: X2 = 0

Và ngưỡng của bài toán này là 2. 

Tổng kết lại ta có bảng quyết định sau:

Tác giả

Nguyễn Văn Hiến

Tôi là Nguyễn Văn Hiến, Founder của Tummosoft. Tôi có hơn 20 năm lập trình, vào thời điểm máy vi tính còn là tài sản quý giá của người giàu. Nhưng sức đam mê công nghệ của tôi đã giúp tôi vượt qua những khó khăn và theo đuổi nghề lập trình. Đối với tôi, sáng tạo các sản phẩm công nghệ bằng ngôn ngữ cũng giống như người nghệ sĩ sáng tác những họa phẩm.

Tổng quan về xử lý ngôn ngữ tự nhiên

Chatbot ngày nay đã vượt qua vai trò là công cụ tiêu khiển, nó thông minh hơn, hiểu biết nhiều vấn đề hơn, biết lập trình và biết xử lý cả tình huống…. Và để có được thành tựu như hôm nay, chatbot đã khởi đầu bằng công nghệ kiểu như robot ELIZA.

Hệ thống lý luận Bayesian

Từ những năm 1960, việc sử dụng kho ngữ liệu lớn để xử lý ngôn ngữ tự nhiên bắt đầu được định hình. Bộ sưu tập Ameriacan English đã tổng hợp được hơn một triệu văn bản từ các tạp chí, báo, tiểu thuyết...

Mô hình xác xuất The Noisy Channel, giải pháp xử lý tín hiệu bị nhiễu sau truyền dẫn

Giai đoạn thứ 3 (1970-1983) chứng kiến sự phát triển mạnh mẽ của ngành xử lý ngôn ngữ tự nhiên và nhận dạng tiếng nói và đồng thời các thuật toán và mô hình đã được phát triển đó vẫn được duy trì phát triển.

Mô hình ẩn Hidden Markov Model (HMM), bước tiến lớn trong lĩnh vực trí tuệ nhân tạo

Mô hình ẩn Hidden Markov Model (HMM) được phát triển trên lý thuyết xác xuất thông kê, giả định rằng: Có 2 nguồn thông tin: (1) Một nguồn thì có thể thu thập được; và nguồn thứ (2) thì không thu thập được (bị ẩn). Và chúng ta có thể giải mã nguồn thông tin thứ 2 qua xác xuất và suy luận.

Xác suất có điều kiện (conditional probability) và ví dụ bằng Java

Xác suất có điều kiện là bài toán dùng để tính một sự kiện B có (hoặc không) khả năng xảy ra khi biết rằng sự kiện A đã xảy ra. Công thức dùng để tính xác xuất có điều kiện là P(B|A).

Automata không có gì khó hiểu!

Khi nhắc đến Lý thuyết tính toán (Theory of Computation) nghĩa là chúng ta đang bàn đến một nhánh của Khoa học máy tính (Coputer Science), lĩnh vực có thể giải quyết các vấn đề tính toán bằng cách sử dụng thuật toán (algorithm) và các mô hình tính toán (model of computation).