Mô hình ẩn Hidden Markov Model (HMM), bước tiến lớn trong lĩnh vực trí tuệ nhân tạo – Lịch sử ngành xử lý ngôn ngữ tự nhiên [1970-1983]
Mô hình ẩn Hidden Markov Model (HMM)
Mô hình ẩn Hidden Markov Model (HMM) được phát triển trên lý thuyết xác xuất thông kê, giả định rằng: Có 2 nguồn thông tin: (1) Một nguồn thì có thể thu thập được; và nguồn thứ (2) thì không thu thập được (bị ẩn). Và chúng ta có thể giải mã nguồn thông tin thứ 2 qua xác xuất và suy luận.
– Trạng thái ẩn: Các trạng thái ẩn là những trạng thái không thể quan sát trực tiếp được.
– Dữ liệu quan sát: Dữ liệu quan sát là những dữ liệu có thể quan sát được.
Chìa khóa để giải mã nguồn thông tin thứ 2 (bị ẩn) này được dựa vào quá trình chuyển đổi trạng thái. Quá trình chuyển đội trạng thái này diễn ra theo một quy luật xác suất nhất định.
Quy luật chuyển trạng thái được gọi là ma trận chuyển tiếp có kích thước [n*k], trong đó [n] là số lượng trạng thái ẩn và [k] là số lượng loại dữ liệu quan sát. Giá trị của mỗi ô trong ma trận chuyển tiếp là xác suất chuyển từ trạng thái i sang trạng thái j.
– Xác suất chuyển trạng thái: Mô hình mô tả xác suất chuyển từ một trạng thái ẩn sang trạng thái ẩn khác tại mỗi bước thời gian.
– Xác suất quan sát: Mô hình mô tả xác suất quan sát được tạo ra từ trạng thái ẩn tại mỗi bước thời gian.
– Trạng thái ban đầu: Mô hình cũng cần xác định xác suất của trạng thái ẩn ban đầu.
Các thuật toán dùng để đào tào cho mô hình Hidden Markov Model (HMM)
– Đào tạo trực tiếp: Thuật toán này sử dụng các phương pháp tối ưu hóa để tối đa hóa khả năng mô hình.
– Đào tạo dựa trên dự đoán: Thuật toán này sử dụng các phương pháp dự đoán để học mô hình.
– Đào tạo dựa trên khai thác: Thuật toán này sử dụng các phương pháp khai thác dữ liệu để học mô hình.
Việc lựa chọn thuật toán để đạo tạo cho mô hình HMM tùy vào các yếu tố như kích thước của dữ liệu, độ phức tạp của mô hình, và mục tiêu ứng dụng của dự án.
Tính ứng dụng của mô hình ẩn Hidden Markov Model (HMM)
Mô hình ẩn Hidden Markov Model (HMM) được ứng dụng rộng rãi trong lĩnh vực trí tuệ nhân tạo, xử lý các bài toán cụ thể như sau:
– Ứng dụng trong lĩnh vực xử lý ngôn ngữ tự nhiên: Mô hình HMM được sử dụng để nhận dạng từ, nhận dạng chữ viết tay, phân loại văn bản, dịch tự động.
– Ứng dụng trong lĩnh vực nhận dạng giọng nói: Mô hình HMM được sử dụng để nhận dạng giọng nói, nhận dạng từng phần tiếng nói và qua đó xác định từ, câu.
– Ứng dụng trong lĩnh vực phân tích tín hiệu: Mô hình HMM được sử dụng để phân tích các tín hiệu sinh học, chẳng hạn như sóng điện não.
– Ứng dụng trong lĩnh vực dự báo, chẩn đoán như dự báo tài chính, dự báo chứng khoán, dự đoán thị trường tài chính.
Ví dụ về mô hình Hidden Markov Model (HMM) bằng Java
Sử dụng mô hình Hidden Markov Model (HMM) để phân loại: đâu là câu hỏi, đâu là câu khẳn định?
import java.util.ArrayList;
import java.util.List;
public class HMM {
private int numberOfStates;
private double[][] transitionMatrix;
private double[][] emissionMatrix;
private List<String> vocabulary;
public HMM(int numberOfStates, double[][] transitionMatrix, double[][] emissionMatrix, List<String> vocabulary) {
this.numberOfStates = numberOfStates;
this.transitionMatrix = transitionMatrix;
this.emissionMatrix = emissionMatrix;
this.vocabulary = vocabulary;
}
public String classify(String sentence) {
// Tạo một danh sách các trạng thái ẩn
List<Integer> states = new ArrayList<>();
states.add(0);
// Lặp qua từng từ trong câu
for (String word : sentence.split(" ")) {
// Xác định trạng thái ẩn tiếp theo
int nextState = 0;
for (int i = 0; i < numberOfStates; i++) {
double probability = 0;
for (int j = 0; j < numberOfStates; j++) {
probability += transitionMatrix[j][i] * emissionMatrix[i][vocabulary.indexOf(word)];
}
if (probability > nextState) {
nextState = i;
}
}
// Thêm trạng thái ẩn tiếp theo vào danh sách
states.add(nextState);
}
// Xác định trạng thái ẩn cuối cùng
int lastState = states.get(states.size() - 1);
// Trả về kết quả phân loại
if (lastState == 0) {
return "Câu hỏi";
} else {
return "Câu khẳng định";
}
}
public static void main(String[] args) {
// Định nghĩa các trạng thái ẩn
int numberOfStates = 2;
// Định nghĩa ma trận chuyển tiếp
double[][] transitionMatrix = new double[][]{
{0.9, 0.1},
{0.1, 0.9}
};
// Định nghĩa ma trận phát sinh
double[][] emissionMatrix = new double[][]{
{0.5, 0.5},
{0.5, 0.5}
};
// Định nghĩa từ vựng
List<String> vocabulary = new ArrayList<>();
vocabulary.add("hello");
vocabulary.add("world");
// Tạo mô hình HMM
HMM system = new HMM(numberOfStates, transitionMatrix, emissionMatrix, vocabulary);
// Phân loại câu "hello world"
String sentence = "hello world";
String classification = system.classify(sentence);
System.out.println("Câu '" + sentence + "' được phân loại là: " + classification);
}
}
Ví dụ này định nghĩa hai trạng thái ẩn: 0
cho câu hỏi và 1
cho câu khẳng định. Ma trận chuyển tiếp mô tả xác suất chuyển từ trạng thái này sang trạng thái kia. Ma trận phát sinh mô tả xác suất tạo ra một từ từ một trạng thái. Từ vựng bao gồm hai từ: “hello” và “world”.
Ví dụ này cũng định nghĩa một câu “hello world”. Mô hình HMM sẽ phân loại câu này là câu khẳng định, vì trạng thái ẩn cuối cùng là 1
.
Dưới đây là kết quả của chương trình:
Câu 'hello world' được phân loại là: Câu khẳng định
Để cải thiện độ chính xác của mô hình HMM, chúng ta có thể sử dụng một lượng dữ liệu lớn hơn để đào tạo mô hình. Chúng ta cũng có thể sử dụng các thuật toán học tốt hơn để học mô hình.
Ví dụ thứ 2 dùng phân loại câu, sử dụng mô hình HMM
import opennlp.tools.postag.POSModel;
import opennlp.tools.postag.POSTaggerME;
import opennlp.tools.util.ObjectStream;
import opennlp.tools.util.PlainTextByLineStream;
import opennlp.tools.util.model.ModelUtil;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
public class QuestionClassifier {
public static void main(String[] args) {
try {
// Load the pre-trained part-of-speech tagging model
InputStream modelIn = new FileInputStream("path/to/en-pos-maxent.bin");
POSModel model = new POSModel(modelIn);
POSTaggerME tagger = new POSTaggerME(model);
// Define example sentences
String[] sentences = {
"Is this a question?",
"This is a statement.",
"Are you sure?",
"I am learning about HMM."
};
// Classify each sentence as a question or statement
for (String sentence : sentences) {
String[] tokens = sentence.split(" ");
String[] tags = tagger.tag(tokens);
// Check if the sentence contains question words (who, what, when, why, how, is, are, etc.)
boolean isQuestion = containsQuestionWord(tags);
System.out.println("Sentence: " + sentence);
System.out.println("Is a question? " + isQuestion);
System.out.println();
}
} catch (IOException e) {
e.printStackTrace();
}
}
private static boolean containsQuestionWord(String[] tags) {
// Check if the sentence contains a question word
for (String tag : tags) {
if (tag.equals("WRB") || tag.equals("WP") || tag.equals("WDT") || tag.equals("MD") || tag.equals("VBZ")) {
return true;
}
}
return false;
}
}
Trong ví dụ này, chúng ta sử dụng mô hình POS (part-of-speech) tagging của Apache OpenNLP để gắn nhãn từ loại cho từng từ trong câu. Sau đó, chúng ta kiểm tra xem câu có chứa các từ khóa thường xuất hiện trong câu hỏi (như “what,” “when,” “why,” “how,” “is,” “are,” và nhiều từ khác) không. Nếu có ít nhất một từ loại này trong câu, chúng ta coi câu đó là một câu hỏi; nếu không, chúng ta coi đó là câu khẳn định.
Lưu ý rằng đây chỉ là một ví dụ đơn giản và cách phân loại dựa trên từ loại có thể không chính xác 100%. Trong thực tế, việc phát triển một mô hình HMM hoặc mô hình phân loại tốt hơn đòi hỏi nhiều công việc và đào tạo dữ liệu chính xác hơn.