Big Data đã ảnh hưởng đến xã hội và kinh tế như thế nào?
Chúng ta là những người may mắn chứng kiến sự dịch chuyển của xã hội vào thời đại mới, thời đại của Big Data. Giai đoạn mà mọi thứ sẽ chuyển đổi rất khác so với trước đó, từ ngành tài chính, kinh doanh thương mại, đến lĩnh vực y tế, thậm chí nó còn làm dịch chuyển cả lĩnh vực chính trị.
Một số người cho rằng Big Data là một trào lưu nhất thời, giống như Metaverse, Bitcoin hay Blockchain. Thế nhưng, các số liệu từ các Chính phủ và doanh nghiệp lớn trong gần đây có thể chứng minh Big Data đã tạo ra sức ảnh hưởng lớn hơn mọi người tưởng tượng. Và trong vài năm tới, nhiều doanh nghiệp sẽ sử dụng Big Data để cải thiện hiệu quả kinh doanh, giảm thiểu rủi ro, tăng năng suất công việc.
Big Data là gì?
Nếu cách đây chừng 6 năm, nhiều người nghĩ rằng Big Data chỉ phù hợp với các doanh nghiệp lớn như Google hay Facebook. Bởi vì để tiếp cận Big Data chúng ta sẽ gặp nhiều rào cản: thiết bị lưu trữ khá hạn chế, máy tính dùng để phân tích dữ liệu quá đắt đỏ và các rào cản kỹ thuật khác như database...
Từ sự phát triển nhanh chóng của hạ tầng mạng internet, các thiết di động thông minh gần như được phổ cập. Và nó đã dẫn đến việc người dùng tạo ra một lượng dữ liệu khổng lồ. Một thống kê vào năm 2020, cứ mỗi giây sẽ có 1,7 megabyte được tạo mới từ các nguồn như email, mạng xã hội, và hàng ngàn bức ảnh kỷ thuật số, video... Và dữ liệu không chỉ được tạo ra từ máy tính, điện thoại thông minh mà các thiết bị khác như smart tivi, đồng hồ thông minh...
Tất cả những dữ liệu được con người tạo ra sẽ là vô giá trị nếu nó chỉ là bytes được sao lưu trên các thiết bị phần cứng. Và để số liệu này tạo ra các nguồn tin có giá trị hàng tỷ đồng, hoặc giúp doanh tiết kiệm rất nhiều ngân sách thì cần đến công tác thu thập và phân tích dữ liệu.
Dữ liệu phân tán, thuật toán thông minh là khởi đầu cho cuộc cách mạng Big Data
Trước đây, dữ liệu được lưu trữ trong các database như mySQL, MS SQL... và chúng có khá nhiều hạn chế. Nếu dữ liệu càng lớn thì quá trình phân tích càng chậm và ngày đòi hỏi đến các siêu máy tính, siêu phần cứng. Nhưng hiện nay vấn đề này đã được khắc phục bằng kỹ thuật lưu trữ phân tán, nghĩa là dữ liệu được sếp đặt ở nhiều máy tính khác nhau và chúng được kết nối đến database trung tâm thông qua mạng internet. Và mỗi máy sẽ được giao nhiệm vụ nhỏ, đảm nhận một phần việc trong toàn tác vụ phân tích.
Điển hình như Google Search, nhờ việc ứng dụng kỹ thuật lưu trữ phân tán, khi một người tìm kiếm một từ khóa sẽ có khoản 1.000 máy tính tham gia phân tích và thời gian để hoàn tất việc xử lý này nhỏ hơn 0,2 giây.
Các công cụ chuyên về dữ liệu phân tán như Hadoop đã giúp cho việc quản lý và phân tích dữ liệu trở nên đơn giản và hiệu quả hơn. Các thuật toán ngày nay còn có thể tìm kiếm từ hình ảnh, nó giúp nhận dạng nhanh chóng mọi thông tin của người khác chỉ cần một tấm ảnh. Hoặc thuật toán nhận dạng giọng nói thông minh đến mức hiểu được chúng ta đang nói gì, phân tích ngữ cảnh, ngữ pháp và nhiều thứ nữa. Và còn có các thuật toán dự đoán thời tiết, dự đoán thị trường chứng khoán...
Các kỹ thuật lưu trữ Big Data, công nghệ phần mềm, phần cứng phân tích được triển khai rộng rãi theo mô hình cho thuê (SAAA). Điều này giúp cho nhiều doanh nghiệp nhỏ có ngân sách kém vẫn có thể tham gia vào cuộc chơi Big Data.