“Hạt của chúa” được vén màn bí ẩn nhờ Big Data
Những bí ẩn của cổ máy nằm sâu dưới lòng đất
Trung tâm Nghiên cứu Hạt nhân Châu Âu (CERN – European Organization for Nuclear Research), ngoài cái nôi đã nuôi dưỡng và phát triển giao thức Internet vào những năm 1990, nó còn nổi tiếng với các máy gia tốc hạt nhân cỡ lớn. Điển hình như máy LHC có độ dài lên đến 27 km nằm bên dưới lòng đất, ở rìa biên giới giữa 2 nước Thụy Sĩ và Pháp, được xây dựng với mục đích nghiên cứu về hạt cơ bản (hạt Higgs), và mô phỏng các điều kiện vũ trụ sau vụ nổ Big Bang.
Tất cả các dự án của CERN, điển hình như cổ máy LHC, sẽ không đủ sức hoàn thành nhiệm vụ giúp các nhà vật lý hiểu biết sâu sắc hơn về vũ trụ và các thành phần cơ bản của nó, nếu không có Big Data, các siêu máy tính, các thuật toán mô phỏng lý thuyết vật lỳ và các giải pháp lưu trữ phân tán. Bởi vì chỉ riêng cổ máy LHC, mỗi năm đã tạo ra khoản 30 petabytes thông tin, tương đương 15 tỷ trang văn bản A4. Và số lượng giấy này phải cần đến 600 triệu cái tủ để chứa đựng. Với số lượng dữ liệu khổng lồ và được tạo ra một cách nhanh chóng như thế, rõ ràng đây là tiêu chuẩn để ứng dụng Big Data.
“Hạt của Chúa” hé chỉ có thể hé lộ nếu không có Big Data
Các máy gia tốc như LHC hoạt động để tạo ra môi trường vũ trụ, mô phỏng các vụ va chạm giữa các thành phần nguyên tử (tạo ra phản ứng phân rả) để thu được hạ nguyên tử, hay còn gọi là hạt của Chúa.
Hàng trăm triệu cuộc mô phỏng vụ va chạm được các nhà khoa học tại CERN tạo ra, với hy vọng các cảm biến có thể chụp được khoảnh khắc hạt của Chúa xuất hiện. Vào thời điểm mà hạt của Chúa được tạo ra (theo lý thuyết), các cảm biến phải quan sát, theo dõi và chụp được khoảnh khắc các hạt cơ bản lóe lên. Các “mảnh vụn” vũ trụ này chỉ chớp nhoáng với tốc độ ánh sáng, một số hạt khác có tốc độ nhanh bằng một phần nhỏ tốc độ ánh sáng. Vì vậy, phải nói là cơ hội để các cảm biến chụp được hình ảnh các hạt hạ nguyên tử là rất khó khăn.
Để tăng cơ hội khám phá các hạt hạ vũ trụ, CERN được trang bị các cảm biến có khả năng ghi lại hàng trăm triệu vụ va chạm giữa các hạt trong 1 giây. Về cơ bản, các cảm biến có cấu tạo giống như thiết bị nhận ánh sáng, chẳng hạn giống máy ảnh. Tuy nhiên độ phân giải của nó lên đến 100 megapixel và tốc độ chụp thì cực cao.
Các máy LHC đã được các nhà khoa học dùng để nghiên cứu trong 4 thí nghiệm chính, mỗi giây các cảm biến thu được một lượng dữ liệu khổng lồ và gửi nó về các trung tâm database trên toàn cầu của CERN. Với một lượng dữ liệu khổng lồ được lưu trữ một cách nhanh chóng, nếu sử dụng các kỷ thuật database cổ điển thì mãi sẽ không có một tổ chức nào trên hành tinh này có thể xử lý được. Và để giải quyết vấn đề này, CERN đã chuyển qua sử dụng dữ liệu phân tán. Trung tâm dữ liệu để phục vụ cho cổ máy LHC là mạng lưới database mô hình phân tán lớn nhất thế giới. Data Center kết nối trực tuyến với hơn 170 trung tâm khác nằm tại 35 quốc gia.
Để phát triển một hệ thống database phân tán có khả năng lưu trữ đến 30 petabyte mỗi năm, CERN đã lập dự án openlab với sự hợp tác của các chuyên gia dữ liệu đến từ các tập đoàn lớn như Oracle, Intel và Siemens. Tổng số lượng CPU được trang bị trong hệ thống mạng lưới openlab là hơn 200.000 core, và tổng dung lượng ổ cứng dùng để lưu trữ có kích thước lên đến 15 petabytes.
Sau khi có dữ liệu, các phần mềm được lập trình với các thuật toán mô phỏng lý thuyết vật lý sẽ tiến hành phân tích dữ liệu tìm mục tiêu. Sau khi dữ liệu được chắt lọc, sẽ là bước phân tích cuối cùng của hơn 8.000 nhà khoa học vật lý trên toàn cầu.
Big Data đã giúp các lý thuyết vật lý về hạt cơ bản được xác thực
Năm 2013, các nhà nghiên cứu tại CERN tuyên bố là đã quan sát ghi lại được sự tồn tại của hạt Higgs. Có thể nói, đây là một bước tiến vượt bậc của khoa học vật lý, khi mà các lý thuyết về hạt cơ bản được phát triển trong nhiều năm nhưng không thể chứng minh được vì những rào cản kỹ thuật. Và chỉ đến khi Big Data xuất hiện, hình ảnh về các hạt hạ nguyên tử mới được hé lộ.
Các khám phá của CERN đã mang lại cho các nhà khoa học sự hiểu biết sâu sắc về vũ trụ, cấu trúc cơ bản của vũ trụ, mối quan hệ phức tạp giữa các hạt. Và có lẽ chúng ta đã không có sự hiểu biết hơn về vũ trụ nếu như không có sự xuất hiện của Big Data và mô hình database phân tán. Và cũng chính Big Data đã hỗ trợ CERN rất tốt trong quá trình nghiên cứu. Năm 2013, CERN tuyên bố là đã phát hiện ra hạt cơ bản Higgs. Nhiều nhà khoa học trên thế giới cũng đồng ý với phát hiện của CERN.