Tại sao Open19 như một tiêu chuẩn của việc thiết kế trung tâm dữ liệu lớn


Những người đứng sau tiêu chuẩn đang hy vọng sẽ giải quyết một số trở ngại lớn nhất đối với việc xây dựng cơ sở hạ tầng cạnh. Hãy tưởng tượng một máy chủ đi xuống trong một cụm máy tính cạnh ở chân tháp di động cách xa kỹ thuật viên máy chủ có sẵn gần nhất của bạn hoặc một kho lưu trữ phần cứng thay thế. Bạn rất may mắn nếu bạn thay thế máy trong vòng 24 giờ và nhận được một công nghệ để làm điều đó sẽ không rẻ.

Bây giờ hãy tưởng tượng có 50 địa điểm như vậy, một trăm trong số đó, hoặc một nghìn, lưu trữ một nền tảng phân tán chạy các ứng dụng quan trọng cho khách hàng. Loại thỏa thuận cấp độ dịch vụ nào bạn nghĩ rằng bạn có thể đảm bảo cho những người dùng đó?

Vấn đề này, mô hình hoạt động, là một trong những câu đố lớn nhất mà các công ty xây dựng nền tảng điện toán cạnh phân tán sớm nhất đang cố gắng giải quyết cho ngày hôm nay. Làm thế nào để bạn giữ rất nhiều trang web từ xa chạy ở mức chi phí khả thi?

Giải câu đố này là một trong những mục tiêu thiết kế lớn đằng sau Open19, tiêu chuẩn phần cứng của trung tâm dữ liệu được sinh ra tại LinkedIn mà hiện tại đã giám sát bởi Quỹ Open19 phi lợi nhuận. Điều gì nếu cài đặt một máy chủ đơn giản như vậy một trình điều khiển phân phối có thể làm điều đó? Điều gì sẽ xảy ra nếu bạn có thể giữ một chồng các máy chủ thay thế gần cụm cạnh của mình và khi một máy chủ trực tiếp trong cụm bị hỏng, một cánh tay robot sẽ lấy nó ra và trượt một cái mới vào vị trí của nó? Điều gì sẽ xảy ra nếu một hệ thống tự giám sát sẽ nhận thấy một máy chủ sắp hỏng, tự động ra lệnh thay thế và tắt nguồn máy chủ cũ đúng lúc?

Trong tương lai, bạn có thể có các trung tâm dữ liệu cạnh ở khắp mọi nơi: tháp di động, nhà máy, cửa hàng bán lẻ, đường đua - bất cứ nơi nào cần sức mạnh tính toán để xử lý và xử lý dữ liệu để đưa ra quyết định tại chỗ, mà không có độ trễ kết nối với trung tâm dữ liệu trung tâm có thể là hàng trăm dặm.

Nhiều hơn giá đỡ và khung gầm
Open19 bắt đầu với một khung đồng nhất và các đầu nối mà nhiều nhà cung cấp có thể thiết kế. Sự tiêu chuẩn hóa đó, cùng với sự cách ly phần cứng bên trong giá đỡ, hệ thống cung cấp tự giám sát và tự phục hồi, là tất cả các câu đố trong việc tạo ra hoàn toàn tự động, hoặc tắt đèn, trung tâm dữ liệu cạnh, Yuval Bachar, kỹ sư chính của LinkedIn cho kiến ​​trúc trung tâm dữ liệu toàn cầu, đồng thời là chủ tịch của Open19 Foundation, cho biết trong một cuộc phỏng vấn với Data Center Knowledge.

Nhiều công ty đã tham gia với Open19 đặc biệt vì tính hữu ích của nó ở rìa. Chúng bao gồm nhà đồng sáng lập nền tảng LinkedIn Vapor IO, công ty xây dựng cơ sở hạ tầng và phần mềm trung tâm dữ liệu cho điện toán cạnh; và Packet, đang bắt đầu mở rộng nền tảng đám mây của mình lên các tháp di động. Tòa tháp không dây khổng lồ của Mỹ Crown Castle, một nhà đầu tư và đối tác của Vapor, đã tham gia vào năm nay.

Bachar sẽ nói nhiều hơn về Open19 và lợi ích của nó đối với việc triển khai trung tâm dữ liệu cạnh tại Data Center World Global vào tháng 3, bao gồm cả hệ thống làm mát bằng chất lỏng trong giá mà công trình. Hệ thống này sẽ dành cho máy tính mật độ cao được sử dụng cho các ứng dụng học máy, một trong những khối lượng công việc dự kiến ​​sẽ sinh sôi nảy nở và các thiết bị chuyển mạch mạng thế hệ tiếp theo, mà ông hy vọng sẽ đạt được mật độ năng lượng tương tự. Đăng ký ở đây

Sẵn sàng để cắm ở bất cứ đâu
Thiết kế đã sẵn sàng cho bất kỳ nguồn cung cấp điện nào có sẵn, điều này rất quan trọng khi bạn có nhiều địa điểm khác nhau. Kệ điện của chúng tôi là phổ quát, ông Bach Bachar nói. Bất kỳ nguồn điện nào bạn cung cấp cho nó - AC, DC, một pha hoặc nhiều pha - mọi thứ đều được đưa vào kệ điện và phân phối cho hệ thống, vì vậy các máy chủ không tin vào môi trường mà chúng hoạt động.

Open19 sử dụng phần cứng tách rời với sự cách ly cung cấp năng lượng đầy đủ giữa các máy chủ. Chúng tôi không có bất kỳ thanh xe buýt nào được chia sẻ trên giá; mỗi máy chủ hoàn toàn được bảo vệ, theo dõi và kích hoạt bởi một kênh riêng. Kênh nguồn bị cô lập và có một cầu chì điện tử cho mỗi một máy chủ để bảo vệ.

Giám sát từ xa quan trọng hơn bao giờ hết

Các cầu chì điện tử riêng lẻ cũng cung cấp dữ liệu tiêu thụ năng lượng thời gian thực, có thể tiết lộ các vấn đề phần cứng mới nổi. Nếu chúng ta thấy một máy chủ có mức tiêu thụ năng lượng dao động, thì đó thường là một dấu hiệu cho thấy có gì đó không ổn, Tiết Bachar giải thích. Có thể có rất nhiều ghi vào bộ nhớ hoặc ổ đĩa không hoạt động. Theo dõi biến động nhiệt cũng như bạn có thể thấy lỗi mạng hoặc sự cố với bộ cân bằng tải, ông nói.

LinkedIn sử dụng thông tin đó để bảo trì phần cứng chủ động, kéo các máy chủ có hoạt động năng lượng bất thường để kiểm tra trước khi sự cố ảnh hưởng đến khối lượng công việc. Mở rộng việc bảo trì dự đoán đó để tạo ra các hệ thống tự phục hồi, đặt hàng một máy chủ mới trước khi có lỗi phần cứng hoặc mất dữ liệu và bạn có được một môi trường hoàn toàn tự động, lý tưởng mà không có nhân viên thường trực. Không có ai ở một tòa tháp di động, ông Bach Bachar lưu ý.

Cắm và chơi
Open19 di chuyển tất cả hệ thống cáp ra phía sau giá đỡ và các đầu nối được thiết kế sao cho một máy chủ mới trượt vào vị trí và kết nối. Điều đó có nghĩa là về mặt lý thuyết, một tài xế giao hàng có thể thay thế một máy chủ mà không vô tình ngắt kết nối một thứ gì đó, làm hỏng kết nối hoặc làm tổn hại luồng không khí bằng cách đặt cáp sai vị trí.

LinkedIn đã viết phần mềm để đưa máy chủ trực tuyến tự động, sau khi họ cắm vào giá đỡ. Các hệ thống cung cấp đã được tự động hóa, 341 Bachar chỉ ra. Cài đặt một máy chủ vào một nhóm sản xuất trong Open19 có nghĩa là cắm nó vào và khi nó cắm vào, hệ thống sẽ tự động phát hiện nó và tự động cung cấp nó.

Cả hai phần mềm giám sát và cung cấp mà công ty sử dụng cho cơ sở hạ tầng Open19 của mình cuối cùng sẽ được mở nguồn như một dự án riêng biệt, Bachar nói. Nó có thể làm như vậy theo Open19 Foundation hoặc trên mạng với các đối tác nguồn mở khác mà chúng tôi có.

Nhưng, nền tảng Open19 hoạt động với phần mềm quản lý hiện có, ông nói thêm, vì vậy khách hàng có thể sử dụng cơ sở hạ tầng tự động hóa hiện tại của họ theo cách LinkedIn sử dụng ngày nay.

Rô bốt đổi máy chủ?
Đối với các vị trí có không gian để giữ một chồng máy chủ thay thế luôn sẵn sàng ở cuối hàng, Bachar hình dung một bàn tay robot có thể loại bỏ một máy chủ bị lỗi và chèn một vật thay thế, giống như một robot băng thay đổi băng trong kho lưu trữ băng kỹ thuật số ngày nay.

Điều đó có thể dẫn chúng ta đến các trung tâm dữ liệu tối hơn nhiều, nơi chúng ta không có người hai mươi bốn, anh ấy đề nghị. Họ sẽ kêu gọi các tình huống quan trọng, nhưng thay đổi máy chủ là điều chúng ta có thể thực hiện tự động và từ xa bằng một hệ thống tự động có thể tìm hiểu tình huống và chủ động thay thế máy chủ.

Một trung tâm dữ liệu cạnh có thể được tự động hóa tất cả các cách từ phát hiện sự cố phần cứng đến đặt hàng và cài đặt máy chủ mới và thiết lập nó. Đó là một thứ gì đó thường sẽ mất vài ngày hoặc vài tuần, tùy thuộc vào mức độ khó khăn của địa điểm. Open19 đang tiến tới một thế giới nơi một khi tài xế giao hàng hoặc tay robot đến giá đỡ, máy chủ sẽ trực tuyến trong vài giây.