AI News

MÔ HÌNH NGÔN NGỮ CÓ THỂ TẠO PROTEIN MỚI

EvolutionaryScale, một lab nghiên cứu AI, vừa công bố ESM3, một mô hình AI tạo ra đột phá cho thiết kế protein mô phỏng hàng triệu năm tiến hóa để tạo ra các protein mới, có khả năng cách mạng hóa các lĩnh vực từ khám phá thuốc đến bảo vệ môi trường.

Các tính năng chính của ESM3

ESM3 là một bước nhảy vọt đáng kể trong các mô hình ngôn ngữ tạo protein, với 98 tỷ thông số và đào tạo trên một bộ dữ liệu lớn gồm 2,78 tỷ chuỗi protein. Mô hình thế hệ thứ ba này dùng đầu vào tích hợp các chú thích trình tự, cấu trúc và chức năng, cho phép độ chính xác chưa từng có trong việc xác định và xác nhận protein. Được đào tạo với 1 nghìn tỷ teraflop – nhiều tính toán hơn bất kỳ mô hình nào khác được biết đến trong sinh học – ESM3 sử dụng GPU NVIDIA H100 và cụm Andromeda cho cơ sở hạ tầng tính toán mạnh mẽ của nó.

  • Mô hình AI tạo sinh đầu tiên suy luận đồng thời về trình tự, cấu trúc và chức năng của protein
  • Cho phép dùng prompt tương tác để tạo protein
  • Được đào tạo về các sinh vật và quần xã sinh vật đa dạng để hiểu biết toàn diện về protein
  • Có khả năng tự cải thiện dựa trên phản hồi và thiết kế protein với các chức năng cụ thể

Tạo protein huỳnh quang xanh

ESM3 đã tạo ra một biến thể Protein huỳnh quang xanh (GFP) mới, một kỳ tích thường đòi hỏi 500 triệu năm tiến hóa tự nhiên. GFP mới này thể hiện sự khác biệt 58% so với protein huỳnh quang gần nhất đã biết, tái tạo các đặc tính phát quang sinh học được quan sát thấy ở sứa và san hô. Việc tạo ra biến thể GFP mới này nhấn mạnh tiềm năng của ESM3 trong việc thúc đẩy nghiên cứu khoa học bằng cách mô phỏng trong thời gian ngắn các quá trình tiến hóa kéo dài hàng trăm triệu năm.

Ứng dụng trong khoa học

Các ứng dụng tiềm năng của ESM3 trải rộng trên nhiều lĩnh vực khoa học, từ khám phá thuốc đến khoa học vật liệu và tính bảo vệ môi trường. Trong việc phát triển thuốc, khả năng tạo ra các protein mới của mô hình có thể đẩy nhanh việc tạo ra các liệu pháp và kháng thể mới. Khả năng của ESM3 cũng mở rộng sang các ứng dụng môi trường, với tiềm năng thiết kế protein để thu giữ carbon và tạo ra các enzyme có khả năng phá vỡ nhựa độc hại. Bản chất tương tác của mô hình cho phép các nhà nghiên cứu dùng prompt để yêu cầu nó thiết kế protein cụ thể, giống như một cộng tác viên ảo trong việc giải quyết các thách thức sinh học phức tạp. Tính linh hoạt này giúp ESM3 trở thành một công cụ độ phá trong khoa học về sự sống, mang lại tiềm năng cách mạng hóa cách tiếp cận kỹ thuật protein và nghiên cứu sinh học.

Hoàng Dũng AI

AI Trainer and Automation Specialist | Passionate about Empowering Individuals with AI Skills.