- ProtoBind-Diff tạo ra các phân tử giống thuốc cho các mục tiêu protein cụ thể chỉ sử dụng trình tự axit amin của chúng—không yêu cầu cấu trúc 3D.
- Mô hình hoạt động cạnh tranh với các công cụ dựa trên cấu trúc hàng đầu trong việc dự đoán sức mạnh liên kết, đồng thời tạo ra các hợp chất mới lạ và đa dạng về mặt hóa học.
(SeaPRwire) – SINGAPORE, ngày 25 tháng 6 năm 2025 — , một công ty công nghệ sinh học tập trung vào lão hóa và các bệnh mãn tính, hôm nay đã công bố ra mắt ProtoBind-Diff, một mô hình ngôn ngữ khuếch tán mặt nạ tạo ra các phân tử nhỏ chỉ dựa trên trình tự protein. Được đào tạo trên hơn một triệu cặp protein-ligand hoạt động, ProtoBind-Diff thể hiện một sự thay đổi mô hình trong tạo phân tử. Không giống như các mô hình dựa trên cấu trúc, bị giới hạn bởi tập hợp nhỏ và sai lệch của các phức hợp protein-ligand đã được giải quyết, ProtoBind-Diff tận dụng lượng dữ liệu hoạt động lớn hơn nhiều có sẵn trong các cơ sở dữ liệu công khai. Điều này cho phép đào tạo trên một không gian hóa học và sinh học rộng lớn hơn nhiều, giúp mô hình tổng quát hóa các mục tiêu chưa được khám phá, nơi dữ liệu cấu trúc thưa thớt hoặc không có sẵn.
Gero đã phát hành một chi tiết hiệu suất và thiết kế của mô hình.
“Thiết kế các phân tử nhỏ tác động đến các mục tiêu protein là một trong những vấn đề khó khăn nhất trong việc khám phá thuốc. Mô hình hóa cổ điển gặp khó khăn vì thang đo năng lượng, hiệu ứng phân cực và độ phức tạp của động lực học protein khiến các dự đoán có độ phân giải cao gần như không thể thực hiện được. Nhưng có lẽ chúng ta đã đặt câu hỏi sai,” Peter Fedichev, Ph.D., CEO và đồng sáng lập của Gero cho biết. “Tự nhiên đã phải giải quyết câu đố này rồi – quá trình tiến hóa đã tối ưu hóa một ngôn ngữ sinh hóa mã hóa cách protein và phân tử tương tác. Với ProtoBind-Diff, chúng tôi đang khai thác điều đó. Đó là một mô hình ngôn ngữ học hỏi từ các chuỗi, không phải cấu trúc. Nó không mô phỏng vật lý—nó học ngữ pháp của hoạt tính sinh học từ một triệu ví dụ thực tế.”
ProtoBind-Diff được phát triển như một thành phần nền tảng của nền tảng khám phá thuốc tạo sinh của Gero. Mô hình tận dụng các embedding protein được đào tạo trước (ESM-2) và một framework khuếch tán khử nhiễu để tạo ra các phân tử hợp lệ và mới về mặt hóa học ở định dạng SMILES, được hướng dẫn chỉ bằng thông tin cấp chuỗi.
Các kết quả chính từ bản in trước bao gồm:
- Hiệu suất cạnh tranh với các mô hình dựa trên cấu trúc (ví dụ: Pocket2Mol, TargetDiff) trong các điểm chuẩn nhận biết cấu trúc bằng Boltz-1, một mạng nơ-ron dự đoán các phức hợp protein–ligand và chấm điểm chất lượng liên kết của chúng. ProtoBind-Diff phù hợp hoặc vượt quá các mô hình này trong cả các mục tiêu được đặc trưng rõ (“dễ”) và dữ liệu thấp (“khó”).
- Khả năng diễn giải mới nổi, với các đầu chú ý căn chỉnh với các dư lượng liên kết đã biết mặc dù không tiếp xúc với các chú thích vị trí liên kết 3D trong quá trình đào tạo.
- Tính mới lạ, giống thuốc và khả năng tổng hợp cao của các phân tử được tạo ra, được đo bằng độ tương đồng cấu trúc, độ giống thuốc và các số liệu về khả năng tổng hợp.
- Bản phát hành mã nguồn mở có sẵn trên GitHub, với danh sách chờ bản demo công khai của toàn bộ mô hình và codebase tại .
ProtoBind-Diff đã được đánh giá bằng cả phương pháp docking cổ điển (AutoDock Vina) và các mô hình học sâu nhận biết cấu trúc. ProtoBind-Diff đã được đánh giá bằng Boltz-1, một mạng nơ-ron mã nguồn mở được lấy cảm hứng từ AlphaFold 3, sự phát triển của đột phá được trao giải Nobel trong dự đoán cấu trúc protein. Boltz-1 mở rộng khả năng này để mô hình hóa cách protein liên kết các phân tử nhỏ, cung cấp một số liệu nhận biết cấu trúc có thể mở rộng để đánh giá sức mạnh liên kết. Mô hình này liên tục chứng minh sự phong phú mạnh mẽ đối với các hợp chất hoạt động, đặc biệt là ở các mục tiêu có dữ liệu cấu trúc tối thiểu hoặc ít phối tử đã biết. Trong một số trường hợp, các yếu tố làm giàu Boltz-1 của nó vượt quá các yếu tố của các mô hình được đào tạo theo cấu trúc, cho thấy khả năng mạnh mẽ để học các priors không gian từ các embedding chuỗi, làm nổi bật khả năng học các priors không gian chỉ từ chuỗi.
“Tôi tin rằng chúng ta chỉ mới bắt đầu hành trình hướng tới việc tạo ra một mô hình tạo sinh lý tưởng. Đúng vậy, trong các điểm chuẩn của chúng tôi, mô hình ProtoBind-Diff hoạt động tốt hơn một số mô hình cấu trúc 3D hiện có,” Konstantin Avchaciov, Ph.D., Nhà nghiên cứu cấp cao tại Gero và nhà khoa học trưởng của dự án cho biết. “Điều đó nói rằng, tôi tin rằng khi chúng tôi tiếp tục mở rộng bộ dữ liệu của mình để bao gồm sự đa dạng hơn về các lớp protein, chúng tôi sẽ đạt được kết quả tốt hơn đáng kể trong tương lai.”
Việc phát hành ProtoBind-Diff phù hợp với sự quan tâm ngày càng tăng đối với các phương pháp khám phá thuốc có liên quan đến con người và không phụ thuộc vào cấu trúc, đặc biệt là trong các lĩnh vực như ứng phó với đại dịch, các mục tiêu bệnh bị bỏ quên và protein có các vùng rối loạn nội tại.
Gero đã tích hợp ProtoBind-Diff vào quy trình khám phá nội bộ của mình và đang tích cực tìm kiếm các đối tác để áp dụng mô hình này trong các chương trình hợp tác trên các lĩnh vực ung thư, miễn dịch học, bệnh truyền nhiễm và các tình trạng liên quan đến lão hóa.
Về Gero
Gero là một công ty công nghệ sinh học đang phát triển các liệu pháp mới cho các bệnh liên quan đến tuổi tác và tuổi thọ. Công ty kết hợp các bộ dữ liệu sinh học độc quyền với các mô hình dựa trên AI để hiểu và làm chậm quá trình lão hóa và cuối cùng là kéo dài tuổi thọ khỏe mạnh của con người. Gero cũng đang hợp tác với Pfizer để phát triển các phương pháp điều trị bệnh xơ hóa như một phần trong sứ mệnh rộng lớn hơn của mình là nhắm mục tiêu vào các nguyên nhân gốc rễ của lão hóa. Để tìm hiểu thêm, hãy truy cập .
Liên hệ Truyền thông
Kimberly Ha
KKH Advisors
917-291-5744
Bài viết được cung cấp bởi nhà cung cấp nội dung bên thứ ba. SeaPRwire (https://www.seaprwire.com/) không đưa ra bảo đảm hoặc tuyên bố liên quan đến điều đó.
Lĩnh vực: Tin nổi bật, Tin tức hàng ngày
SeaPRwire cung cấp phát hành thông cáo báo chí thời gian thực cho các công ty và tổ chức, tiếp cận hơn 6.500 cửa hàng truyền thông, 86.000 biên tập viên và nhà báo, và 3,5 triệu máy tính để bàn chuyên nghiệp tại 90 quốc gia. SeaPRwire hỗ trợ phân phối thông cáo báo chí bằng tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Ả Rập, tiếng Trung Giản thể, tiếng Trung Truyền thống, tiếng Việt, tiếng Thái, tiếng Indonesia, tiếng Mã Lai, tiếng Đức, tiếng Nga, tiếng Pháp, tiếng Tây Ban Nha, tiếng Bồ Đào Nha và các ngôn ngữ khác.
“`