Pipeline GUB - wizualizacja aktywności białka

Narracja ASCII

Komorka pojedyncza

Przejscie od sygnalu komorkowego do modelu wirtualnej komorki.

Dołącz Kontakt

Pipeline GUB: projektowanie leków na bakterie Gram-ujemne

Budujemy zamkniętą pętlę od projektowania molekuł do weryfikacji komórkowej i systemowej, a wyniki wracają do modeli.

  • Generowanie de novo (REINVENT4)
  • Retencja i target engagement (Stage 2-3)
  • Wpływ systemowy (Stage 6, COBRApy/iML1515)

Szukasz współpracy? Zobacz wsparcie.

Dlaczego To Ma Znaczenie

Wąskie gardła dla leków na bakterie Gram-ujemne pojawiają się między dobrym wynikiem in-silico a realnym efektem biologicznym.

  • Samo powinowactwo nie wystarczy, jeśli cząsteczka nie utrzyma się w komórce.
  • Selekcja bez kontekstu metabolicznego pomija systemowe skutki uboczne.
  • Potrzebny jest pipeline, który raportuje artefakty i ograniczenia na każdym etapie.
Helix macro visualization

Pipeline GUB (Gram-Negative & Universal Bacteria)

Zintegrowany workflow CADD do projektowania celowanego w E. coli: od generowania molekuł po walidację Stage 6A/6B.

Iteracyjne uczenie pipeline'u na wynikach walidacji.

Aktualnie działa inżynieryjna pętla eksperymentalna i walidacyjna. Nie traktujemy jej jako w pełni autonomicznego systemu produkcyjnego.

Działa dziś (na dzień 2026-02-10)

  • Kontrakty API (Pydantic) i stage_runner.py na etapach 1-6.
  • EXP3 pilot15 (top_n=10): Stage1 -> Stage6 + finalize zakończone.
  • EXP2 surrogate loop (n=15): true pass-rate 0.575 -> 0.625.

Architektura docelowa

  • Stabilny full-scale chain dla profili full10/full100.
  • Ujednolicenie kontraktu Stage6B (target_gene: CSV vs CLI).
  • Rerun rankingu na >=100 rekordach z realnym KD_pred ze Stage 4.

Generowanie i postprocess bibliotek SMILES z walidacją konfiguracji i deterministycznym zapisem artefaktów Stage 1.

Output (ostatni znany stan) 12 797 rekordów wejścia; 12 581 valid po walidacji Stage2a.
live

Łączenie Stage 2a/2b z CellTE, aby oszacować retencję, entry score i wstępne target engagement przed strukturą Boltz2.

Output (ostatni znany stan) Inference retencji zweryfikowane na ~12.8k cząsteczek.
live

Etap strukturalny generuje i porządkuje kandydatów do Boltz2 oraz ranking powinowactwa na podstawie przetworzonego `summary.csv`.

Output (ostatni znany stan) `stage3_for_boltz2.csv`: top 200 kandydatów.
stabilizing

Stage 4 konwertuje `affinity_log_ic50` do `KD_pred` i sortuje wyniki deterministycznie przed przekazaniem do etapów dynamicznych.

Output (ostatni znany stan) `stage4_output.csv` z `KD_pred`; ranking deterministyczny po hardeningu 2026-02-09.
active hardening

Stage 5/6 weryfikuje stabilność i wpływ metaboliczny (6A/6B) z jawnymi quality gates i metrykami pokrycia.

Output (ostatni znany stan) `stage3_for_gromacs.csv` top 50; raporty Stage6 dla pilot 20 i full 100.
active hardening

Poniższe punkty to aktualny status inżynieryjny, a nie końcowe twierdzenia biologiczne.

  • EXP1 affinity-only: blindspot_rate=1.0 dla targetu b0048 (N=100) w tym konkretnym setupie.
  • EXP3 full10: był mismatch kontraktu Stage6B; fix wdrożony, rerun oczekuje potwierdzenia.

Priorytetem jest domknięcie rerunów i kontraktów, zanim uznamy pętlę za stabilną produkcyjnie.

Repozytoria i Aktualne Zadania

Ten widok ma przyspieszyć onboarding: co już działa, co jest w toku i gdzie można wejść z pracą.

Główne moduły pipeline

REINVENT4 + analiza + retencja

Generowanie, filtrowanie i scoring wejścia dla Stage 3 z obsługą dużych bibliotek.

Walidacje środowiska + hardening log-driven (2026-02-09).

CellTE + Boltz2 + GROMACS

Etap kinetyczny i strukturalny z kontraktami CSV oraz etapami pre/post Boltz2.

Top 200 do Boltz2 i top 50 do GROMACS w aktualnym przepływie.

Biologia systemowa Stage 6A/6B

FBA/FVA, quality gates, preflight targetów i raporty blindspot.

EXP1: pilot 20 + full 100; metryki i ograniczenia jawnie raportowane.

Otwarte zadania na teraz

EXP3 full10 rerun po synchronizacji

Potwierdzić przejście 90_stage6b i 99_finalize oraz komplet `run_manifest.json`/`report.md`.

Status: aktywne (notes/03_experiments).

Ujednolicić kontrakt Stage6BInput

Zdecydować docelowo czy `target_gene` ma być w CSV, w CLI, czy w obu warstwach z twardą walidacją.

Status: otwarte pytanie kontraktowe.

Powtórzyć EXP1 na Stage4 KD_pred >= 100

Porównać blindspot_rate między selekcją `qed` i rzeczywistym rankingiem `KD_pred`.

Status: oczekuje większego zbioru Stage 4.

Ustalić produkcyjne progi quality gates

Domknąć progi Stage 6A/6B (`strict-quality-gates`) i opisać je jako stały standard runów.

Status: in progress.

Dołącz do zespołu GUB

Szukamy osób, które chcą budować rzetelny pipeline badawczy i regularnie domykać zadania inżynieryjne.

Obszary pracy

  • Infrastruktura i automatyzacja - Slurm, handoff, walidacje etapów i niezawodność runów.
  • Modelowanie molekularne - REINVENT4, Boltz2, GROMACS, interpretacja wyników strukturalnych.
  • Biologia systemowa - Stage 6A/6B, quality gates, analiza ryzyka metabolicznego.

Czego oczekujemy

  • Autonomia i dowożenie zadań od diagnozy do artefaktu.
  • Komfort z niepewnością i systematyczne debugowanie.
  • Jasna komunikacja postępu w rytmie tygodniowym.

Jak aplikować

  1. Napisz, w którym obszarze chcesz wejść i jaki problem chcesz przejąć.
  2. Po krótkiej rozmowie dostajesz zadanie startowe i plan wdrożenia.

Liczy się rzetelność wykonania i iteracyjna poprawa jakości, nie formalny papier.

Wsparcie i partnerstwo

Jeśli chcesz przyspieszyć ten pipeline, poniżej są konkretne potrzeby operacyjne.

  • Compute credits i infrastruktura HPC pod powtarzalne runy Stage 1-6.
  • Dostęp do walidacji wet-lab dla wybranych kandydatów po filtrach Stage 6.
  • Mentoring ekspercki: MD, FBA/COBRA i projektowanie eksperymentów.
Skontaktuj się w sprawie współpracy