banner

Blog

Jan 21, 2024

Enfoques computacionales que agilizan el descubrimiento de fármacos

Nature volumen 616, páginas 673–685 (2023)Cite este artículo

41k Accesos

7 citas

397 altmétrico

Detalles de métricas

El descubrimiento de fármacos asistido por computadora existe desde hace décadas, aunque en los últimos años se ha visto un cambio tectónico hacia la adopción de tecnologías computacionales tanto en el mundo académico como en el farmacéutico. Este cambio se define en gran medida por la avalancha de datos sobre las propiedades de los ligandos y la unión a objetivos terapéuticos y sus estructuras tridimensionales, las abundantes capacidades informáticas y la llegada de miles de millones de bibliotecas virtuales bajo demanda de pequeñas moléculas similares a fármacos. Aprovechar al máximo estos recursos requiere métodos computacionales rápidos para una detección eficaz de ligandos. Esto incluye la detección virtual basada en estructuras de espacios químicos a gigaescala, facilitada aún más por enfoques de detección iterativos rápidos. Son altamente sinérgicos los avances en las predicciones de aprendizaje profundo de las propiedades de los ligandos y las actividades objetivo en lugar de la estructura del receptor. Aquí revisamos los avances recientes en las tecnologías de descubrimiento de ligandos, su potencial para remodelar todo el proceso de descubrimiento y desarrollo de fármacos, así como los desafíos que enfrentan. También discutimos cómo la rápida identificación de ligandos muy diversos, potentes, selectivos de objetivos y similares a fármacos para objetivos de proteínas puede democratizar el proceso de descubrimiento de fármacos, presentando nuevas oportunidades para el desarrollo rentable de tratamientos de moléculas pequeñas más seguros y eficaces.

A pesar de los sorprendentes avances en las ciencias biológicas básicas y la biotecnología, el descubrimiento y desarrollo de fármacos (DDD) sigue siendo lento y costoso: en promedio se necesitan aproximadamente 15 años y aproximadamente 2 mil millones de dólares para producir un fármaco de molécula pequeña1. Aunque se acepta que los estudios clínicos son la parte más cara del desarrollo de cada fármaco, la mayoría de las oportunidades de ahorro de tiempo y costos residen en las etapas preclínicas y de descubrimiento más tempranas. Los esfuerzos preclínicos en sí mismos representan más del 43 % de los gastos en el sector farmacéutico, además de una importante financiación pública1, impulsados ​​por la alta tasa de deserción en cada paso, desde la selección de objetivos hasta la identificación de aciertos y la optimización de clientes potenciales hasta la selección de candidatos clínicos. Además, la alta tasa de fracaso en los ensayos clínicos (actualmente 90%)2 se explica en gran medida por problemas derivados del descubrimiento temprano, como una validación inadecuada del objetivo o propiedades subóptimas del ligando. Encontrar formas rápidas y accesibles de descubrir conjuntos más diversos de sondas, aciertos y derivaciones químicas de mayor calidad con perfiles óptimos de absorción, distribución, metabolismo, excreción y toxicología (ADMET) y farmacocinética (PK) en las primeras etapas de la DDD mejoraría los resultados en estudios preclínicos y clínicos y facilitar medicamentos más eficaces, accesibles y seguros.

El concepto de descubrimiento de fármacos asistido por computadora3 fue desarrollado en la década de 1970 y popularizado por la revista Fortune en 1981, y desde entonces ha pasado por varios ciclos de exageración y desilusión4. Ha habido historias de éxito a lo largo del camino5 y, en general, los enfoques asistidos por computadora se han convertido en una parte integral, aunque modesta, del proceso de descubrimiento de fármacos6,7. Sin embargo, en los últimos años, varios avances científicos y tecnológicos dieron lugar a un cambio tectónico hacia la adopción de enfoques computacionales como fuerza impulsora clave para el descubrimiento de fármacos tanto en el mundo académico como en la industria. Las empresas farmacéuticas y de biotecnología están ampliando sus esfuerzos de descubrimiento de fármacos computacionales o contratando a sus primeros químicos computacionales. Numerosas empresas de descubrimiento de fármacos nuevas y establecidas han recaudado miles de millones en los últimos años con modelos de negocio que dependen en gran medida de una combinación de modelado molecular avanzado basado en la física con aprendizaje profundo (DL) e inteligencia artificial (IA)8. Aunque todavía es demasiado pronto para esperar medicamentos aprobados a partir de los esfuerzos de descubrimiento computacional más recientes, están produciendo un número creciente de candidatos clínicos, y algunas campañas afirman específicamente que los tiempos entre el objetivo y la entrega son tan bajos como 1 a 2 meses9,10. o tiempo desde el objetivo hasta la clínica inferior a 1 año11. ¿Son estos signos de un cambio importante en el papel que tienen los enfoques computacionales en el descubrimiento de fármacos o simplemente otra ronda del ciclo de exageración?

Veamos los factores clave que definen los cambios recientes (Fig. 1). En primer lugar, la revolución estructural (desde la automatización de la cristalografía12 hasta la microcristalografía13,14 y, más recientemente, la tecnología de microscopía crioelectrónica15,16) ha hecho posible revelar estructuras tridimensionales para la mayoría de objetivos clínicamente relevantes, a menudo en un estado o complejo molecular relevante para su función biológica. Especialmente impresionante ha sido el reciente cambio estructural de los receptores acoplados a proteína G (GPCR)17 y otras proteínas de membrana que median la acción de más del 50% de los fármacos18, proporcionando plantillas 3D para la detección de ligandos y la optimización de cables. El segundo factor es una expansión rápida y marcada del espacio químico similar a las drogas, fácilmente accesible para descubrimientos de éxitos y pistas. Hace apenas unos años, este espacio estaba limitado a varios millones de compuestos disponibles en los lineales de proveedores y bibliotecas de detección internas en el sector farmacéutico. Ahora, la detección se puede realizar con bibliotecas virtuales ultragrandes y espacios químicos de compuestos similares a fármacos, que pueden elaborarse fácilmente bajo demanda, creciendo rápidamente más allá de miles de millones de compuestos19, y espacios generativos aún más grandes con sintetizabilidad teóricamente prevista (Cuadro 1). . El tercer factor implica enfoques computacionales emergentes que se esfuerzan por aprovechar al máximo la abundancia de estructuras 3D y datos de ligandos, respaldados por la amplia disponibilidad de recursos informáticos de unidades de procesamiento de gráficos (GPU) y la nube para respaldar estos métodos a escala. Esto incluye la detección virtual basada en estructuras de bibliotecas ultragrandes20,21,22, utilizando enfoques de detección acelerados23,24,25 y modulares26, así como el reciente crecimiento de los métodos de aprendizaje automático (ML) y DL basados ​​en datos para predecir ADMET y PK. propiedades y actividades27.

a, Más de 200.000 estructuras de proteínas en el PDB, además de colecciones privadas, tienen más del 90% de las familias de proteínas cubiertas con estructuras de rayos X de alta resolución y, más recientemente, de microscopía crioelectrónica, a menudo en distintos estados funcionales, aunque también quedan lagunas. llenado por homología o modelos AlphaFold2. b, El espacio químico disponible para el cribado y la síntesis rápida ha crecido de aproximadamente 107 compuestos disponibles en 2015 a más de 3 × 1010 compuestos bajo demanda en 2022, y puede ampliarse rápidamente más allá de 1015 compuestos diversos y novedosos. c, Los métodos computacionales para VLS incluyen avances en acoplamiento rápido y flexible, algoritmos modulares basados ​​en fragmentos, modelos DL y enfoques híbridos. d, Las herramientas computacionales están respaldadas por el rápido crecimiento de la computación en la nube asequible, la aceleración de GPU y chips especializados.

Aunque los impactos de la reciente revolución estructural17 y el hardware informático en el descubrimiento de fármacos28 se revisan exhaustivamente en otros lugares, aquí nos centramos en la expansión en curso de espacios químicos similares a los fármacos accesibles, así como en los desarrollos actuales en métodos computacionales para el descubrimiento y optimización de ligandos. Detallamos cómo las herramientas computacionales emergentes aplicadas en el gigaespacio pueden facilitar el descubrimiento rentable de cientos o incluso miles de ligandos altamente diversos, potentes, selectivos de objetivos y similares a fármacos para un objetivo deseado, y los ubicamos en el contexto de enfoques experimentales ( Tabla 1). Aunque el impacto total de las nuevas tecnologías computacionales apenas está comenzando a afectar el desarrollo clínico, sugerimos que su combinación sinérgica con pruebas experimentales y validación en el ecosistema de descubrimiento de fármacos puede mejorar notablemente su eficiencia en la producción de mejores terapias.

Las empresas farmacéuticas acumulan colecciones de compuestos para su detección interna, mientras que las colecciones en existencia de los proveedores (consulte la figura, parte a) permiten una entrega rápida (menos de 1 semana), contienen estructuras químicas únicas y avanzadas, se pueden buscar fácilmente y son HTS. compatible. Sin embargo, el alto costo de manejar bibliotecas físicas, su lento crecimiento lineal, su tamaño limitado y su novedad limitan sus aplicaciones.

Más recientemente, las bases de datos químicas virtuales bajo demanda (totalmente enumeradas) y los espacios (no enumerados) permiten una síntesis paralela rápida a partir de los componentes básicos disponibles, utilizando protocolos validados u optimizados, con un éxito sintético de más del 80 % y una entrega en 2 a 3 semanas ( ver la figura, parte b). Los espacios químicos virtuales aseguran una alta novedad química y permiten un rápido crecimiento polinomial con la adición de nuevos sintetizadores y andamios de reacción, incluidas reacciones de más de 4 componentes. Los ejemplos incluyen Enamine REAL, Galaxy de WuXi, CHEMriya de Otava y bases de datos y espacios privados en empresas farmacéuticas.

Los espacios generativos, a diferencia de los espacios bajo demanda, comprenden moléculas teóricamente posibles y colectivamente podrían comprender todo el espacio químico (ver la figura, parte c). Dichos espacios están limitados únicamente por la plausibilidad teórica, estimada en 1023-1060 de compuestos similares a las drogas. Aunque permite una cobertura espacial completa, la ruta de reacción y la tasa de éxito de los compuestos generados se desconocen y, por lo tanto, requieren una predicción computacional de su sintetizabilidad práctica. Ejemplos de espacios generativos y sus subconjuntos incluyen GDB-13, GDB-17, GDB-18 y GDBChEMBL.

El tamaño limitado y la diversidad de las bibliotecas de detección han sido durante mucho tiempo un cuello de botella para la detección de nuevos ligandos potentes y para todo el proceso de descubrimiento de fármacos. Una campaña de detección de alto rendimiento (HTS) "asequible" promedio29 utiliza bibliotecas de detección de aproximadamente 50 000 a 500 000 compuestos y se espera que produzca sólo unos pocos resultados reales después de la validación secundaria. Esos resultados, si los hay, suelen ser bastante débiles, no selectivos, tienen propiedades ADMET y PK subóptimas y un modo de unión desconocido, por lo que su descubrimiento implica años de arduos esfuerzos de optimización de prueba y error para producir una molécula líder con una potencia satisfactoria y todo los demás requisitos para el desarrollo preclínico. La ampliación del HTS a unos pocos millones de compuestos sólo puede permitirse en las grandes farmacéuticas, y todavía no hace mucha diferencia en términos de la calidad de los éxitos resultantes. Del mismo modo, las bibliotecas virtuales que se utilizan en el análisis in silico se limitaban tradicionalmente a una colección de compuestos disponibles en stock de los proveedores, que generalmente comprendían menos de 10 millones de compuestos únicos, por lo que la ventaja de escala sobre HTS era marginal.

Aunque perseguir la cobertura total del enorme espacio de sustancias químicas similares a las drogas (estimado en más de 1063 compuestos)30 es un esfuerzo inútil, expandir la selección de bibliotecas bajo demanda en varios órdenes de magnitud a miles de millones y más de sustancias similares a drogas previamente inexploradas Se espera que los compuestos, ya sean físicos o virtuales, cambien el modelo de descubrimiento de fármacos de varias maneras. En primer lugar, puede aumentar proporcionalmente el número de posibles aciertos en el cribado inicial31 (Fig. 2). Esta abundancia de ligandos en la biblioteca también aumenta las posibilidades de identificación de ligandos más potentes o selectivos, así como ligandos con mejores propiedades fisicoquímicas. Esto se ha demostrado en campañas de detección virtuales ultragrandes para varios objetivos, que revelan ligandos muy potentes con afinidades a menudo en el rango medio nanomolar a subnanomolar20,21,22,23,26. En segundo lugar, la accesibilidad de análogos de éxito en los mismos espacios bajo demanda agiliza la generación de relaciones estructura-actividad (SAR) significativas por catálogo y pasos de optimización adicionales, lo que reduce la cantidad de síntesis personalizadas elaboradas. Por último, aunque la escala de la biblioteca es importante, las bibliotecas a gigaescala construidas adecuadamente pueden ampliar la diversidad química (incluso con unas pocas reacciones químicas32), la novedad química y la patentabilidad de los resultados, ya que casi todos los compuestos bajo demanda nunca antes se han sintetizado.

Las curvas rojas en escala logarítmica ilustran la distribución de resultados de detección con puntuaciones de vinculación mejores que X para bibliotecas de 10 mil millones, 100 millones y 1 millón de compuestos, según lo estimado a partir de campañas de detección anteriores de VLS y V-SYNTHES. Las curvas azules ilustran la dependencia aproximada de la tasa de aciertos experimental en la puntuación de acoplamiento prevista para los umbrales de 10 µM, 1 µM y 100 nM20. Este análisis (semicuantitativo, ya que varía de un objetivo a otro) sugiere que la detección de más de 100 millones de compuestos elimina las limitaciones de las bibliotecas más pequeñas, extendiendo la cola de la distribución de resultados hacia mejores puntuaciones de vinculación con altas tasas de resultados y permitiendo identificación de aciertos proporcionalmente más experimentales y con mayor afinidad. Tenga en cuenta también dos factores importantes que justifican un mayor crecimiento de las bibliotecas de detección a 10 mil millones y más: (1) los resultados candidatos para la síntesis y las pruebas experimentales generalmente se seleccionan como resultado del posprocesamiento dependiente del objetivo de varios miles de compuestos con la puntuación más alta, que selecciona por novedad, diversidad, similitud con fármacos y, a menudo, interacciones con residuos de receptores específicos. Por lo tanto, cuantos más compuestos con buena puntuación se identifiquen, mejor será la selección general. (2) La saturación de las curvas de tasa de aciertos en las mejores puntuaciones no es una regla universal sino el resultado de la precisión limitada de las funciones de puntuación rápida utilizadas en la selección. El uso de enfoques de acoplamiento o puntuación más precisos (acoplamiento flexible, mecánica cuántica y perturbación de energía libre) en el paso de posprocesamiento puede ampliar una correlación significativa de la puntuación de unión con la afinidad más a la izquierda (curvas discontinuas grises), lo que potencialmente generará aún más resultados de alta afinidad. para espacios químicos a gigaescala.

Recientemente se han desarrollado varios enfoques para superar los límites del tamaño de la biblioteca en HTS, incluida la química combinatoria y la combinación a gran escala de compuestos para ensayos paralelos. Por ejemplo, se pueden aplicar técnicas de espectrometría de masas de selección por afinidad para identificar aglutinantes directamente en conjuntos de miles de compuestos33 sin necesidad de etiquetado. También se han desarrollado bibliotecas codificadas por ADN (DEL) y enfoques rentables para generarlas y examinarlas34, lo que permite trabajar con hasta aproximadamente 1010 compuestos en un solo tubo de ensayo35. Estos métodos tienen sus propias limitaciones; Como los DEL se crean marcando ligandos con secuencias de ADN únicas a través de un conector, la conjugación de ADN limita las químicas posibles para el ensamblaje combinatorio de la biblioteca. La detección de DEL también puede producir una gran cantidad de falsos negativos al bloquear restos importantes para la unión y, lo que es más importante, falsos positivos por la unión no específica de etiquetas de ADN, por lo que se necesita una costosa resíntesis fuera del ADN de los compuestos afectados para su validación. Para evitar esta resíntesis, se ha sugerido utilizar modos ML entrenados en resultados DEL para cada objetivo para predecir ligandos similares a fármacos a partir de espacios químicos bajo demanda, como se describe en la ref. 36.

La detección in silico de bibliotecas virtuales mediante enfoques computacionales rápidos se ha promocionado durante mucho tiempo como una forma rentable de superar las limitaciones de las bibliotecas físicas. Sin embargo, solo recientemente se han desarrollado enfoques de química sintética y quimioinformática para romper estos límites y construir bibliotecas virtuales bajo demanda que exploran un espacio químico mucho más grande, como se revisa en las referencias. 37,38. En 2017, la base de datos de fácil acceso (REAL) de Enamine19,39 se convirtió en la primera biblioteca bajo demanda disponible comercialmente basada en el principio de reacción robusta40, mientras que los Institutos Nacionales de Salud de EE. UU. desarrollaron un inventario virtual sintéticamente accesible (SAVI)41, que también utiliza Enamine bloques de construcción. La base de datos REAL utiliza protocolos de síntesis paralelos cuidadosamente seleccionados y optimizados y una colección seleccionada de bloques de construcción en stock, lo que permite garantizar la síntesis rápida (menos de 4 semanas), confiable (tasa de éxito del 80 %) y asequible de un conjunto de compuestos21. Impulsada por nuevas reacciones y diversos componentes básicos, la base de datos REAL completamente enumerada ha crecido de aproximadamente 170 millones de compuestos en 2017 a más de 5500 millones de compuestos en 2022 y comprende la mayor parte de la popular base de datos de detección virtual ZINC2042. La utilidad práctica de la base de datos REAL se ha demostrado recientemente en varias campañas de detección prospectivas importantes20,21,23,24, algunas de las cuales tomaron medidas de optimización adicionales en el mismo espacio químico, produciendo ligandos nanomolares e incluso subnanomolares selectivos sin ningún tipo de personalización. síntesis20,21. Bibliotecas virtuales ultragrandes similares (es decir, GalaXi (http://www.wuxiapptec.com) y CHEMriya (http://chemriya.com)) están disponibles comercialmente, aunque sus tasas de éxito sintético aún no se han publicado.

La naturaleza modular de las bibliotecas virtuales bajo demanda respalda un mayor crecimiento mediante la adición de reacciones y bloques de construcción. Sin embargo, construir, mantener y buscar bibliotecas químicas completamente enumeradas que comprendan más de unos pocos miles de millones de compuestos se vuelve lento y poco práctico. Por lo tanto, estas bibliotecas virtuales a gigaescala generalmente se mantienen como espacios químicos no enumerados, definidos por un conjunto específico de bloques de construcción y reacciones (o transformaciones), como se revisa exhaustivamente en la ref. 38. Dentro del sector farmacéutico, uno de los primeros ejemplos publicados incluye PGVL de Pfizer37,43, cuya versión más reciente utiliza un conjunto de 1.244 reacciones y reactivos internos para dar cuenta de 1.014 compuestos. Otras empresas biofarmacéuticas tienen sus propios espacios químicos virtuales38,44, aunque sus detalles a menudo no son de dominio público. Entre los espacios químicos disponibles comercialmente, GalaXi Space de WuXi (aproximadamente 8 mil millones de compuestos), CHEMriya de Otava (11,8 mil millones de compuestos) y Enamine REAL Space (36 mil millones de compuestos)45 se encuentran entre los más grandes y establecidos. Además de sus enormes tamaños, estos espacios virtuales son muy novedosos y diversos, y tienen una superposición mínima (menos del 10%) entre sí46. Actualmente, el espacio comercial más grande, Enamine REAL Space, es una extensión de la base de datos REAL que mantiene las mismas garantías de velocidad, velocidad y costo sintético, cubriendo más de 170 reacciones y más de 137.000 bloques de construcción (Cuadro 1). La mayoría de estas reacciones son de dos o tres componentes, pero se están explorando más reacciones de cuatro o incluso cinco componentes, lo que permite la combinatoria de orden superior. Este espacio se puede ampliar fácilmente a 1015 compuestos basándose en reacciones disponibles y conjuntos de bloques de construcción ampliados, por ejemplo, 680 millones de bloques de construcción fabricados bajo demanda (MADE)47, aunque la síntesis de dichos compuestos implica más pasos y es más costosa. Para representar y navegar por espacios químicos combinatorios sin su enumeración completa, se han desarrollado herramientas quimioinformáticas especializadas, desde búsquedas de similitudes químicas basadas en fragmentos48 hasta métodos de búsqueda de similitudes moleculares 3D más elaborados basados ​​en campos de propiedades atómicas, como el motor de descubrimiento rápido de isósteros (RIDE)38.

Un enfoque alternativo propuesto para construir espacios químicos genera compuestos hipotéticamente sintetizables siguiendo reglas simples de viabilidad sintética y estabilidad química. Así, las bases de datos generadas (GDB) predicen compuestos que pueden estar formados por un número específico de átomos; por ejemplo, el GDB-17 contenía 166,4 mil millones de moléculas de hasta 17 átomos de C, N, O, S y halógenos49, mientras que el GDB-18 compuesto por 18 átomos alcanzaría un estimado de 1013 compuestos38. Ahora se utilizan otros enfoques generativos basados ​​en definiciones más estrechas de espacios químicos en el diseño de ligandos de novo con química generativa basada en DL (por ejemplo, ref. 50), como se analiza a continuación.

Aunque la tasa de éxito sintético de algunos de los espacios químicos comerciales bajo demanda (por ejemplo, Enamine REAL Space) se ha validado exhaustivamente20,21,22,23,24,26,42, las accesibilidades sintéticas y las tasas de éxito de otros espacios químicos siguen siendo inédito38. Estas son métricas importantes para la sostenibilidad práctica de la síntesis bajo demanda porque las tasas de éxito reducidas o el tiempo y el costo irrazonables disminuirían su ventaja sobre la síntesis personalizada.

Se espera que los espacios químicos de gigaescala y terraescala, siempre que mantengan una alta diversidad y similitud con las drogas, alberguen millones de impactos potenciales y miles de series potenciales de plomo para cualquier objetivo. Además, su síntesis robusta y altamente manejable simplifica cualquier esfuerzo de química medicinal posterior hacia los fármacos candidatos finales.

Sin embargo, lidiar con tales bibliotecas virtuales requiere nuevos enfoques computacionales que cumplan requisitos especiales tanto de velocidad como de precisión. Tienen que ser lo suficientemente rápidos para manejar bibliotecas a gran escala. Si el acoplamiento de un compuesto toma 10 segundos por núcleo de CPU, se necesitarían más de 3.000 años para analizar 1.010 compuestos en un solo núcleo de CPU, o costaría aproximadamente 1 millón de dólares en una nube informática a las tarifas de CPU más baratas. Al mismo tiempo, el análisis a gigaescala debe ser extremadamente preciso, protegiendo contra resultados falsos positivos que efectivamente engañan a la función de puntuación explotando sus agujeros y aproximaciones31. Incluso una tasa de uno entre un millón de falsos positivos en una biblioteca compuesta 1010 comprendería 10.000 resultados falsos, lo que puede inundar cualquier selección de candidatos a resultados. La tasa y la naturaleza de los artefactos pueden depender del objetivo y de los algoritmos de detección y deben abordarse cuidadosamente durante la detección y el posprocesamiento. Aunque no existe una solución única para tales artefactos, algunas soluciones prácticas y razonablemente rentables incluyen: (1) selección basada en el consenso de dos funciones de puntuación diferentes, (2) selección de aciertos muy diversos (muchos artefactos se agrupan en compuestos similares ), (3) cubrir las apuestas de varios rangos de puntuaciones31 y (4) seleccionar manualmente la lista final de compuestos para detectar interacciones inusuales. En última instancia, es muy deseable arreglar tantos 'agujeros en las funciones de puntuación' como sea posible y reoptimizarlos para lograr una alta selectividad en el rango de puntuaciones donde se encuentran los verdaderos éxitos del gigaespacio. Omitir algunos aciertos en la selección (falsos negativos) sería bien tolerado debido a la gran cantidad de aciertos potenciales en el espacio 1010 (por ejemplo, perder el 50% de un millón de aciertos potenciales está perfectamente bien), por lo que se debe hacer alguna compensación en la sensibilidad de la puntuación. es aceptable.

Los principales tipos de enfoques computacionales para detectar ligandos potenciales en una proteína objetivo se resumen en la Tabla 2. A continuación, analizamos algunas tecnologías emergentes y cómo pueden encajar mejor en el proceso general de DDD para aprovechar al máximo los crecientes espacios químicos bajo demanda.

La detección in silico acoplando moléculas de la biblioteca virtual a una estructura receptora y prediciendo su 'puntuación de unión' es un enfoque bien establecido para acertar y liderar el descubrimiento y tuvo un papel clave en recientes historias de éxito en el descubrimiento de fármacos11,17,51. El procedimiento de acoplamiento en sí puede utilizar la mecánica molecular, a menudo en representación de coordenadas internas, para un muestreo conformacional rápido de ligandos totalmente flexibles52,53, utilizando enfoques empíricos de coincidencia de formas en 3D54,55 o combinándolos en un embudo de acoplamiento híbrido56,57. Se dedica especial atención a las funciones de puntuación de ligandos, que están diseñadas para eliminar de manera confiable los no aglutinantes para minimizar las predicciones falsas positivas, lo cual es especialmente relevante con el crecimiento del tamaño de la biblioteca. Se han realizado evaluaciones ciegas del rendimiento de algoritmos basados ​​en estructuras de forma rutinaria como un esfuerzo comunitario del D3R Grand Challenge58,59, lo que muestra mejoras continuas en la postura del ligando y las predicciones de energía de enlace para los mejores algoritmos.

A lo largo de los años se han publicado resultados de muchas campañas exitosas de detección prospectiva basada en estructuras que cubren todas las clases principales de objetivos, más recientemente GPCR, como se revisa en las referencias. 17,51,60, mientras que en la industria se han utilizado muchos más. Los conjuntos de ligandos candidatos enfocados, predichos por dicha selección, a menudo muestran tasas de acierto útiles (10-40%) en pruebas experimentales60, produciendo aciertos novedosos para muchos objetivos con potencias en el rango de 0,1 a 10 μM (para aquellos que están publicados, en el menos). Sin embargo, los pasos adicionales en la optimización de los resultados iniciales obtenidos a partir de bibliotecas de detección estándar de menos de 10 millones de compuestos generalmente requieren una costosa síntesis personalizada de análogos, que solo se ha logrado en unos pocos casos publicados20,61.

La identificación de impactos directamente en espacios químicos mucho más grandes, como el Espacio REAL, no solo puede generar más y mejores impactos31 sino que también apoya su optimización, ya que cualquier impacto resultante tiene miles de análogos y derivados en el mismo espacio bajo demanda. Esta ventaja fue especialmente útil para objetivos tan desafiantes como la proteasa principal del SARS-CoV-2 (Mpro), para la cual cientos de intentos estándar de detección de ligando virtual (VLS) fracasaron62 (consulte la discusión sobre los desafíos de Mpro en 'Hybrid in vitro–). enfoques in silico' más adelante). Aunque las tasas de aciertos iniciales fueron bajas incluso en las pantallas ultragrandes, VirtualFlow24 de la base de datos REAL con 1.400 millones de compuestos todavía identificó aciertos en el rango de 10 a 100 µM, que se optimizaron mediante síntesis bajo demanda63 para generar clientes potenciales de calidad con el mejor compuesto Z222979552 (concentración inhibidora media máxima (CI50) = 1,0 µM). Otra pantalla ultragrande de 235 millones de compuestos, basada en una estructura Mpro más nueva con un inhibidor no covalente (Protein Data Bank (PDB) ID: 6W63), también produjo resultados viables, cuya rápida optimización resultó en el descubrimiento de Mpro nanomolar. inhibidores en solo 4 meses mediante una combinación de química personalizada simple y bajo demanda64. El mejor compuesto de este trabajo tenía buenas propiedades ADMET in vitro, con una afinidad de 38 nM y una potencia antiviral celular de 77 nM, que son comparables al PF-07321332 (nirmatrelvir) clínicamente utilizado65.

Con el aumento del tamaño de las bibliotecas, el tiempo de cálculo y el coste del propio acoplamiento se convierten en el principal cuello de botella en el cribado, incluso con la computación en la nube masivamente paralela60. Recientemente se han sugerido enfoques iterativos para abordar bibliotecas de este tamaño; por ejemplo, VirtualFlow utilizó un filtrado gradual de toda la biblioteca con algoritmos de acoplamiento de precisión cada vez mayor para detectar aproximadamente 1.400 millones de compuestos Enamine REAL23,24. Aunque mejora la velocidad varias veces, el método aún requiere una biblioteca completamente enumerada y su costo computacional crece linealmente con la cantidad de compuestos, lo que limita su aplicabilidad en espacios químicos en rápida expansión.

La idea de diseñar moléculas a partir de un conjunto limitado de fragmentos para llenar de manera óptima el bolsillo de unión al receptor se ha considerado desde los primeros años del descubrimiento de fármacos, implementada, por ejemplo, en el algoritmo LUDI66. Sin embargo, la síntesis personalizada de los compuestos diseñados siguió siendo el principal obstáculo para tales enfoques. La tecnología de detección de enumeración jerárquica de sintetizador virtual recientemente desarrollada (V-SYNTHES)26 aplica un diseño basado en fragmentos a espacios químicos bajo demanda, evitando así los desafíos de la síntesis personalizada (Fig. 3). Comenzando con el catálogo de reacciones y bloques de construcción (sintones) del Espacio REAL, V-SYNTHES primero prepara una biblioteca mínima de fragmentos químicos representativos enumerando completamente los sintones en uno de los puntos de unión, tapando la otra posición (o posiciones) con un metilo o grupo fenilo. La detección basada en el acoplamiento permite la selección de los fragmentos con mayor puntuación (por ejemplo, el 0,1% superior) que se predice que se unirán bien al bolsillo objetivo. Esto se repite para una segunda posición (y luego para la tercera y cuarta posición, si están disponibles), y las bibliotecas enfocadas resultantes se examinan en cada iteración contra el bolsillo objetivo. En el paso final, los aproximadamente 50.000 compuestos completos principales de REAL Space se acoplan con parámetros o métodos de acoplamiento más elaborados y precisos, y los candidatos mejor clasificados se filtran en busca de novedad, diversidad y variedad de propiedades similares a las de los fármacos deseadas. En el posprocesamiento, se seleccionan entre 50 y 500 mejores compuestos para su síntesis y prueba. Nuestra evaluación sugiere que combinar sintetizadores con los andamios y cubrirlos con grupos mínimos ficticios en el algoritmo V-SYNTHES es un requisito crítico para predicciones óptimas de fragmentos porque los grupos reactivos de bloques de construcción y andamios a menudo crean interacciones fuertes, aunque falsas, que no están presentes. en la molécula completa. Otra parte importante del algoritmo es la evaluación de la postura de unión del fragmento en el objetivo, que prioriza aquellos golpes con tapas mínimas apuntadas a una región del bolsillo donde el fragmento tiene espacio para crecer.

Una descripción general del algoritmo V-SYNTHES que permite la detección efectiva de más de 31 mil millones de compuestos en el espacio REAL o espacios químicos incluso más grandes, mientras se realiza la enumeración y el acoplamiento de solo pequeñas fracciones de moléculas. El algoritmo, ilustrado aquí utilizando una reacción de dos componentes basada en una estructura de sulfonamida con sintones R1 y R2, se puede aplicar a cientos de reacciones optimizadas de dos componentes, tres componentes o más componentes repitiendo iterativamente los pasos 3 y 4 hasta que estén completamente. Se obtienen moléculas enumeradas que se ajustan óptimamente al bolsillo objetivo. DOLORES, compuestos de interferencia del ensayo pan.

V-SYNTHES, aplicado inicialmente para descubrir nuevos quimiotipos de antagonistas del receptor de cannabinoides CB2, ha mostrado una tasa de acierto del 23 % para ligandos submicromolares, lo que superó cinco veces la tasa de acierto del VLS estándar, al tiempo que requirió aproximadamente 100 veces menos recursos computacionales26. En el mismo estudio se encontró una tasa de aciertos similar para la detección de la quinasa ROCK1, con un acierto en el rango nanomolar bajo26. V-SYNTHES se está aplicando a otros objetivos terapéuticamente relevantes con estructuras de bolsillo bien definidas.

BioSolveIT ha implementado un enfoque similar, el acoplamiento espacial químico, hasta ahora para reacciones de dos componentes67. Este método es aún más rápido, ya que acopla fragmentos de bloques de construcción individuales y luego los enumera con andamios y otros sintetizadores. Sin embargo, existen compensaciones por la velocidad adicional: el acoplamiento de fragmentos más pequeños sin andamios es menos confiable y sus grupos reactivos a menudo tienen propiedades diferentes a las del producto de reacción. Esto puede introducir fuertes interacciones con el receptor que son irrelevantes para el compuesto final y pueden desviar la selección de fragmentos. Esto es especialmente cierto para las reacciones de cicloadicción y los andamios de tres componentes, que necesitan una mayor validación en el acoplamiento espacial químico.

Además de respaldar la abundancia, la diversidad química y la calidad potencial de los resultados, los enfoques modulares basados ​​en estructuras son especialmente eficaces para identificar resultados con una novedad química sólida, ya que (1) no dependen de la información de los ligandos existentes y (2) identifican ligandos que nunca antes habían sido sintetizados. Este es un factor importante para garantizar la patentabilidad de la materia química de los compuestos exitosos y las series principales que surgen del análisis a gran escala. Además, miles de análogos fácilmente sintetizables garantizan un amplio SAR por catálogo para los mejores éxitos, lo que, por ejemplo, permitió una mejora de potencia y selectividad aproximadamente 100 veces mayor para los éxitos de CB2 V-SYNTHES26. La disponibilidad de extensiones de espacio químico multicapa bajo demanda (por ejemplo, respaldadas por bloques de construcción MADE47) también puede agilizar en gran medida los siguientes pasos en la optimización de clientes potenciales a través de 'MedChem virtual', reduciendo así la síntesis personalizada extensa.

En la era del reconocimiento facial basado en IA, ChatGPT y AlphaFold68, existe un enorme interés en las aplicaciones de enfoques de DL basados ​​en datos en el descubrimiento de fármacos, desde la identificación de objetivos hasta la optimización de clientes potenciales y la medicina traslacional (como se revisa en las referencias 69,70,71). ).

Los enfoques basados ​​en datos tienen una larga historia en el descubrimiento de fármacos, en la que algoritmos de aprendizaje automático, como la máquina de vectores de soporte, el bosque aleatorio y las redes neuronales, se han utilizado ampliamente para predecir las propiedades de los ligandos y las actividades en los objetivos, aunque con resultados mixtos. Los modelos cuantitativos precisos de relación estructura-propiedad (QSPR) pueden predecir propiedades fisicoquímicas (por ejemplo, solubilidad y lipofilicidad) y farmacocinéticas (por ejemplo, biodisponibilidad y penetración de la barrera hematoencefálica), en las que se encuentran disponibles conjuntos de datos experimentales grandes y amplios para el entrenamiento de modelos y seguir creciendo72,73,74. El aprendizaje automático también se implementa en muchos algoritmos SAR cuantitativos (QSAR)75, en los que el conjunto de entrenamiento y los modelos resultantes se centran en un objetivo determinado y una estructura química, lo que ayuda a guiar la afinidad del cliente potencial y la optimización de la potencia. También se han sugerido métodos basados ​​en extensos conjuntos de datos de unión de ligando-objetivo, agrupaciones de similitudes químicas y enfoques basados ​​en redes para la reutilización de fármacos76,77.

La llegada de la DL lleva los modelos basados ​​en datos al siguiente nivel, permitiendo el análisis de conjuntos de datos mucho más grandes y diversos, al mismo tiempo que se derivan relaciones no lineales más complicadas, con una vasta literatura que describe metodologías y aplicaciones específicas de la DL para el descubrimiento de fármacos27,70. Por su naturaleza de "aprender de ejemplos", la IA requiere conjuntos de datos de ligandos completos para entrenar los modelos predictivos. Para QSPR, se han acumulado grandes bases de datos públicas y privadas, con varias propiedades como solubilidad, lipofilicidad o indicadores in vitro de biodisponibilidad oral y permeabilidad cerebral medidas experimentalmente para muchos miles de compuestos diversos, lo que permite predecir estas propiedades en una amplia gama de nuevos compuestos. compuestos.

Sin embargo, la calidad de los modelos QSAR difiere para las diferentes clases de objetivos dependiendo de la disponibilidad de datos, y los mayores avances se lograron para la superfamilia de quinasas y los GPCR aminérgicos. Un reciente IDG-DREAM Drug-Kinase Binding Prediction Challenge con la participación de más de 200 expertos proporcionó una referencia imparcial de los mejores modelos ML QSAR. Los principales modelos predictivos en esta evaluación ciega incluyeron el aprendizaje del núcleo, el aumento de gradiente y los algoritmos basados ​​en DL. El modelo de mayor rendimiento (del equipo QED) utilizó una regresión del núcleo, similitud de secuencia de proteínas y valores de afinidad de más de 60.000 pares compuesto-quinasa entre 13.608 compuestos y 527 quinasas de las bases de datos ChEMBL79 y Drug Target Commons80 como datos de entrenamiento. El mejor modelo DL utilizó hasta 900.000 puntos de datos experimentales de unión de ligandos para el entrenamiento, pero aún estaba por detrás del modelo de núcleo, mucho más simple, en rendimiento. Los mejores modelos lograron un coeficiente de rango de Spearman de 0,53 con un error cuadrático medio de 0,95 para los valores de pKd predichos versus experimentales en el conjunto de desafío. Se descubrió que dicha precisión está a la par con la precisión y la recuperación de los ensayos experimentales de un solo punto para la inhibición de quinasas, y puede ser útil en la detección de los resultados iniciales de quinasas menos exploradas y para guiar la optimización de los clientes potenciales. Sin embargo, tenga en cuenta que la familia de las quinasas es única, ya que es la clase más grande de más de 500 objetivos, todos los cuales poseen bolsillos de unión ortostéricos similares y comparten una alta selectividad cruzada. La distante segunda familia con reactividad cruzada sistemática comprende alrededor de 50 GPCR aminérgicos, mientras que otras familias de GPCR y otras familias de proteínas con reactividad cruzada son mucho más pequeñas. Aún queda por probar el rendimiento y la generalización de los métodos de ML y DL para estos y otros objetivos.

El desarrollo de modelos ampliamente generalizables o incluso universales es la aspiración clave del descubrimiento de fármacos impulsado por la IA. Una de las direcciones aquí es extraer modelos generales de afinidades de unión (funciones de puntuación de unión) a partir de datos sobre actividades de ligando conocidas y estructuras 3D de proteína-ligando correspondientes, por ejemplo, recopilados en la base de datos PDBbind81 u obtenidos del acoplamiento. Dichos modelos exploran varios enfoques para representar las arquitecturas de redes y datos, incluidos modelos convolucionales de gráficos espaciales82,83, redes neuronales convolucionales profundas 3D84,85 o sus combinaciones86. Sin embargo, un estudio reciente encontró que, independientemente de la arquitectura de la red neuronal, una descripción explícita de las interacciones intermoleculares no covalentes en los complejos PDBbind no proporciona ninguna ventaja estadística en comparación con aproximaciones más simples de solo ligando o solo receptor que omiten las interacciones87. Por lo tanto, el buen desempeño de los modelos DL basados ​​en PDBbind se basa en memorizar ligandos y receptores similares, en lugar de capturar información general sobre su unión. Una posible explicación para este fenómeno es que la base de datos PDBbind no tiene una presentación adecuada del "espacio negativo", es decir, ligandos con patrones de interacción subóptimos para imponer el entrenamiento.

Este percance ejemplifica la necesidad de una mejor comprensión del comportamiento de los modelos DL y su dependencia de los datos de entrenamiento, lo cual es ampliamente reconocido en la comunidad de IA. Se ha demostrado que los modelos DL, especialmente los basados ​​en conjuntos de datos limitados que carecen de datos negativos, son propensos al sobreentrenamiento y al rendimiento espurio, lo que a veces conduce a clases enteras de modelos considerados "inútiles"88 o gravemente sesgados por factores subjetivos que definen el conjunto de datos de entrenamiento89. Se están desarrollando herramientas estadísticas para definir el rango de aplicabilidad y validar cuidadosamente el desempeño de los modelos. Uno de los conceptos propuestos es el marco de previsibilidad, computabilidad y estabilidad para la "ciencia de datos verídicos"90. Los líderes de la comunidad de IA han identificado específicamente la selección adecuada de datos de calidad como el principal requisito para cerrar la "brecha de producción", o la incapacidad de los modelos de aprendizaje automático para tener éxito cuando se implementan en el mundo real, por lo que se requiere un análisis de datos. enfoque centrado en la IA91,92. También ha habido intentos de desarrollar herramientas para hacer que la IA sea "explicable", es decir, capaz de formular algunas tendencias generales en los datos, específicamente en las aplicaciones de descubrimiento de fármacos93.

A pesar de estos desafíos y limitaciones, la IA ya está comenzando a tener un efecto sustancial en el descubrimiento de fármacos, y los primeros candidatos a fármacos basados ​​en IA entran en los estudios preclínicos y clínicos. En el caso de las quinasas, se informó que los compuestos impulsados ​​por la IA son inhibidores in vivo potentes y eficaces del receptor tirosina quinasa DDR1, que participa en la fibrosis9. Se han anunciado ensayos clínicos de fase I para ISM001-055 (también conocido como INS018_055) para el tratamiento de la fibrosis pulmonar idiopática10, aunque no se ha revelado la identidad del compuesto ni su objetivo. En el caso de los GPCR, recientemente se han iniciado ensayos clínicos con compuestos impulsados ​​por IA dirigidos a los receptores 5-HT1A, 5-HT1A–5-HT2A dual y A2A, lo que brinda mayor apoyo al concepto de descubrimiento de fármacos impulsado por IA. Estas primeras historias de éxito provienen de familias de quinasas y GPCR con una farmacología ya bien estudiada, y los compuestos muestran una estrecha similitud química con estructuras conocidas de alta afinidad94. Es importante que la próxima generación de candidatos a fármacos de DL mejore en cuanto a novedad y rango de aplicabilidad.

Como se analizó anteriormente, los enfoques basados ​​en la física y los datos tienen distintas ventajas y limitaciones a la hora de predecir la potencia del ligando. Las predicciones de acoplamiento basadas en estructuras se pueden generalizar naturalmente a cualquier objetivo con estructuras 3D y pueden ser más precisas, especialmente a la hora de eliminar los falsos positivos como principal desafío de la detección. Por el contrario, los métodos basados ​​en datos pueden funcionar en lugar de estructuras y pueden ser más rápidos, especialmente con aceleración de GPU, aunque tienen dificultades para generalizar más allá de las clases de objetivos ricas en datos. Por lo tanto, existen numerosos esfuerzos en curso para combinar enfoques basados ​​en la física y en datos de manera sinérgica en general95, y en el descubrimiento de fármacos específicamente96.

En los enfoques de detección virtual, un uso sinérgico del acoplamiento basado en la física con funciones de puntuación basadas en datos puede resultar muy beneficioso. Además, si las funciones de puntuación basadas en física y en datos son relativamente independientes y ambas generan enriquecimiento en las bibliotecas enfocadas seleccionadas, su combinación puede reducir las tasas de falsos positivos y mejorar la calidad de los resultados. Esta sinergia se refleja en los últimos resultados del 3DR Grand Challenge 4 para predicciones del ligando IC5059, en los que los principales métodos que utilizaron una combinación de puntuación basada en la física y ML superaron a aquellos que no utilizaron ML. En el futuro, una evaluación comparativa exhaustiva de los enfoques híbridos, de aprendizaje automático y basados ​​en la física será un foco clave de una nueva Evaluación Crítica de Experimentos Computacionales de Búsqueda de Resultados (CACHE), que evaluará cinco escenarios específicos relevantes para el descubrimiento y la optimización prácticos de resultados y oportunidades97.

A un nivel más profundo, los resultados del acoplamiento preciso basado en la física (además de los datos experimentales, por ejemplo, de PDBbind81) se pueden utilizar para entrenar gráficos generalizados o modelos DL 3D que predicen la afinidad ligando-receptor. Esto ayudaría a expandir notablemente el conjunto de datos de entrenamiento y equilibrar los ejemplos positivos y negativos (enlace subóptimo), lo cual es importante para evitar los problemas de sobreentrenamiento descritos en la ref. 87. Estas funciones de puntuación 3D basadas en DL para predecir la afinidad de unión molecular de un complejo proteína-ligando acoplado se están desarrollando y comparando, más recientemente RTCNN98, aunque su utilidad práctica aún está por demostrar.

Para ampliar el rango de aplicabilidad del acoplamiento basado en estructuras a aquellos objetivos que carecen de estructuras de alta resolución, también es tentador utilizar modelos 3D AlphaFold2 (refs. 99,100) o RosettaFold101 derivados de IA, que ya muestran utilidad en muchas aplicaciones, incluidas las proteínas. acoplamiento de proteínas y proteínas-péptidos102. Los modelos de homología tradicionales basados ​​en una estrecha similitud de proteínas, especialmente cuando se refinan con ligandos conocidos103, se han utilizado en el acoplamiento de moléculas pequeñas y en el cribado virtual104, por lo que se espera que AlphaFold2 amplíe aún más el alcance del modelado estructural y su precisión. En un informe reciente, los modelos AlphaFold2, complementados con otros enfoques de IA, ayudaron a identificar un inhibidor de molécula pequeña de la quinasa 20 dependiente de ciclina (CDK20), aunque con una afinidad modesta de 8,9 μM (ref. 105). Sin embargo, una evaluación comparativa más general del rendimiento de los modelos AlphaFold2 en la detección virtual arroja resultados mixtos. En un punto de referencia centrado en objetivos con estructuras cristalinas existentes, la mayoría de los modelos AlphaFold2 tuvieron que limpiarse de bucles que bloqueaban el bolsillo de unión y/o aumentarse con iones conocidos u otros cofactores para lograr un enriquecimiento razonable de los impactos106. Para los casos más prácticos de objetivos que carecen de estructuras experimentales, especialmente para clases de objetivos con homologías estructurales menos obvias en el bolsillo de unión al ligando, el rendimiento de los modelos AlphaFold2 en el acoplamiento de moléculas pequeñas mostró resultados decepcionantes en evaluaciones recientes para GPCR y objetivos antibacterianos107,108 . El enfoque AphaFill109 desarrollado recientemente para "trasplantar" cofactores y ligandos de moléculas pequeñas de estructuras PDB a modelos homólogos AlphaFold2 puede ayudar potencialmente a validar y optimizar estos modelos, aunque se están realizando más evaluaciones de su utilidad para el acoplamiento y la detección virtual.

Para acelerar el análisis virtual de bibliotecas químicas ultragrandes, varios grupos han sugerido enfoques iterativos híbridos, en los que los resultados del acoplamiento basado en estructuras de un subconjunto de bibliotecas dispersas se utilizan para entrenar modelos de ML, que luego se utilizan para filtrar toda la biblioteca para reducir aún más su tamaño. Estos métodos, incluidos MolPal25, Active Learning110 y DeepDocking111, reportan una reducción de entre 14 y 100 en el costo computacional para bibliotecas de 1.400 millones de compuestos, aunque no está claro cómo se escalarían a espacios químicos de rápido crecimiento.

Debemos enfatizar aquí que las funciones de puntuación en los algoritmos de acoplamiento rápido y los modelos de ML están diseñadas y entrenadas principalmente para separar de manera efectiva los potenciales objetivos de unión de los no vinculantes, aunque no son muy precisos en las predicciones de afinidades o potencias de unión. Para obtener predicciones de potencia más precisas, la biblioteca enfocada más pequeña de aglutinantes candidatos seleccionados por la IA inicial o la evaluación basada en el acoplamiento se puede analizar y clasificar más a fondo utilizando herramientas basadas en la física más elaboradas, incluidos métodos de perturbación de energía libre para energía libre relativa112 y absoluta113,114,115. de unión al ligando. Aunque estos métodos son mucho más lentos, la utilización de cálculos acelerados por GPU28 tiene potencial para su aplicación más amplia en el posprocesamiento en campañas de selección virtual para enriquecer aún más las tasas de acierto de los candidatos de alta afinidad (Fig. 2), así como en la optimización de clientes potenciales. etapas.

La llegada de métodos rápidos y prácticos para detectar espacios químicos a gigaescala para el descubrimiento de fármacos estimula un mayor crecimiento de estos espacios bajo demanda, lo que respalda una mejor diversidad y la calidad general de los resultados y las pistas identificadas. Desarrollada específicamente para la detección de V-SYNTHES, la extensión xREAL de Enamine REAL Space ahora comprende 173 mil millones de compuestos116, y puede ampliarse aún más a 1015 compuestos y más aprovechando un conjunto de bloques de construcción aún mayor (por ejemplo, a 680 millones de compuestos de construcción MADE). bloques47), al incluir estructuras de cuatro o cinco componentes y al utilizar nuevas químicas similares a clics a medida que se descubren. Las pruebas en el mundo real del REAL Space mejorado con MADE y otros espacios químicos comerciales y patentados permitirán una evaluación más amplia de su sintetizabilidad y utilidad general38,117,118. Paralelamente, se pueden construir bibliotecas ultragrandes especializadas para estructuras importantes subrepresentadas en espacios bajo demanda de uso general; por ejemplo, la detección de una biblioteca virtual de 75 millones de tetrahidropiridinas fácilmente sintetizables produjo recientemente potentes agonistas para el receptor 5-HT2A119.

Un mayor crecimiento del tamaño y la diversidad del espacio químico bajo demanda también se ve respaldado por el reciente desarrollo de nuevas reacciones robustas para el ensamblaje de bloques de construcción mediante un clic. Además de la química de clic de cicloadición de azida-alquino "clásica"120, reconocida con el Premio Nobel de Química de 2022121, y las reacciones de clic optimizadas que incluyen SuFEx122, desarrollos más recientes como el acoplamiento cruzado doblemente descarboxilativo electrocatalizado con Ni123 son prometedores. Otras reacciones de formación de carbono-carbono utilizan boronatos de ácido metiliminodiacético para los acoplamientos Csp2-Csp2124 y, más recientemente, boronatos de ácido tetrametil N-metiliminodiacético125 para la formación de enlaces estereoespecíficos Csp3-C. Cada una de estas reacciones aplicadas de forma iterativa puede generar nuevos espacios químicos bajo demanda de miles de millones de compuestos diversos que operan con un número limitado de componentes básicos. De manera similar al ensamblaje automático de aminoácidos utilizado habitualmente en la síntesis de péptidos, se podrían llevar a cabo procesos totalmente automatizados con robots capaces de producir una biblioteca de compuestos similares a fármacos a pedido utilizando combinaciones de unos pocos miles de componentes básicos diversos126,127,128. Estas máquinas ya están funcionando, aunque el cuello de botella sigue siendo la ampliación de la producción de miles de componentes básicos especializados.

El desarrollo de espacios químicos generativos más robustos también puede respaldarse con nuevos enfoques computacionales en química sintética, por ejemplo, predicciones de nuevas secuencias de reacciones iterativas129 o rutas sintéticas y viabilidad a partir de análisis retrosintéticos basados ​​en DL130. En los modelos generativos, las predicciones de sintetizabilidad se pueden combinar con predicciones de potencia y otras propiedades para alcanzar niveles más altos de diseño químico automatizado131. Así, recientemente se utilizaron redes generativas adversarias combinadas con aprendizaje por refuerzo (GAN-RL) para predecir la viabilidad sintética, la novedad y la actividad biológica de los compuestos, lo que permitió el ciclo iterativo de optimización, síntesis y prueba in silico de los ligandos in vitro50,132. Cuando se aplican dentro de un conjunto de reacciones bien establecidas y clases de objetivos farmacológicamente explorados, estos enfoques ya producen resultados y pistas útiles, que conducen a candidatos clínicos50,132. Sin embargo, aún está por verse el potencial más amplio de los conceptos de diseño químico automatizado y la síntesis robótica en el descubrimiento de fármacos.

Aunque la evaluación comparativa ciega y las recientes historias exitosas de detección prospectiva para el creciente número de objetivos respaldan la utilidad de las herramientas computacionales modernas, existen clases enteras de objetivos desafiantes, en los que no se espera que los enfoques de detección in silico existentes funcionen muy bien por sí solos. Algunos de los casos más difíciles son objetivos con bolsas crípticas o poco profundas que tienen que abrirse o someterse a un ajuste inducido sustancial para enganchar al ligando, como se encuentra a menudo cuando se apunta a sitios alostéricos, por ejemplo, en quinasas o GPCR, o interacciones proteína-proteína en vías de señalización. .

Aunque los enfoques de bioinformática y dinámica molecular pueden ayudar a detectar y analizar bolsas alostéricas y crípticas133, las herramientas computacionales por sí solas a menudo son insuficientes para respaldar el descubrimiento de ligandos para sitios tan desafiantes. Sin embargo, los focos crípticos y poco profundos se han manejado con bastante éxito mediante enfoques de descubrimiento de fármacos basados ​​en fragmentos, que comienzan con la detección experimental de la unión de pequeños fragmentos. Los resultados iniciales se encuentran mediante métodos muy sensibles, como BIACORE, RMN, rayos X134,135 y potencialmente microscopía crioelectrónica136, para detectar de manera confiable una unión débil, generalmente en el rango de 10 a 100 μM. La detección inicial del objetivo también se puede realizar con fragmentos decorados con una ojiva química que permite la unión covalente impulsada por la proximidad de un ligando de baja afinidad137. En cualquier caso, la elaboración de fragmentos iniciales con ligandos de alta afinidad es el cuello de botella clave del descubrimiento de fármacos basado en fragmentos, que requiere un esfuerzo importante que implica "hacer crecer" el fragmento o unir dos o más fragmentos. Este suele ser un proceso iterativo que implica el diseño y la síntesis de ligandos personalizados y que puede llevar muchos años134,138. Al mismo tiempo, el cribado virtual basado en estructuras puede ayudar a elaborar computacionalmente los fragmentos para que coincidan con la conformación identificada experimentalmente del bolsillo de unión objetivo. De manera más rentable, este enfoque se puede aplicar cuando los fragmentos se identifican a partir de los bloques de construcción del espacio bajo demanda o sus análogos cercanos para una fácil elaboración en el mismo espacio bajo demanda139.

Los ejemplos recientes de enfoques de diseño computacional híbridos basados ​​en fragmentos dirigidos a inhibidores del SARS-CoV-2 resaltan los desafíos que presentan dichos objetivos y permiten comparaciones directas con VLS ultragrandes. Uno de los estudios tuvo como objetivo la enzima de macrodominio conservada NSP3 (Mac1) del SARS-CoV-2, que es un objetivo crítico para la patogénesis y la letalidad del virus. Sobre la base de la detección cristalográfica de los fragmentos de baja afinidad (180 μM) que se unen débilmente a Mac1 (ref. 139), la fusión de los fragmentos identificó un acierto de 1 μM, rápidamente optimizado mediante síntesis de catálogo a una ventaja de 0,4 μM140. En el mismo estudio, una exploración a ultraescala de 400 millones de bases de datos REAL identificó más de 100 nuevos quimiotipos diversos de ligandos similares a fármacos, con una optimización de SAR por catálogo de seguimiento que arrojó una ventaja de 1,7 μM140. Para la proteasa principal Mpro del SARS-CoV-2, la iniciativa COVID Moonshot publicó resultados de detección cristalográfica de 1.500 pequeños fragmentos con 71 impactos unidos en diferentes subbolsillos del sitio activo poco profundo, aunque ninguno de ellos mostró inhibición in vitro de la proteasa incluso a 100 μM (ref.141). Numerosos grupos colaboraron en el diseño computacional de seguimiento y la detección de fragmentos fusionados y en crecimiento ayudaron a descubrir varias series de SAR, incluido un inhibidor de Mpro no covalente con una CI50 enzimática de 21 μM. Una mayor optimización mediante enfoques computacionales basados ​​en estructuras e impulsados ​​por IA, que utilizaron más de 10 millones de componentes básicos de MADE Enamine, condujo al descubrimiento de candidatos preclínicos con IC50 basado en células en el rango de aproximadamente 100 nM, acercándose a la potencia de nirmatrelvir65 . La enorme escala, urgencia y complejidad de este esfuerzo Moonshot con más de 2.400 compuestos sintetizados a pedido y medidos en más de 10.000 ensayos no tienen precedentes y esto resalta los desafíos del diseño de novo de inhibidores no covalentes de Mpro.

Más allá de la iniciativa Moonshot, una avalancha de esfuerzos de detección virtual arrojó resultados en su mayoría decepcionantes62; por ejemplo, el medicamento contra la malaria ebselen, que se propuso en una de las primeras pruebas de detección virtuales142, fracasó en los ensayos clínicos. Sin embargo, la mayoría de estos estudios examinaron conjuntos de ligandos pequeños centrados en reutilizar fármacos existentes, carecieron de soporte experimental y utilizaron la primera estructura de Mpro resuelta en un complejo de ligando covalente (PDB ID: 6LU7) que no era óptimo para acoplar moléculas no covalentes142.

En comparación, varios estudios que examinaron bibliotecas ultragrandes pudieron identificar inhibidores de Mpro no covalentes de novo en el rango de 10 a 100 μM24,62,63,143, mientras que probaron experimentalmente solo unos pocos cientos de compuestos sintetizados bajo demanda. Uno de estos estudios profundizó en estos débiles aciertos de VLS probando sus análogos bajo demanda de Enamine, revelando una ventaja con IC50 = 1 μM en ensayos basados ​​en células y validando cristalográficamente su unión no covalente63. Otro estudio basado en una estructura cocristalina no covalente posterior y más adecuada de Mpro (PDB ID: 6W63) utilizó una estrategia de optimización y acoplamiento ultragrande para descubrir compuestos líderes de 38 nM aún más potentes64. Tenga en cuenta que, aunque los resultados de las evaluaciones iniciales ultragrandes para Mpro fueron modestos, estuvieron a la par con los esfuerzos mucho más elaborados y costosos del enfoque híbrido Moonshot, con una simple optimización bajo demanda que condujo a candidatos preclínicos de calidad similar. Estos ejemplos sugieren que incluso para zonas poco profundas y desafiantes, la detección virtual basada en estructuras a menudo puede proporcionar una alternativa viable cuando se realiza a gigaescala y está respaldada por estructuras precisas, suficientes pruebas y esfuerzos de optimización.

Con todos los desafíos y advertencias, la capacidad emergente de las herramientas in silico para aprovechar de manera efectiva la enorme abundancia y diversidad de espacios químicos a pedido similares a los de los medicamentos en las etapas clave de "objetivo a impacto, liderazgo a clínica", hace que Es tentador pedir la transformación del ecosistema DDD de asistido por computadora a impulsado por computadora144 (Fig. 4). En la etapa temprana de identificación de resultados, los enfoques de detección virtual a ultraescala, tanto basados ​​en estructuras como en inteligencia artificial, se están generalizando al proporcionar puntos de entrada rápidos y rentables a las campañas de descubrimiento de fármacos. En la etapa de éxito, las herramientas de predicción de potencia más elaboradas, como la perturbación de energía libre y el QSAR basado en IA, a menudo guían la optimización racional de la potencia del ligando. Más allá de la potencia y selectividad del objetivo, se utilizan habitualmente varias herramientas computacionales basadas en datos en la optimización multiparamétrica de la serie de cables que incluye propiedades ADMET y PK. Es de destacar que los espacios químicos de más de 1010 compuestos diversos probablemente contengan millones de resultados iniciales para cada objetivo20 (Cuadro 1), miles de pistas potentes y selectivas y, con cierta química medicinal limitada en el mismo espacio químico altamente manejable, candidatos a fármacos. listo para estudios preclínicos. Para aprovechar este potencial, las herramientas computacionales deben volverse más sólidas y estar mejor integradas en el proceso de descubrimiento general para garantizar su impacto al traducir los resultados iniciales en desarrollo preclínico y clínico.

Comparación esquemática del HTS estándar más un canal de descubrimiento personalizado basado en síntesis versus el canal computacional. Este último se basa en espacios químicos virtuales generativos o bajo demanda de fácil acceso, así como en herramientas computacionales basadas en estructuras y en inteligencia artificial que agilizan cada paso del proceso de descubrimiento de fármacos.

No debemos olvidar aquí que cualquier modelo computacional, por útil o preciso que sea, nunca puede garantizar que todas las predicciones sean correctas. En la práctica, las mejores campañas de detección virtual dan como resultado entre el 10% y el 40% de los resultados de los candidatos confirmados en la validación experimental, mientras que las mejores predicciones de afinidad utilizadas en la optimización rara vez tienen una precisión mejor que 1 kcal mol-1 de error cuadrático medio. Se aplican limitaciones similares a los modelos computacionales actuales que predicen las propiedades ADMET y PK. Por lo tanto, las predicciones computacionales siempre necesitan validación experimental en ensayos sólidos in vitro e in vivo en cada paso del proceso. Al mismo tiempo, las pruebas experimentales de predicciones también proporcionan datos que pueden contribuir a mejorar la calidad de los modelos ampliando sus conjuntos de datos de entrenamiento, especialmente para las predicciones de propiedades del ligando. Por lo tanto, los modelos QSPR basados ​​en DL se beneficiarán enormemente de la acumulación adicional de datos en ensayos de permeabilidad celular como CACO-2 y MDCK, así como de nuevas tecnologías avanzadas como órganos en un chip u organoides funcionales para proporcionar mejores estimaciones. de las propiedades ADMET y PK sin engorrosos experimentos in vivo. La capacidad de entrenar modelos ADMET y PK con datos de ensayos in vitro que representen las especies más relevantes para el desarrollo de fármacos (normalmente ratón, rata y ser humano) también ayudaría a abordar la variabilidad de las especies como un desafío importante para el éxito de los estudios traslacionales. Todo esto crea un círculo virtuoso para mejorar los modelos computacionales hasta el punto en que puedan impulsar la selección de compuestos para la mayoría de los puntos finales de DDD. Cuando se combina con pruebas in vitro más precisas, esto puede reducir y eventualmente eliminar los requisitos de pruebas en animales (como indicó recientemente la FDA)145.

La construcción de tuberías híbridas in silico-in vitro con fácil acceso al enorme espacio químico bajo demanda en todas las etapas del proceso de gen a plomo puede ayudar a generar abundantes reservas de diversos compuestos de plomo con potencia, selectividad y propiedades ADMET y PK óptimas. , lo que resulta en un menor compromiso en la optimización multiparamétrica para los candidatos clínicos. La ejecución de procesos computacionales tan ricos en datos requiere herramientas generales de gestión de datos para el descubrimiento de fármacos, muchas de las cuales se implementan en centros DDD farmacéuticos y académicos146,147. La construcción de canales computacionales también ayudará a revelar eslabones débiles o faltantes, en los que pueden ser necesarios nuevos enfoques y datos adicionales para generar modelos mejorados, ayudando así a llenar los vacíos computacionales restantes en el canal DDD. Siempre que esta integración sistemática continúe, el descubrimiento de ligandos por computadora tiene un gran potencial para reducir las barreras de entrada para generar moléculas para numerosas líneas de investigación, ya sean sondas in vivo para objetivos nuevos y poco estudiados148, polifarmacología y señalización pluridimensional, o candidatos a fármacos para enfermedades raras y medicina personalizada.

Austin, D. & Hayford, T. Investigación y desarrollo en la industria farmacéutica. CBO https://www.cbo.gov/publication/57126 (2021).

Sun, D., Gao, W., Hu, H. y Zhou, S. ¿Por qué el 90% del desarrollo de fármacos clínicos fracasa y cómo mejorarlo? Acta Farmacéutica. Pecado. B 12, 3049–3062 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Bajorath, J. Descubrimiento de fármacos asistido por computadora. F1000Res. 4, F1000 Facultad Rev-1630 (2015).

Artículo de Google Scholar

Van Drie, JH Diseño de fármacos asistido por ordenador: los próximos 20 años. J. Computación. Ayudó a Mol. Des. 21, 591–601 (2007).

Artículo ADS CAS PubMed Google Scholar

Talele, TT, Khedkar, SA y Rigby, AC Aplicaciones exitosas del descubrimiento de fármacos asistido por computadora: trasladar los fármacos del concepto a la clínica. actual. Arriba. Medicina. Química. 10, 127-141 (2010).

Artículo CAS PubMed Google Scholar

Macalino, SJY, Gosu, V., Hong, S. y Choi, S. Papel del diseño de fármacos asistido por computadora en el descubrimiento de fármacos modernos. Arco. Farmacéutico. Res. 38, 1686-1701 (2015).

Artículo CAS Google Scholar

Sabe, VT y cols. Tendencias actuales en el diseño de fármacos asistido por computadora y lo más destacado de los fármacos descubiertos mediante técnicas computacionales: una revisión. EUR. J. Med. Química. 224, 113705 (2021).

Artículo CAS PubMed Google Scholar

Jayatunga, MK, Xie, W., Ruder, L., Schulze, U. y Meier, C. IA en el descubrimiento de fármacos de molécula pequeña: una ola que se avecina. Nat. Rev. Descubrimiento de Drogas. 21, 175-176 (2022).

Artículo CAS PubMed Google Scholar

Zhavoronkov, A. y col. El aprendizaje profundo permite la identificación rápida de potentes inhibidores de la quinasa DDR1. Nat. Biotecnología. 37, 1038-1040 (2019). Este estudio afirma el descubrimiento de un candidato principal en solo 21 días, utilizando IA generativa, síntesis y pruebas in vitro e in vivo de los compuestos.

Artículo CAS PubMed Google Scholar

Biblioteca Nacional de Medicina de EE. UU. ClinicalTrials.gov https://clinicaltrials.gov/ct2/show/NCT05154240#contactlocation (2022).

Schrödinger. Schrödinger anuncia la autorización de la FDA para la solicitud de un nuevo fármaco en investigación para SGR-1505, un inhibidor de MALT1. Schrödinger https://ir.schrodinger.com/node/8621/pdf (2022). Este comunicado de prensa afirma que la combinación de métodos basados ​​en la física y de aprendizaje automático permitió una selección computacional de 8,2 mil millones de compuestos y la selección de un candidato clínico después de 10 meses y solo se sintetizaron 78 moléculas.

Jones, N. Cristalografía: secretos atómicos. Naturaleza 505, 602–603 (2014).

Artículo ADS CAS PubMed Google Scholar

Liu, W. y col. Cristalografía seriada de femtosegundos de receptores acoplados a proteína G. Ciencia 342, 1521-1524 (2013).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Nannenga, BL y Gonen, T. El método crio-EM de difracción de electrones en microcristales (MicroED). Nat. Métodos 16, 369–379 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Fernandez-Leiro, R. & Scheres, SH Desentrañar macromoléculas biológicas con microscopía crioelectrónica. Naturaleza 537, 339–346 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Renaud, J.-P. et al. Cryo-EM en el descubrimiento de fármacos: logros, limitaciones y perspectivas. Nat. Rev. Descubrimiento de Drogas. 17, 471–492 (2018).

Artículo CAS PubMed Google Scholar

Congreve, M., de Graaf, C., Swain, NA y Tate, CG Impacto de las estructuras de GPCR en el descubrimiento de fármacos. Celda 181, 81–91 (2020).

Artículo CAS PubMed Google Scholar

Santos, R. et al. Un mapa completo de objetivos de fármacos moleculares. Nat. Rev. Descubrimiento de Drogas. 16, 19-34 (2017).

Artículo CAS PubMed Google Scholar

Grygorenko, OO et al. Generar un espacio químico multimillonario de compuestos de detección de fácil acceso. iCiencia 23, 101681 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Lyu, J. y col. Base de biblioteca ultragrande para descubrir nuevos quimiotipos. Naturaleza 566, 224-229 (2019). Este es un estudio de acoplamiento ultragrande que también evaluó cuidadosamente las ventajas y riesgos potenciales de expandir el espacio químico.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Stein, RM y cols. Descubrimiento virtual de ligandos del receptor de melatonina para modular los ritmos circadianos. Naturaleza 579, 609–614 (2020). Este estudio muestra un acoplamiento ultragrande que resultó en aciertos subnanomolares para un GPCR.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Alon, A. y col. Las estructuras del receptor sigma2 permiten el acoplamiento para el descubrimiento de ligandos bioactivos. Naturaleza 600, 759–764 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Una plataforma de descubrimiento de fármacos de código abierto permite pantallas virtuales ultragrandes. Naturaleza 580, 663–668 (2020). Este estudio muestra un filtrado de biblioteca iterativo como primer enfoque para acelerar el cribado virtual de gran tamaño.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Un enfoque múltiple dirigido a las proteínas del SARS-CoV-2 mediante un cribado virtual de gran tamaño. iCiencia 24, 102021 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Graff, DE, Shakhnovich, EI y Coley, CW Aceleración de la detección virtual de alto rendimiento mediante el aprendizaje activo basado en grupos moleculares. Química. Ciencia. 12, 7866–7881 (2021). Este estudio introduce la aceleración del cribado ultragrande mediante la combinación iterativa de DL y acoplamiento.

Artículo CAS PubMed PubMed Central Google Scholar

Sadybekov, AA et al. Descubrimiento de ligandos basado en sintetizadores en bibliotecas virtuales de más de 11 mil millones de compuestos. Naturaleza 601, 452–459 (2022). Este estudio presenta el concepto modular para la detección de espacios a gigaescala, V-SYNTHES, y valida su rendimiento en objetivos de GPCR y quinasa.

Artículo ADS CAS PubMed Google Scholar

Yang, X., Wang, Y., Byrne, R., Schneider, G. y Yang, S. Conceptos de inteligencia artificial para el descubrimiento de fármacos asistido por computadora. Química. Rev. 119, 10520–10594 (2019).

Artículo CAS PubMed Google Scholar

Pandey, M. y col. El papel transformador de la computación GPU y el aprendizaje profundo en el descubrimiento de fármacos. Nat. Mach. Intel. 4, 211–221 (2022).

Artículo de Google Scholar

Blay, V., Tolani, B., Ho, SP y Arkin, MR Detección de alto rendimiento: enfoques bioquímicos y celulares actuales. Descubrimiento de drogas. Hoy 25, 1807–1821 (2020).

Artículo CAS PubMed Google Scholar

Bohacek, RS, McMartin, C. y Guida, WC El arte y la práctica del diseño de fármacos basado en estructuras: una perspectiva del modelado molecular. Medicina. Res. Rev. 16, 3–50 (1996).

3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 30" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Artículo CAS PubMed Google Scholar

Lyu, J., Irwin, JJ y Shoichet, BK Modelado de la expansión de las bibliotecas de detección virtuales. Nat. Química. Biol. https://doi.org/10.1038/s41589-022-01234-w (2023).

Artículo PubMed Google Scholar

Tomberg, A. & Boström, J. ¿Puede la química sencilla producir moléculas complejas, diversas y novedosas? Descubrimiento de drogas. Hoy 25 de 2174-2181 (2020).

Artículo CAS PubMed Google Scholar

Muchiri, RN y van Breemen, RB Selección de afinidad: espectrometría de masas para el descubrimiento de compuestos farmacológicamente activos a partir de bibliotecas combinatorias y productos naturales. J. Espectro de masas. 56, e4647 (2021).

Artículo ADS CAS PubMed Google Scholar

Fitzgerald, PR y Paegel, BM Química codificada por ADN: descubrimiento de fármacos a partir de algunas buenas reacciones. Química. Rev. 121, 7155–7177 (2021).

Artículo CAS PubMed Google Scholar

Neri, D. & Lerner, RA Bibliotecas químicas codificadas en ADN: un sistema de selección basado en dotar a compuestos orgánicos de información amplificable. Año. Rev. Bioquímica. 87, 479–502 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

McCloskey, K. y col. Aprendizaje automático en bibliotecas codificadas con ADN: un nuevo paradigma para la búsqueda de resultados. J. Med. Química. 63, 8857–8866 (2020).

Artículo CAS PubMed Google Scholar

Walters, WP Bibliotecas químicas virtuales. J. Med. Química. 62, 1116-1124 (2019).

Artículo CAS PubMed Google Scholar

Warr, WA, Nicklaus, MC, Nicolaou, CA y Rarey, M. Exploración de colecciones de compuestos ultragrandes para el descubrimiento de fármacos. J. química. inf. Modelo. 62, 2021-2034 (2022). Esta es una revisión exhaustiva de la historia y los desarrollos recientes de los espacios químicos generativos y bajo demanda.

Artículo CAS PubMed Google Scholar

Enamina. Base de datos REAL. Enamina https://enamine.net/compound-collections/real-compounds/real-database (2020).

Hartenfeller, M. y col. Una colección de reacciones sólidas de síntesis orgánica para el diseño de moléculas in silico. J. química. inf. Modelo. 51, 3093–3098 (2011).

Artículo CAS PubMed Google Scholar

Patel, H. y col. SAVI, generación in silico de miles de millones de compuestos fácilmente sintetizables mediante reglas de tipo sistema experto. Ciencia. Datos 7, 384 (2020).

Artículo PubMed PubMed Central Google Scholar

Irwin, JJ y cols. ZINC20: una base de datos química gratuita a gran escala para el descubrimiento de ligandos. J. química. inf. Modelo. 60, 6065–6073 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Hu, Q. et al. Biblioteca virtual global de Pfizer (PGVL): una herramienta de diseño químico impulsada por información de síntesis paralela validada experimentalmente. Peine ACS. Ciencia. 14, 579–589 (2012).

Artículo CAS PubMed Google Scholar

Nicolaou, CA, Watson, IA, Hu, H. & Wang, J. The Proximal Lilly Collection: mapeo, exploración y explotación del espacio químico factible. J. química. inf. Modelo. 56, 1253-1266 (2016).

Artículo CAS PubMed Google Scholar

Enamina. Espacio REAL. Enamina https://enamine.net/library-synchronous/real-compounds/real-space-navigator (2022).

Bellmann, L., Penner, P., Gastreich, M. & Rarey, M. Comparación de espacios de fragmentos combinatorios y su aplicación a catálogos de compuestos ultragrandes fabricados bajo demanda. J. química. inf. Modelo. 62, 553–566 (2022).

Artículo CAS PubMed Google Scholar

Enamina. Cree bloques de construcción bajo demanda (MADE). Enamine https://enamine.net/building-blocks/made-building-blocks (2022).

Hoffmann, T. & Gastreich, M. El siguiente nivel en la navegación espacial química: ir mucho más allá de las bibliotecas de compuestos enumerables. Descubrimiento de drogas. Hoy 24, 1148-1156 (2019).

Artículo CAS PubMed Google Scholar

Ruddigkeit, L., van Deursen, R., Blum, LC y Reymond, J.-L. Enumeración de 166 mil millones de pequeñas moléculas orgánicas en la base de datos del universo químico GDB-17. J. química. inf. Modelo. 52, 2864–2875 (2012).

Artículo CAS PubMed Google Scholar

Vanhaelen, Q., Lin, Y.-C. & Zhavoronkov, A. El advenimiento de la química generativa. ACS Med. Química. Letón. 11, 1496-1505 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Ballante, F., Kooistra, AJ, Kampen, S., de Graaf, C. y Carlsson, J. Detección virtual basada en estructuras para ligandos de receptores acoplados a proteína G: ¿qué puede hacer por usted el acoplamiento molecular? Farmacéutico. Rev. 73, 527–565 (2021).

Artículo PubMed Google Scholar

Neves, MA, Totrov, M. & Abagyan, R. Acoplamiento y puntuación con ICM: resultados de la evaluación comparativa y estrategias de mejora. J. Computación. Ayudó a Mol. Des. 26, 675–686 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Meiler, J. & Baker, D. ROSETTALIGAND: acoplamiento de moléculas pequeñas de proteína con total flexibilidad de cadena lateral. Proteínas 65, 538–548 (2006).

Artículo CAS PubMed Google Scholar

Lorber, DM y Shoichet, BK Acoplamiento de ligandos flexible mediante conjuntos conformacionales. Ciencia de las proteínas. 7, 938–950 (1998).

Artículo CAS PubMed PubMed Central Google Scholar

Trott, O. & Olson, AJ AutoDock Vina: mejorar la velocidad y precisión del acoplamiento con una nueva función de puntuación, optimización eficiente y subprocesos múltiples. J. Computación. Química. 31, 455–461 (2010).

CAS PubMed PubMed Central Google Académico

Halgren, TA y cols. Glide: un nuevo enfoque para un atraque y puntuación rápidos y precisos. 2. Factores de enriquecimiento en el cribado de bases de datos. J. Med. Química. 47, 1750-1759 (2004).

Artículo CAS PubMed Google Scholar

Friesner, RA y cols. Glide: un nuevo enfoque para un atraque y puntuación rápidos y precisos. 1. Método y evaluación de la precisión del atraque. J. Med. Química. 47, 1739-1749 (2004).

Artículo CAS PubMed Google Scholar

Gaieb, Z. y col. Gran desafío 3 de D3R: predicción ciega de las posiciones de los ligandos de proteínas y clasificaciones de afinidad. J. Computación. Ayudó a Mol. Des. 33, 1-18 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Parques, CD et al. Gran desafío 4 de D3R: predicción ciega de las posiciones de los ligandos de proteínas, clasificaciones de afinidad y energías libres de unión relativas. J. Computación. Ayudó a Mol. Des. 34, 99-119 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Bender, BJ y cols. Una guía práctica para el atraque a gran escala. Nat. Protocolo. 16, 4799–4832 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Manglik, A. y col. Descubrimiento basado en la estructura de analgésicos opioides con efectos secundarios reducidos. Naturaleza 537, 185-190 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Cerón-Carrasco, JP Cuando el screening virtual arroja drogas inactivas: lidiando con falsos amigos teóricos. ChemMedChem 17, e202200278 (2022).

PubMed PubMed Central Google Académico

Rossetti, GG y cols. Inhibidores no covalentes del SARS-CoV-2 Mpro desarrollados a partir de visitas a pantallas in silico. Ciencia. Rep. 12, 2505 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Luttens, A. y col. El cribado virtual ultragrande identifica los principales inhibidores de la proteasa del SARS-CoV-2 con actividad de amplio espectro contra los coronavirus. Mermelada. Química. Soc. 144, 2905–2920 (2022). Este estudio compara el descubrimiento de candidatos principales para el objetivo desafiante basado en fragmentos y basado en cribados ultragrandes.

Artículo CAS PubMed PubMed Central Google Scholar

Owen, DR y cols. Un candidato clínico inhibidor oral de SARS-CoV-2 Mpro para el tratamiento de COVID-19. Ciencia 374, 1586-1593 (2021).

Artículo ADS CAS PubMed Google Scholar

Böhm, H.-J. El programa informático LUDI: un nuevo método para el diseño de novo de inhibidores enzimáticos. J. Computación. Ayudó a Mol. Des. 6, 61–78 (1992).

Artículo ADS PubMed Google Scholar

Beroza, P. et al. El acoplamiento espacial químico permite la detección virtual basada en estructuras a gran escala para descubrir inhibidores de la quinasa ROCK1. Nat. Comunitario. 13, 6447 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Saltador, J. et al. Aplicación y mejora de AlphaFold en CASP14. Proteínas 89, 1711-1721 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Vamathevan, J. y col. Aplicaciones del aprendizaje automático en el descubrimiento y desarrollo de fármacos. Nat. Rev. Descubrimiento de Drogas. 18, 463–477 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Schneider, P. y col. Repensar el diseño de fármacos en la era de la inteligencia artificial. Nat. Rev. Descubrimiento de Drogas. 19, 353–364 (2020). Este artículo proporciona una introducción completa a los enfoques de DL en el descubrimiento de fármacos.

Artículo CAS PubMed Google Scholar

Elbadawi, M., Gaisford, S. y Basit, AW Técnicas avanzadas de aprendizaje automático en el descubrimiento de fármacos. Descubrimiento de drogas. Hoy 26, 769–777 (2021).

Artículo CAS PubMed Google Scholar

Bender, A. & Cortés-Ciriano, I. Inteligencia artificial en el descubrimiento de fármacos: ¿qué es realista, qué son ilusiones? Parte 1: formas de generar un impacto y por qué aún no hemos llegado a ese punto. Descubrimiento de drogas. Hoy 26, 511–524 (2021).

Artículo CAS PubMed Google Scholar

Davies, M. y col. Mejora de la precisión de la farmacocinética humana prevista: lecciones aprendidas de la cartera de fármacos de AstraZeneca durante dos décadas. Tendencias Farmacol. Ciencia. 41, 390–408 (2020).

Artículo CAS PubMed Google Scholar

Schneckener, S. y col. Predicción de la biodisponibilidad oral en ratas: transferencia de conocimientos de correlaciones in vitro a modelos de aprendizaje automático (profundo) utilizando resultados de modelos in silico y parámetros de estructura química. J. química. inf. Modelo. 59, 4893–4905 (2019).

Artículo CAS PubMed Google Scholar

Cherkasov, A. et al. Modelado QSAR: ¿dónde has estado? ¿Hacia donde te diriges? J. Med. Química. 57, 4977–5010 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Keiser, MJ y cols. Predicción de nuevos objetivos moleculares para fármacos conocidos. Naturaleza 462, 175–181 (2009).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Guney, E., Menche, J., Vidal, M. & Barábasi, A.-L. Detección de eficacia de fármacos in silico basada en red. Nat. Comunitario. 7, 10331 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Cichońska, A. et al. Mapeo colaborativo del espacio objetivo inexplorado de los inhibidores de quinasa. Nat. Comunitario. 12, 3307 (2021).

Artículo PubMed PubMed Central Google Scholar

Gaulton, A. y col. ChEMBL: una base de datos de bioactividad a gran escala para el descubrimiento de fármacos. Ácidos nucleicos res. 40, D1100-D1107 (2012).

Artículo CAS PubMed Google Scholar

Tang, J. y col. Drug Target Commons: un esfuerzo comunitario para construir una base de conocimiento consensuada para las interacciones entre medicamentos y objetivos. Química celular. Biol. 25, 224–229.e222 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, Z. y col. Colección de datos vinculantes en todo PDB: estado actual de la base de datos PDBbind. Bioinformática 31, 405–412 (2015).

Artículo CAS PubMed Google Scholar

Gaudelet, T. y col. Utilizar el aprendizaje automático de gráficos en el descubrimiento y desarrollo de fármacos. Breve. Bioinformar. 22, bbab159 (2021).

Artículo PubMed PubMed Central Google Scholar

Son, J. & Kim, D. Desarrollo de un modelo gráfico de red neuronal convolucional para la predicción eficiente de las afinidades de unión proteína-ligando. MÁS UNO 16, e0249404 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Stepniewska-Dziubinska, MM, Zielenkiewicz, P. & Siedlecki, P. Mejora de la detección de sitios de unión proteína-ligando con segmentación 3D. Ciencia. Rep. 10, 5035 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Jiménez, J., Škalič, M., Martínez-Rosell, G. & De Fabritiis, G. KDEEP: predicción de la afinidad de unión absoluta proteína-ligando mediante redes neuronales convolucionales 3D. J. química. inf. Modelo. 58, 287–296 (2018).

Artículo PubMed Google Scholar

Jones, D. y col. Predicción mejorada de la afinidad de unión proteína-ligando con inferencia de fusión profunda basada en estructuras. J. química. inf. Modelo. 61, 1583-1592 (2021).

Artículo CAS PubMed Google Scholar

Volkov, M. y col. Sobre la frustración de predecir las afinidades de unión de las estructuras proteína-ligando con redes neuronales profundas. J. Med. Química. 65, 7946–7958 (2022).

Artículo CAS PubMed Google Scholar

Roberts, M. y col. Errores comunes y recomendaciones para utilizar el aprendizaje automático para detectar y pronosticar COVID-19 mediante radiografías de tórax y tomografías computarizadas. Nat. Mach. Intel. 3, 199–217 (2021).

Artículo de Google Scholar

Beker, W. y col. En ocasiones, el aprendizaje automático puede simplemente capturar las tendencias de popularidad de la literatura: un estudio de caso del acoplamiento heterocíclico Suzuki-Miyaura. Mermelada. Química. Soc. 144, 4819–4827 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Yu, B. y Kumbier, K. Ciencia de datos verídicos. Proc. Acad. Nacional. Ciencia. EE.UU. 117, 3920–3929 (2020). Este artículo de perspectiva sienta las bases para una IA verídica.

Artículo ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar

Ng, A., Laird, D. & He, L. Competencia de IA centrada en datos. Inteligencia artificial de aprendizaje profundo https://https.deeplearning-ai.github.io/data-centric-comp/ (2021).

Miranda, LJ Hacia el aprendizaje automático centrado en datos: una breve reseña. LJ Miranda https://ljvmiranda921.github.io/notebook/2021/07/30/data-centric-ml/ (2021).

Jiménez-Luna, J., Grisoni, F. & Schneider, G. Descubrimiento de fármacos con inteligencia artificial explicable. Nat. Mach. Intel. 2, 573–584 (2020).

Artículo de Google Scholar

Wills, T. Descubrimiento de fármacos con IA: evaluación de los primeros candidatos a fármacos diseñados con IA que se someterán a ensayos clínicos en humanos. CAS https://www.cas.org/resources/cas-insights/drug-discovery/ai-designed-drug-candidates (2022).

Meng, C., Seo, S., Cao, D., Griesemer, S. y Liu, Y. Cuando la física se encuentra con el aprendizaje automático: un estudio sobre el aprendizaje automático basado en la física. Preimpresión en https://doi.org/10.48550/arXiv.2203.16797 (2022).

Thomas, M., Bender, A. y de Graaf, C. Integración de enfoques basados ​​en estructuras en el diseño molecular generativo. actual. Opinión. Estructura. Biol. 79, 102559 (2023).

Artículo CAS PubMed Google Scholar

Ackloo, S. y col. CACHE (Evaluación crítica de experimentos computacionales de búsqueda de resultados): una iniciativa de evaluación comparativa de asociación público-privada para permitir el desarrollo de métodos computacionales para la búsqueda de resultados. Nat. Rev. Química. 6, 287–295 (2022). Esta es una importante iniciativa comunitaria para la evaluación integral del desempeño de los métodos computacionales de descubrimiento de fármacos.

Artículo PubMed PubMed Central Google Scholar

MolSoft. Motor de descubrimiento rápido de isósteros (RIDE). MolSoft http://molsoft.com/RIDE.html (2022).

Saltador, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Tunyasuvunakool, K. et al. Predicción de estructura proteica de alta precisión para el proteoma humano. Naturaleza 596, 590–596 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Baek, M. y col. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres vías. Ciencia 373, 871–876 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Akdel, M. Una evaluación de la comunidad de biología estructural de las aplicaciones AlphaFold2. Nat. Estructura. Mol. Biol. 29, 1056-1067 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Katritch, V., Rueda, M. y Abagyan, R. Optimización del receptor guiada por ligando. Métodos Mol. Biol. 857, 189–205 (2012).

Artículo CAS PubMed Google Scholar

Carlsson, J. y col. Descubrimiento de ligando a partir de un modelo de homología del receptor D3 de dopamina y estructura cristalina. Nat. Química. Biol. 7, 769–778 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Ren, F. y col. AlphaFold acelera el descubrimiento de fármacos impulsado por inteligencia artificial: descubrimiento eficiente de un nuevo inhibidor de molécula pequeña de la quinasa 20 dependiente de ciclina (CDK20). Química. Ciencia. 14, 1443-1452 (2023).

Zhang, Y. et al. Evaluación comparativa de estructuras AlphaFold2 refinadas y sin refinar para el descubrimiento de hits. J. química. inf. Modelo. 63, 1656–1667 (2023).

Él, X.-h. et al. AlphaFold2 versus estructuras experimentales: evaluación de receptores acoplados a proteína G. Acta Farmacol. Pecado. 44, 1–7 (2022).

Artículo PubMed Google Scholar

Wong, F. y col. Evaluación comparativa de predicciones de acoplamiento molecular habilitadas por AlphaFold para el descubrimiento de antibióticos. Mol. Sistema. Biol. 18, e11081 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Heckelman, ML, de Vries, I., Joosten, RP y Perrakis, A. AlphaFill: enriquecimiento de modelos AlphaFold con ligandos y cofactores. Nat. Métodos 20, 205–213 (2023).

Artículo CAS PubMed Google Scholar

Yang, Y. et al. Exploración eficiente del espacio químico con acoplamiento y aprendizaje profundo. J. química. Computación teórica. 17, 7106–7119 (2021).

Artículo CAS PubMed Google Scholar

Gentile, F. y col. Detección virtual habilitada por inteligencia artificial de bibliotecas químicas ultragrandes con acoplamiento profundo. Nat. Protocolo. 17, 672–697 (2022).

Artículo CAS PubMed Google Scholar

Schindler, CEM y cols. Evaluación a gran escala de cálculos de energía libre vinculante en proyectos de descubrimiento de fármacos activos. J. química. inf. Modelo. 60, 5457–5474 (2020).

Artículo CAS PubMed Google Scholar

Chen, W., Cui, D., Abel, R., Friesner, RA y Wang, L. Cálculo preciso de las energías libres absolutas de unión proteína-ligando. Preimpresión en https://doi.org/10.26434/chemrxiv-2022-2t0dq-v2 (2022).

Khalak, Y. et al. Ligando-proteína absoluta alquímica que une energías libres para el diseño de fármacos. Química. Ciencia. 12, 13958–13971 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Cournia, Z. et al. Simulaciones rigurosas de energía libre en cribado virtual. J. química. inf. Modelo. 60, 4153–4169 (2020).

Artículo CAS PubMed Google Scholar

xREAL Chemical Space, Chemspace, https://chem-space.com/services#v-synthes (2023).

Rarey, M., Nicklaus, MC & Warr, W. Número especial sobre informática de reacciones y espacio químico. J. química. inf. Modelo. 62, 2009-2010 (2022).

Artículo CAS PubMed Google Scholar

Zabolotna, Y. et al. Una mirada de cerca al espacio químico de los componentes básicos disponibles comercialmente para la química medicinal. J. química. inf. Modelo. 62, 2171–2185 (2022).

Artículo CAS PubMed Google Scholar

Kaplan, AL y cols. Acoplamiento de biblioteca personalizado para agonistas del receptor 5-HT2A con actividad antidepresiva. Naturaleza 610, 582–591 (2022).

Artículo ADS CAS PubMed Google Scholar

Krasiński, A., Fokin, VV & Sharpless, KB Síntesis directa de 4-magnesio-1,2,3-triazoles 1,5-disustituidos, revisada. Org. Letón. 6, 1237-1240 (2004).

Artículo PubMed Google Scholar

El Premio Nobel de Química. premio nobel.org, https://www.nobelprize.org/prizes/chemistry/2022/summary/ (2022)

Dong, J., Sharpless, KB, Kwisnek, L., Oakdale, JS & Fokin, VV Síntesis de polisulfatos basada en SuFEx. Angélica. Química. En t. Ed. ingles. 53, 9466–9470 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Zhang, B. y col. Acoplamiento doblemente descarboxilativo Ni-electrocatalítico Csp3-Csp3. Naturaleza 606, 313–318 (2022).

Artículo ADS CAS PubMed Google Scholar

Gillis, EP y Burke, MD Acoplamiento cruzado iterativo con boronatos MIDA: hacia una plataforma general para la síntesis de moléculas pequeñas. Aldrichimica Acta 42, 17-27 (2009).

CAS PubMed PubMed Central Google Académico

Blair, DJ y cols. Formación iterativa automatizada de enlaces Csp3-C. Naturaleza 604, 92–97 (2022). Este estudio proporciona un enfoque químico para la automatización de la formación de enlaces C-C en la síntesis de moléculas pequeñas.

Artículo ADS CAS PubMed Google Scholar

Li, J. y col. Síntesis de muchos tipos diferentes de moléculas orgánicas pequeñas mediante un proceso automatizado. Ciencia 347, 1221-1226 (2015).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Trobe, M. & Burke, MD La revolución industrial molecular: síntesis automatizada de moléculas pequeñas. Angélica. Química. En t. Ed. 57, 4192–4214 (2018).

Artículo CAS Google Scholar

Bubliauskas, A. et al. Digitalización de la síntesis química en reactivos impresos en 3D. Angélica. Química. En t. Ed. 61, e202116108 (2022).

Artículo CAS Google Scholar

Molga, K. et al. Un algoritmo informático para descubrir secuencias iterativas de reacciones orgánicas. Nat. Sintetizador. 1, 49–58 (2022).

ADS del artículo Google Scholar

Segler, MHS, Preuss, M. & Waller, MP Planificación de síntesis químicas con redes neuronales profundas e IA simbólica. Naturaleza 555, 604–610 (2018).

Artículo ADS CAS PubMed Google Scholar

Goldman, B., Kearnes, S., Kramer, T., Riley, P. y Walters, WP Definición de niveles de diseño químico automatizado. J. Med. Química. 65, 7073–7087 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Grisoni, F. y col. Combinando inteligencia artificial generativa y síntesis en chip para el diseño de fármacos de novo. Ciencia. Adv. 7, eabg3338 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Wagner, J.R. y col. Métodos computacionales emergentes para el descubrimiento racional de fármacos alostéricos. Química. Rev. 116, 6370–6390 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Davis, BJ y Hubbard, RE en biología estructural en el descubrimiento de fármacos (ed. Renaud, J.-P.) 79–98 (2020).

de Souza Neto, LR et al. Estrategias in silico para respaldar la optimización de fragmentos a clientes potenciales en el descubrimiento de fármacos. Frente. Química. 8, 93 (2020).

Artículo ADS PubMed PubMed Central Google Scholar

Saur, M. y col. Descubrimiento de fármacos basado en fragmentos mediante crio-EM. Descubrimiento de drogas. Hoy 25, 485–490 (2020).

Artículo CAS PubMed Google Scholar

Kuljanin, M. y col. Reimaginar la creación de perfiles de alto rendimiento de cisteínas reactivas para la detección celular de grandes bibliotecas de electrófilos. Nat. Biotecnología. 39, 630–641 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Muegge, I., Martin, YC, Hajduk, PJ y Fesik, SW Evaluación de la puntuación de PMF al acoplar ligandos débiles a la proteína de unión FK506. J. Med. Química. 42, 2498–2503 (1999).

Artículo CAS PubMed Google Scholar

Schuller, M. et al. Fragmento de unión al macrodominio Nsp3 del SARS-CoV-2 identificado mediante cribado cristalográfico y acoplamiento computacional. Ciencia. Adv. 7, eabf8711 (2021).

Artículo ADS PubMed PubMed Central Google Scholar

Gahbauer, S. y col. El diseño computacional iterativo y el cribado cristalográfico identifican inhibidores potentes que se dirigen al macrodominio Nsp3 del SARS-CoV-2. Proc. Acad. Nacional. Ciencia. Estados Unidos 120, e2212931120 (2023). Este artículo demuestra la aplicación del diseño de detección y fusión de fragmentos híbridos y la detección de bibliotecas ultragrandes a un objetivo viral desafiante.

Artículo CAS PubMed PubMed Central Google Scholar

Achdout, H. y col. Descubrimiento científico abierto de las terapias inhibidoras de la proteasa principal del SARS-CoV-2 orales no covalentes. Preimpresión en https://doi.org/10.1101/2020.10.29.339317 (2022).

Jin, Z. y col. Estructura de Mpro del SARS-CoV-2 y descubrimiento de sus inhibidores. Naturaleza 582, 289–293 (2020).

Artículo ADS CAS PubMed Google Scholar

Ton, AT, Gentile, F., Hsing, M., Ban, F. y Cherkasov, A. Identificación rápida de posibles inhibidores de la proteasa principal del SARS-CoV-2 mediante el acoplamiento profundo de 1.300 millones de compuestos. Mol. Informar. 39, e2000028 (2020).

Artículo PubMed Google Scholar

Frye, L., Bhat, S., Akinsanya, K. y Abel, R. Del descubrimiento de fármacos asistido por computadora al descubrimiento de fármacos impulsado por computadora. Descubrimiento de drogas. Hoy tecnología. 39, 111-117 (2021).

Artículo CAS PubMed Google Scholar

Wadman, M. La FDA ya no necesita exigir pruebas en animales antes de los ensayos de medicamentos en humanos. Ciencia, https://doi.org/10.1126/science.adg6264 (2023).

Stiefl, N. y col. FOCUS: desarrollo de una plataforma global de comunicación y modelado para químicos medicinales computacionales y aplicados. J. química. inf. Modelo. 55, 896–908 (2015).

Artículo CAS PubMed Google Scholar

Schrödinger. Diseño en vivo. Schrödinger https://www.schrodinger.com/sites/default/files/general_ld_rgb_080119_forweb.pdf. (consultado el 5 de abril de 2023)

Müller, S. et al. Objetivo 2035: actualización sobre la búsqueda de una sonda para cada proteína. RSC Med. Química. 13, 13-21 (2022).

Artículo PubMed Google Scholar

Verdonk, ML, Cole, JC, Hartshorn, MJ, Murray, CW y Taylor, RD Mejora del acoplamiento proteína-ligando utilizando GOLD. Proteínas 52, 609–623 (2003).

Artículo CAS PubMed Google Scholar

Miller, EB y cols. Solución confiable y precisa al problema del acoplamiento de ajuste inducido para la unión proteína-ligando. J. química. Computación teórica. 17, 2630–2639 (2021).

Artículo CAS PubMed Google Scholar

Atraque espacial químico. BioSolveIT https://www.biosolveit.de/application-academy/chemical-space-docking/ (2022).

Cavasotto, CN en Mecánica cuántica en el descubrimiento de fármacos (ed. Heifetz, A.) 257–268 (Springer, 2020).

Dixon, SL y cols. AutoQSAR: una herramienta automatizada de aprendizaje automático para el modelado cuantitativo de relaciones estructura-actividad de mejores prácticas. Medicina del futuro. Química. 8, 1825–1839 (2016).

Artículo ADS CAS PubMed Google Scholar

Totrov, M. Campos de propiedades atómicas: potencial farmacofórico 3D generalizado para la superposición automatizada de ligandos, elucidación de farmacóforos y QSAR 3D. Química. Biol. Desdrogas. 71, 15-27 (2008).

Artículo CAS PubMed Google Scholar

Schaller, D. y col. Modelado de farmacóforos 3D de próxima generación. CABLES Computación. Mol. Ciencia. 10, e1468 (2020).

Artículo CAS Google Scholar

Chakravarti, SK y Alla, SRM Modelado QSAR sin descriptores utilizando aprendizaje profundo con redes neuronales de memoria a corto plazo. Frente. Artif. Intel. 2, 17 (2019).

Artículo PubMed PubMed Central Google Scholar

Deng, Z., Chuaqui, C. & Singh, J. Huella digital de interacción estructural (SIFt): un método novedoso para analizar interacciones tridimensionales de unión entre proteína y ligando. J. Med. Química. 47, 337–344 (2004).

Artículo CAS PubMed Google Scholar

Descargar referencias

Agradecemos a A. Brooun, AA Sadybekov, S. Majumdar, MM Babu, Y. Moroz y V. Cherezov por sus útiles debates.

Departamento de Biología Cuantitativa y Computacional, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Anastasiia V. Sadybekov y Vsévolod Katritch

Centro de Nuevas Tecnologías en Descubrimiento y Desarrollo de Fármacos, Bridge Institute, Centro Michelson de Biociencias Convergentes, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Anastasiia V. Sadybekov y Vsévolod Katritch

Departamento de Química, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Vsévolod Katritch

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Todos los autores contribuyeron a escribir el manuscrito.

Correspondencia a Vsevolod Katritch.

La Universidad del Sur de California está en el proceso de solicitar una patente (n.º 63159888) que cubre el método V-SYNTHES y que incluye a VK como co-inventor.

Nature agradece a Alexander Tropsha y a los demás revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Springer Nature o su licenciante (por ejemplo, una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; El autoarchivo por parte del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Sadybekov, AV, Katritch, V. Enfoques computacionales que racionalizan el descubrimiento de fármacos. Naturaleza 616, 673–685 (2023). https://doi.org/10.1038/s41586-023-05905-z

Descargar cita

Recibido: 21 de abril de 2022

Aceptado: 01 de marzo de 2023

Publicado: 26 de abril de 2023

Fecha de emisión: 27 de abril de 2023

DOI: https://doi.org/10.1038/s41586-023-05905-z

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

La naturaleza revisa la genética (2023)

Revista de diseño molecular asistido por computadora (2023)

Química África (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR