Dos investigadores del Reino Unido han descubierto que la red de reacciones que componen la química orgánica comparte fenómenos estadísticos con las redes sociales, y que la estructura de esta red está en sí misma llena de información química sin explotar.
Alexei Lapkin, de la Universidad de Cambridge, empezó preguntándose cómo conectar moléculas de origen sostenible con posibles productos químicos de alto valor. Los académicos siempre preguntaban a los industriales qué moléculas de alto valor querían, mientras que los industriales siempre respondían «¿qué moléculas puede darnos usted?»».
Con el fin de desarrollar una cadena de suministro para transformar las materias primas químicas de origen biológico en moléculas útiles, Lapkin quería poder examinar todo el panorama de reacciones relevantes. El miembro de su grupo Philipp-Maximilian Jacob tuvo la idea de probar estadísticamente un gran conjunto de datos de reacciones químicas. Así que, utilizando cerca de 13 millones de reacciones de la base de datos Reaxys que se originan a partir del limoneno, una molécula de origen biológico, Lapkin y Jacob aplicaron el análisis de la teoría de grafos para investigar y describir la conectividad de una sección de lo que se ha denominado anteriormente la Red de Química Orgánica (NOC).
Tenemos esta gran cantidad de datos químicos que existen en las bases de datos químicas que se utilizan de forma pasiva», explica Jacob. Su objetivo era comprender mejor cómo se organiza ese espacio químico y cómo aplicar métodos estadísticos a los datos. A diferencia de los trabajos anteriores, trataron de examinar la red sin prejuicios por tratarse de datos químicos. ¿Sería posible deducir fenómenos químicos conocidos únicamente a partir del análisis estadístico de la red?
Oportunidad de crear una red
Convirtieron los datos de Reaxys en una red utilizando Python, con vértices que representan moléculas y aristas que representan las reacciones entre ellas. Utilizando graph-tool y el paquete powerlaw, Lapkin y Jacob evaluaron propiedades estadísticas clave de la red, como el número medio de reacciones que conectan cada molécula, si las moléculas bien conectadas tienden a agruparse y el número medio de reacciones que separan cada par de moléculas.
Lapkin afirma que sus resultados demuestran que es posible aplicar ciertas métricas estadísticas a los datos de la NOC y utilizarlos para predecir rutas de reacción. Cualquiera que tenga acceso a los datos puede reproducir los hallazgos del dúo utilizando las mismas herramientas, y los resultados pueden validarse con el historial de la evolución de la red.
Yury Suleymanov, cuyo trabajo en el Instituto de Chipre consiste en el descubrimiento computacional de reacciones químicas inesperadas, destaca cómo la nueva información hace que la NOC se expanda siguiendo un patrón de evolución definido con precisión. El análisis de las métricas clave de la red indica que es posible estimar los cambios en el número total de reacciones químicas de una especie determinada cuando se descubren reacciones nuevas, previamente desconocidas e inesperadas en el futuro».
Judit Zador, experta en métodos de búsqueda de vías de reacción en los Laboratorios Nacionales de Sandia (EE.UU.), señala que la distribución de nodos con un número muy elevado de vecinos, como los productos químicos de plataforma de base biológica que inspiran este trabajo, es importante para la geometría global de la red y para la estructura de las vías de síntesis. Subraya el amplio interés que puede tener este trabajo: «Los investigadores que buscan diseñar nuevas vías pueden querer reflexionar sobre estas ideas, que pueden encontrar aplicación en otras áreas de la química, como las redes de reacción que describen la combustión o la química atmosférica».
NOC
Suleymanov señala que la NOC también presenta los «seis grados de separación» observados en las redes sociales. Esto significa que, por término medio, «es posible producir cualquier especie química a partir de cualquier otra especie en seis o menos pasos de síntesis orgánica», al igual que la investigación de las redes sociales ha demostrado que, por término medio, no se está a más de seis vínculos sociales de cualquier otro ser humano vivo. Este hallazgo podría revelar rutas sintéticas más cortas que podrían haberse pasado por alto.
De cara al futuro, Lapkin predice que la química dependerá cada vez más del uso algorítmico de la información, lo que sólo es posible si la investigación publicada contiene datos legibles por máquinas. Instamos a la gente a que estudie la facilidad con la que se pueden extraer los números de las publicaciones si quieren que los trabajos tengan un impacto a largo plazo en el futuro de la química».