Translate

miércoles, 27 de mayo de 2020

ORIGEN DE LA CÉLULA EUCARIOTA. Las misteriosas relaciones entre LUCA y LECA




En prácticamente cualquier texto de biología donde se plantee el origen de la célula eucariótica es frecuente encontrar frases del tipo: …es uno de los principales problemas -misterios, retos- de la biología evolucionista; …representa el mayor salto, la mayor discontinuidad, de la evolución biológica… Naturalmente, el abordaje de semejante dificultad exige tomar en consideración los principales datos disponibles, para realizar un abordaje lo más amplio posible, y elaborar una teoría que dé cuenta de todos ellos; y no caer en la tentación del practicismo -cada vez más frecuente- de reducir los problemas y las interpretaciones de los datos obtenidos a la dimensión de los métodos empleados, ignorando, además, los métodos e interpretaciones de otros investigadores. En este sentido, el análisis que aquí realicemos sobre el origen de la célula eucariótica, se realizará -desde una perspectiva evolutiva lo más amplia posible- teniendo en cuenta la problemática asociada al origen de la vida que pudo influir en las diferencias fundamentales entre los grandes tipos celulares; (ver la entrada de 10 de marzo de 2017 de este blog: Origen de la vida y origen de la célula eucariota). De esta manera, intentaremos recorrer el camino evolutivo que se fue abriendo paso desde las etapas prebióticas hasta LUCA (Last Universal Common Ancestor), y, desde esta célula, hasta LECA (Last Eucaryotic Common Ancestor).

La naturaleza y el sentido de las cosas
Aunque el nivel conceptual aconsejable a los posibles lectores de este blog está por encima de la biología de 2º curso de bachillerato, quiero repasar la clasificación elemental de la célula -como unidad de vida y, por tanto, de su origen- en dos tipos celulares, las denominadas células eucariota y procariota; para llamar la atención acerca de que, frecuentemente, se dice que, a diferencia de la célula eucariota -literalmente la célula con núcleo verdadero-, la célula procariota carece de él. Aquí asoma un problema de índole epistemológica: si los autores que nombraron a las células sin núcleo verdadero querían sólo subrayar su ausencia deberían haberlas denominado acariotas; pero sabemos bien que, con la denominación procariotas, lo que quisieron subrayar no fue la mera descripción estructural de este tipo de células, sino su anterioridad evolutiva respecto a las eucariotas; esto es, que son, literalmente, anteriores en la evolución a la aparición del núcleo. De esta manera, LUCA sería la célula ancestral, de naturaleza procariota, y LECA, como su nombre indica, el posterior ancestro eucariota. Este orden nos puede parecer evidente -en castellano: patente, cierto, manifiesto, sin necesidad de ser probado, como la diferencia entre el día y la noche-, dejándonos llevar por el razonamiento de que lo más sencillo precede a lo más complejo; pero, en rigor científico, no podemos utilizar este razonamiento como prueba de prioridad evolutiva. Pero, además, continuando con el modelo de evolución celular vigente, una somera comparación de los esquemas estructurales de las células procariotas y eucariotas nos asoma al abismo existente entre ambas clases celulares, sin tipo intermedio alguno que sirva de puente, y permita proponer algún proceso de evolución gradual entre ellas. Los procariotas -literalmente células anteriores a la aparición de un núcleo verdadero- tienen en su lugar una molécula de ADN circular, sin histonas, denominado nucleoide; tampoco tiene sistemas internos membranosos, todo lo más unos repliegues de la membrana plasmática, de naturaleza lipoproteica,  denominados mesosomas; ribosomas citoplasmáticos de tamaño más pequeño que los de eucariotas; flagelos, pili y fimbrias con estructuras diferentes a los flagelos eucarióticos; pared celular rígida de composición y estructura variable según los grupos; y cápsula o glucocálix de naturaleza glucídica. Por su parte, la célula eucariota presenta una estructura general muy distinta: además de un núcleo con doble membrana y cromosomas complejos con histonas; presenta un sistema interno membranoso complejo, con retículo endoplasmático, rugoso -por ir tachonado de ribosomas- y liso; aparato de Golgi; vesículas de endocitosis y exocitosis; citoesqueleto con centrosoma y las proteínas implicadas en su organización; lisosomas y peroxisomas; mitocondrias; cloroplastos; vacuolas; membrana plasmática de naturaleza lipoproteica; y, en algunos tipos celulares, una pared celular, que la rodea, de naturaleza totalmente distinta a las de los procariotas. Pero, además de esta enorme brecha estructural, sin formas intermedias, hay diferencias funcionales esenciales, aún más importantes, entre los dos tipos celulares: por decirlo en dos palabras, los procariotas son más genéticos, mientras que los eucariotas son más plásticos. Aunque, más adelante, iremos desarrollando esta primera pincelada sobre la naturaleza esencial de ambas células, vamos a esbozar aquí que por más genético queremos señalar: procesos más deterministas; más dependientes del azar que origina mutaciones; proteínas más estructuradas y con funciones más específicas, asociadas a mecanismos del tipo llave cerradura. Por su parte, los eucariotas son más plásticos: con procesos de plasticidad adaptativa frente a la contingencia ambiental; dependientes de la información conformacional adquirida por sus proteínas esenciales, que exhiben un mayor o menor grado de desorden estructural intrínseco; son, por tanto, más epigenéticos.
Siguiendo este razonamiento, las diferencias entre procariotas y eucariotas -entre LUCA y LECA- son tan grandes que debemos plantearnos algunas preguntas que orienten nuestras pesquisas: ¿cómo la evolución biológica, en la Tierra, ha trazado dos caminos tan diferentes como los que vemos en la esencia, funcional y estructural, de procariotas y eucariotas? Realmente –además de la ausencia de intermediarios entre procariotas y eucariotas- hay tantas diferencias entre ellos, que resulta muy difícil imaginar cómo pudo surgir la célula eucariota a partir de la procariota; y, sobre todo, ¿por qué? Dado que los procariotas son los organismos mejor adaptados a todos los ambientes, controlan todos los metabolismos, la herencia vertical y horizontal, tienen formas increíbles de resistencia; entre otras características favorables, ¿qué presión selectiva fue tan fuerte para que de algunos de ellos surgiera, en un considerable periodo de tiempo, la célula eucariota? Y no me refiero ni a la mitocondria ni a los cloroplastos –bien explicados por la teoría endosimbiótica de L. Margulis- me refiero fundamentalmente al núcleo, al retículo endoplásmico, al aparato de Golgi, al citoesqueleto y a todos los sistemas funcionales asociados con estos orgánulos. Quizá deba revisarse el planteamiento de que, en la evolución biológica, lo más simple precede siempre a lo más complejo: en este caso la creencia –presente en todas las hipótesis actuales- de que los procariotas precedan a los eucariotas. Pero, de momento, sigamos con este razonamiento, y con la idea añadida de que los procariotas son “más genéticos”, mientras que los eucariotas son “más plásticos”. Estas ideas nos llevan también a plantearnos: ¿son los virus un tipo de procariota ancestral, extremadamente genético? Todas estas cuestiones que surgen alrededor de las enormes diferencias esenciales entre procariotas y eucariotas son fundamentales dado que, la muy influyente biología molecular -y su flamante dogma central, de información en un único sentido- se fundó sobre investigaciones realizadas con bacterias y virus que las infectaban (bacteriófagos); dejando aparte a la otra rama esencial de la vida, los eucariotas. Veremos cómo este acta fundacional procariota y genético, de la nueva biología, va a condicionar al planteamiento de sus grandes problemas marco -origen, naturaleza y evolución de las células- y de sus contextos, anterior y posterior: la evolución pregenética y epigenética. En definitiva, para intentar averiguar el origen, la naturaleza y la evolución de LUCA y LECA -y sus misteriosas relaciones- debemos volver a plantearnos algunas viejas cuestiones respecto al origen de la vida del tipo ¿qué fue primero, el huevo o la gallina? Estas cuestiones giran alrededor de: ¿qué fue prioritario en el origen, el ARN/ADN o las proteínas? O mejor aún, ¿qué fue prioritario, la información conformacional de las proteínas -y también de las ribozimas- o la secuencial del ARNm y el ADN? O, en definitiva ¿qué fue prioritario, la estructura o la función?

Estructura función o función estructura
La biología surge como ciencia, en el siglo XVIII, con la idea de organización funcional, porque saca y diferencia a los seres vivos de la medieval, creacionista y, por lo tanto, ahistórica cadena continua de los seres; separando, así, a los seres vivos u orgánicos de los seres inorgánicos. Buffon, Lamarck, Cuvier, Darwin, Wallace, Huxley, Haeckel, entre otros muchos, a pesar de sus diferencias, eran profundamente funcionalistas. Pero, en el siglo XX, la biología plantea un nuevo enfoque estructural de los niveles de organización de los seres vivos, y cae en el reduccionismo y en el neovitalismo del denominado programa genético (ver la entrada de 21 de abril de 2020 de este blog: Programa genético o interacción organismo-ambiente).
Podemos resumir el diagnóstico de la situación actual de la biología, como delimitada por un paradigma genocéntrico regido por el dogma central de la biología molecular (DCBM), donde la información secuencial de la estructura primaria del ADN está dirigida, en sentido único, hacia la formación de las proteínas, consideradas, así, como su expresión funcional. Realmente hay un cierto paralelismo entre esta idea moderna de la vida y la que se tenía, en el siglo XVI, de la naturaleza como instrumento divino. Los partidarios a ultranza del programa genético sobre las bases del DCBM, plantean una discontinuidad, una singularidad de los seres vivos respecto a los inorgánicos en el origen de la vida. La discontinuidad o singularidad no es material: los átomos de los seres vivos son los mismos que los de la materia inorgánica, y muchas de las biomoléculas sencillas también. La discontinuidad está en la organización -en la estructura de los seres vivos- sobre la base de combinaciones singulares de las bases nitrogenadas en los ácidos nucleicos -como biomoléculas portadoras de la información genética- sin que la plasticidad funcional de los seres vivos, en su interacción con el medio, tenga ningún papel. En los niveles de integración inorgánicos las estructuras resultan de las interacciones necesarias previas, mientras que, en el paradigma actual de la biología, las estructuras vivas surgen del encuentro, al azar, de la información genética adecuada, y de su paso posterior por el tamiz de la selección natural. Esta concepción de la vida es teleológica, ya que contempla la formación de las estructuras moleculares de los seres vivos como la adquisición, al azar, de una combinación informativa única -y, por lo tanto, preconcebida- que posibilite la formación de las estructuras necesarias para las funciones vitales. Es como si estuviéramos ante un sistema de búsqueda al azar de claves vitales para encontrar las estructuras con las que pudiera iniciarse la vida. Aquí radica la teleología y el neovitalismo informativo de la nueva biología: las estructuras moleculares de la vida no surgen como resultado no buscado de las interacciones previas de moléculas inorgánicas, en un ambiente adecuado, sino como el hallazgo al azar de la información necesaria para arrancar el proceso de la vida. En el paradigma actual esta información estructural sería única y estaría definida previamente: la estructura sería prioritaria sobre la función, también concebida previamente.
En la entrada anterior del blog, sobre Programa genético, proponíamos que, siguiendo la metáfora lingüística asociada al código genético, podríamos considerar a las proteínas como las palabras -con su significado y su significante, esto es, su función y su estructura- y a los genes como los depositarios de la información codificada de las palabras. Extendiendo la metáfora, las proteínas se podrían identificar con la palabra hablada, más vinculada a la acción -tanto en el origen de la humanidad y su evolución, como en el desarrollo del niño y en la lectura de un texto-, mientras que los genes se identificarían mejor con la palabra escrita. Así pues, del mismo modo que los humanos fuimos los agentes que construimos un lenguaje, sobre la actividad social, propiciando así una evolución cultural; podríamos decir que las proteínas son los agentes que -mediante el código genético- construyen su lenguaje molecular, genético y epigenético, su cultura molecular, tanto en la filogenia, como en la ontogenia y en la fisiología celular. Siguiendo con esta metáfora, en la etapa prebiótica del origen de la vida la información, pregenética, sería conformacional: la coselección de los módulos estructurales básicos -hidrofílicos e hidrofóbicos- de los péptidos y polipéptidos; y de los ARN pequeños y ribozimas. Esta información conformacional pregenética, modelada frente al medio molecular, representaría la palabra hablada en la metáfora. Con el establecimiento de la relación, de código genético, entre las secuencias de los polipéptidos y las de los nucleótidos del ARN y del ADN, entramos en la etapa genética, propia de la evolución celular. Con la llegada de la genética se logra, fundamentalmente, la invariancia y la posibilidad de combinar y empalmar los módulos estructurales de los polipéptidos seleccionados en la etapa anterior. Ya no hay límite para la longitud de los polipéptidos, ni para la combinación funcional de sus dominios, tanto en estructuras terciarias como cuaternarias. La genética se correspondería con el lenguaje escrito. Por su parte, la evolución celular y pluricelular, fundamentalmente eucariota, se realiza sobre la exaltación del gobierno epigenético de las conquistas genéticas frente a los cambios medioambientales: en definitiva, la plasticidad conformacional pregenética aplicada al manejo espaciotemporal de los módulos genéticos. En la metáfora, esta información epigenética se correspondería con la etapa actual de la humanidad, embebida en la cultura de las nuevas tecnologías de la información y la comunicación.
El problema que plantea el paradigma genocéntrico -y su dogma central- para que arranque la vida en la Tierra, por puro azar, es similar al de colocar a un mono delante de una máquina de escribir, y esperar cuánto tarda en escribir, punto por punto, el Quijote. Creo que no he sido muy exigente con las condiciones del experimento mental propuesto: sólo he incluido el Quijote, y he puesto ya a un mono, y, además, con una máquina de escribir. Sin embargo, todos sabemos lo que tardó un mono en hacerse humano, y que de la evolución humana surgiese Cervantes y escribiese el Quijote. Y no sólo Cervantes, y no sólo el Quijote. Ese tiempo es un suspiro comparado con el calvario infinito del mono ante una máquina de escribir. La plasticidad biológica frente al medio -social, en el caso del animal humano- es inmensa, y en ella opera la información pregenética, genética y epigenética, sobre la base de la necesidad imperativa de las interacciones materiales de los niveles vivos (supramolecular, celular y pluricelular) frente a la cambiante contingencia ambiental. Así, desde Darwin, sabemos que no hay proyecto, ni propósito en la evolución; que los seres vivos que han sido, son o serán, pertenecen al universo de lo posible, pero que ese universo no se va a plasmar en ningún rincón a la vez. La evolución de la vida en la Tierra podría haber cursado sin que apareciéramos los humanos; y, por supuesto, la evolución humana podría no haber tenido a Cervantes; o sí, pero sin ser escritor; o ser escritor, pero sin escribir el Quijote, etc. No hay determinismo ni en el origen, ni en la naturaleza, ni en la evolución; sólo la necesidad y la contingencia, concatenadas, de las interacciones materiales.
Así pues, dada la concatenación universal entre la necesidad de los fenómenos y la contingencia de los sucesos, en cualquier historia, incluida la evolución biológica en la Tierra; vamos a ver la importancia que tiene entender el origen de algo, para entender su naturaleza y su evolución; y viceversa. De esta manera, los datos que obtengamos de cualquiera de estas tres características comunes, de los grupos de seres vivos, deben ser valorados por su coherencia con las otras dos. Como hemos visto, en el planteamiento del origen de la vida -y atendiendo a la, ya comentada, paradoja del huevo y la gallina- tenemos básicamente dos modelos: el genocéntrico de estructuras formadas al azar, o el proteocéntrico de estructuras modeladas por una actividad funcional coherente frente al medioambiente. Pero, realmente, hay otra división más amplia en cuanto a los modelos disponibles, que abarca a la división anterior, y que también hemos esbozado:
·       La vida surgió por azar, en la Tierra, y quizá sea un suceso único -lo que algunos investigadores llaman “un accidente congelado”. En este modelo estaría el paradigma genocéntrico, actualmente representado, principalmente, por la hipótesis del “mundo de ARN”.
·       La vida surgió -en la Tierra, como podría surgir en otros rincones del Cosmos- como consecuencia de leyes naturales físicas y químicas; esto es, como resultado de la necesidad imperativa de los fenómenos naturales. En este modelo estaría alguna versión del paradigma proteocéntrico, y alguna hipótesis nueva sobre el origen de la vida, relacionada con el desarrollo temprano del metabolismo como punto de arranque de los procesos vitales.
Es comúnmente aceptado, que el origen de la vida comprende un periodo de tiempo que va desde el arranque de la evolución prebiótica molecular hasta el surgimiento de las primeras unidades de vida: esto es, las primeras células como unidades estructurales y funcionales de vida. Para ello, deben originarse e integrarse tres sistemas celulares, a saber: un compartimento membranoso, un metabolismo y un sistema de replicación de la información biológica adquirida. Muy sucintamente, vamos a repasar algunos de estos aspectos (como ya hemos comentado, se puede ampliar el tema en las entradas del blog anteriores citadas). En cuanto al compartimento, tan solo decir que es el sistema que menos problema da, ya que, por una parte, la termodinámica favorece la agrupación de lípidos en agua formando bicapas lipídica; y, por otra, no es tan importante su prioridad respecto al metabolismo o la replicación. El metabolismo sí plantea ya algunas hipótesis alternativas: puede organizarse bajo la actividad catalítica del ARN o bajo la actividad enzimática de las proteínas. Pero, ahora también surge la posibilidad alternativa de la hipótesis “primero el metabolismo”. Esta hipótesis ignora la posible prioridad de las proteínas, tanto en el metabolismo como en la replicación; y se centra en disputarla, en exclusiva, con el ARN. Los autores -J. Trefil, H. J. Morowitz y E. Smith- argumentan, al respecto, que la hipótesis de “El mundo de ARN”, aunque tiene a su favor el presentar una molécula autorreplicante con cierta actividad catalítica, responde al modelo de “accidente ccongelado” producido por azar: “Un escenario del tipo ҅primero el ARN en el que no se explique cómo surgieron las moléculas de ARN  nos parece una base inapropiada para establecer una teoría sobre el origen de la vida. La molécula de ARN, demasiado compleja, requiere un primer ensamblaje de monómeros y la concatenación posterior de monómeros para dar lugar a polímeros. Tratándose de un acontecimiento aleatorio en ausencia de un contexto químico estructurado, la probabilidad de que se produjera semejante secuencia de sucesos es prohibitivamente baja; asimismo, el proceso carece de una explicación química convincente”.
En la hipótesis de “primero el metabolismo” plantean que “la vida fue el resultado inevitable y progresivo del funcionamiento de las leyes de la física y de la química”. Se originaría, así, un ciclo metabólico reductor, compuesto por entramados sencillos de pequeñas moléculas, impulsado de forma necesaria por la termodinámica; esto es, la tendencia de los procesos hacia estados de menor energía libre. Las primeras reacciones podrían haberse desarrollado en los huecos de rocas porosas llenos de geles orgánicos. El metabolismo primitivo consistía en una serie de reacciones químicas sencillas que transcurrían por la actividad catalítica de entramados de moléculas pequeñas, quizás ayudadas por minerales allí presentes. El inicio pudo partir del núcleo del metabolismo actual -el ciclo de Krebs, del ácido cítrico o de los ácidos tricarboxílicos-, pero operando en el sentido reductor de los organismos quimiolitotrofos, aceptando electrones energéticos para formar macromoléculas reducidas a partir de otras oxidadas más pequeñas. En las fuentes hidrotermales profundas se originan moléculas de hidrógeno y de dióxido de carbono. La tendencia termodinámica hace necesario el descenso de electrones hacia niveles de menor energía, por lo que los electrones del H2 se transfieren al CO2, produciendo acético y agua.
Las etapas fundamentales del origen y evolución de la vida deben explicarse mediante largos procesos concatenados y escalonados, sin recurrir a sucesos aleatorios altamente improbables. De esta manera, se iniciaría el metabolismo antes de la entrada en escena del ARN. Pero, quizá las proteínas -que no tienen las dificultades del ARN, ni para su síntesis, ni para su estabilidad- pudieron haber intervenido en el origen del metabolismo, o coevolucionar con el mismo. En cualquier caso, el paradigma proteocéntrico coincide con la hipótesis de “primero el metabolismo” en salirse de la lógica del “accidente congelado”, fruto único del azar; para considerar la vida hija legítima de la evolución de la materia, regida por los mismos principios físicos y químicos en todo los rincones del Cosmos. Pasaríamos así, del azar y la necesidad, que proponía J. Monod, a la necesidad de los fenómenos y la contingencia histórica de los sucesos.

¿Pudo surgir la vida de las proteínas?
Distintos motivos razonados, me llevaron a proponer un paradigma proteocéntrico del origen y evolución de los seres vivos, que también resultan, de forma inevitable y progresiva, del funcionamiento de las leyes de la física y de la química (A. Ogayar, 1991), (A. Ogayar, M. Sánchez-Pérez, 1998). Este paradigma, además, guarda coherencia con un modelo de evolución celular y eucariogénesis. A continuación, vamos a ver, muy sucintamente, el origen de la vida según este paradigma proteocéntrico (para una visión más detallada ver la entrada del blog de 2017, y las de 4 de marzo y 21 de abril de 2020).
En el paradigma funcional proteocéntrico la vida se elevaría, de forma contingente, sobre las interacciones moleculares necesarias -mediadas por el agua líquida- que, así, producen estructuras, que permiten un nuevo baile de interacciones necesarias, que van siendo seleccionadas al tiempo que integran las protofunciones vitales y las protoestructuras que las permiten y mantienen. Antes de continuar debemos aclarar qué entendemos por necesidad (ver la entrada del blog de 3 de abril de 2018: El azar, la necesidad y la contingencia). En la concatenación de interacciones materiales, no programadas ni dirigidas, que originan las estructuras vivas: necesidad-contingencia-nueva necesidad…; debemos distinguir entre necesidad imperativa (la que no puede dejar de ser, dadas unas determinadas condiciones) y necesidad funcional (igualmente imperativa, pero ya encauzada en una función.  Así, partiendo de unas determinadas condiciones físicas y químicas, unas moléculas iniciales interaccionan de forma necesaria (imperativamente), y originan unas nuevas estructuras moleculares; la contingencia ambiental selecciona estas estructuras, que, así, interaccionaran a su vez de forma necesaria según sus propiedades y condiciones ambientales, físicas y químicas. En esta concatenación entre necesidades y contingencias, se irán seleccionando protofunciones y protoestructuras que las satisfagan. La selección natural y la conservación de estas protoestructuras funcionales hará que sus nuevas interacciones imperativas, frente a los cambios de su medio ambiente, parezcan seguir un programa o proyecto dirigido a cumplir una determinada función vital; es por ello que, para subrayar el carácter de aparente teleología, sin serlo realmente, Monod utilizó el término teleonomía; aunque -como él pone la estructura (de origen genético) por delante de la función-, yo prefiero denominarlas interacciones imperativas funcionales o sencillamente necesidades funcionales. Así, con el origen de los seres vivos, se va tejiendo una red funcional de interacciones necesarias.
Está universalmente reconocido que, en el arranque del proceso contingente, que condujo a la vida, tuvo una importancia fundamental la intervención de una molécula extraordinaria: el agua líquida. Esta molécula presenta unas propiedades, físicas y químicas, extraordinarias que la dotan de una constelación de funciones biológicas muy importantes. Todas estas propiedades, y las funciones derivadas de ellas, proceden de la estructura reticular del agua líquida. Esta red dinámica se basa en la formación y rotura de puentes de hidrógeno entre los dipolos de moléculas de agua contiguas. Entre las propiedades más citadas del agua destacan: la acción disolvente, que la constituye en el disolvente universal; las elevadas fuerzas de cohesión y adhesión; el gran calor específico; el elevado calor latente de vaporización; los usos bioquímicos del agua, en la fotosíntesis y en las reacciones de hidrólisis; etc. Pero aquí me interesa señalar una propiedad que no se destaca tanto en los libros de texto: la capacidad del agua para formar estructuras. La fuerte tendencia del agua a mantener su estructura reticular, y a oponerse a cualquier otra molécula que la altere, hace que el agua rodee a los grupos polares y empaquete a los apolares. Esto es, se lleve bien con los primeros, que por ello se denominan hidrófilos; y mal con los segundos, que por ello se denominan hidrófobos. Cuando, en el agua, hay moléculas anfipáticas -esto es, que presentan los dos tipos de grupos, polares y apolares-; el agua empuja y empaqueta, mediante fuerzas hidrofóbicas, los grupos apolares que le molestan y mantiene el contacto con los grupos polares. Con este reordenamiento molecular de los grupos hidrofílicos e hidrofóbicos, en el seno del agua, se van generando estructuras esenciales para la vida, que se mantienen bien mediante fuerzas débiles pero cooperativas: de los grupos hidrofílicos con el agua que los rodea, y de los grupos hidrofóbicos entre sí, que fuertemente empaquetados, por el agua, pueden experimentar la atracción de las denominadas fuerzas de Van der Waals.
Así pues, del imperativamente necesario baile del agua con los grupos hidrofílicos e hidrofóbicos de determinadas moléculas presentes en la denominada sopa prebiótica, se irían formando y seleccionando macroestructuras moleculares como bicapas lipídicas y polipéptidos; con los que, merced a sus nuevas interacciones necesarias, se irían seleccionando, en coherencia funcional, las membranas del compartimento celular; las proteínas autorreplicativas tipo prión; y las enzimas del metabolismo primitivo: compartimento, replicación y metabolismo, los tres sistemas básicos celulares de las tres funciones vitales generales, nutrición, relación y reproducción. Tanto en los tres sistemas como en las tres funciones originarias tienen un papel fundamental las proteínas.
A diferencia del paradigma genocéntrico, aquí se presenta un paradigma funcional, que, sobre la base de la información conformacional de las proteínas, explica el universo de las interacciones moleculares que estructuraron a los seres vivos -desde su origen y durante su evolución- en la Tierra. Así pues, en este paradigma se propone que la etapa prebiótica y pregenética podría caracterizarse por la coevolución de información conformacional de tres tipos de proteínas, en interacción con las ribozimas -formando ribonucleoproteínas- de la que surgiría el código genético: primero conformacional y luego secuencial. Este triunvirato proteico puede constituir el mecanismo general de adaptación al medio en el nivel supramolecular: las proteínas intrínsecamente desordenadas (IDPs) se moldearían funcionalmente por unión a nuevos ligandos; los chaperones participarían estabilizando y guardando la coherencia funcional de las estructuras proteicas resultantes, tanto las pregenéticas como las genéticas; y los conformones (priones funcionales) seleccionarían y propagarían, desde las etapas prebióticas, las nuevas conformaciones.
En este paradigma la función es prioritaria a la estructura; y, en este juego funcional integrador, las nuevas estructuras aparecen como resultado de la plasticidad estructural de las previas en su continua interacción funcional (necesidad) con las contingencias de un medio cambiante. Así, los niveles de información pregenética, genética y epigenética responderían a la acumulación de “cultura molecular” de las proteínas en su peripecia evolutiva, desde el origen de la vida. De esta manera, el código genético se hace funcionalmente, no se “acierta”.  

¿Cuál es la naturaleza esencial de la vida en la Tierra?
Con las evidentes diferencias entre procariotas y eucariotas, con brechas y misterios insalvables entre ellos, podríamos llegar a plantearnos la posibilidad de estar ante dos orígenes diferentes de la vida, proteocéntrico y genocéntrico, cada uno con una naturaleza esencial diferente. Vamos a intentar analizar este dilema desde cada uno de los dos paradigmas.
En el paradigma proteocéntrico, la primera célula tendría una naturaleza heterótrofa, esencialmente eucariota: sería básicamente un núcleo, con un metabolismo elemental prácticamente limitado a la producción de proteínas y ácidos nucleicos, y una fisiología centrada en el tránsito de información externa, de la membrana celular al núcleo -rutas de transducción de señales-, y de respuesta adaptativa interna, del núcleo a la membrana celular. En el inicio y en el final de ambas rutas informativas podría estar presente la triada formada por IDPs, chaperones y conformones. Además, este flujo de información, entre el primordio de célula eucariota (a la que denominamos protocariota) y el medio externo, iría reforzado por una continua y contingente producción de vesículas de exocitosis (cargadas, en principio al azar, de proteínas y ácidos nucleicos) que, sin propósito alguno, colonizarían el medio exterior, e interiorizarían y seleccionarían partes de su “metabolismo” mineral abiótico. Muchas de estas vesículas estarían abocadas a volver, por endocitosis, a las células protocariotas. De esta manera, se iría haciendo, lentamente y de forma exógena, el metabolismo energético. Así, en el paradigma proteocéntrico -con este continuo baile de exocitosis y endocitosis- se formarían tanto los eucariotas como todos los acariotas (entidades sin núcleo verdadero): las arqueas, las bacterias y los virus.
Como apoyo de esta hipótesis, en el análisis genómico comparado, las bacterias aparecen como las portadoras de los genes del metabolismo, las arqueas -más próximas a los eucariotas- portan genes del procesamiento y transmisión de la información genética (replicación, transcripción y traducción); mientras que los genes exclusivos de los eucariotas están implicados en la factoría del núcleo -spliceosoma incluido-, en la transducción de señales y en los mecanismos de exocitosis y endocitosis. Por otra parte, la creciente acumulación de conocimiento respecto a las vesículas extracelulares conocidas como exosomas también sustentan fuertemente esta hipótesis (nota 1).
Respecto a la esencia de la naturaleza eucariota, conviene subrayar la importancia funcional de las IDPs, ya que intervienen como reguladoras en procesos celulares clave, tales como transcripción, traducción, transducción de señales y ciclo celular; así como en muchos procesos de adaptación molecular. Así pues, es posible que la funcionalidad esencial de la célula eucariota -y no determinados procesos exóticos- precise del concurso de éstas y, también, de otras proteínas -como los chaperones y los conformones- ya que, estas dos últimas, poseen, también, tanto alguna región desestructurada como un potente núcleo hidrofóbico (core), que les proporciona estabilidad y capacidad de modificar a otras proteínas. Esta acción conjunta de los tres tipos de proteínas puede estar implicada en los principales procesos celulares y etapas biológicas, desde el origen de la vida, es decir: en la ontogenia, en la filogenia y en la fisiología celular. A este respecto conviene resaltar que tanto los priones-conformones como las IDPs son muy resistentes a factores fisicoquímicos (calor, ácidos, radiaciones UV) característicos de ambientes extremos, como los que pudieron darse en la etapa prebiótica del origen de la vida.
Por otra parte, las IDPs intervienen también en muchas funciones de evidente implicación epigenética: metilaciones, acetilaciones, glicosilaciones, fosforilaciones, factores de transcripción, regulación de la transcripción y traducción, histonas, aminoacil-ARNt sintetasas, ensamblaje de grandes complejos proteicos, ribosoma, citoesqueleto, etc. Los polipéptidos desestructurados actúan como chaperones y proteínas de choque térmico (HSPs), por ejemplo, en el estrés hidríco, y también forman parte de esta familia de proteínas, lo cual confirmaría la relación funcional ancestral de las HSPs-chaperones con las IDPS y priones-conformones; por lo que es probable que las HSPs-chaperones surgieran como una familia proteica con características funcionales y estructurales intermedias entre las otras dos.
Es probable que la evolución de las IDPs haya ido de polipéptidos cortos (pregenéticos) -que formarían asociaciones de miniestructuras cuaternarias- a polipéptidos más largos (con síntesis genética), con dominios de estructura variable en el espacio y en el tiempo; y siempre acompañados de conformones y chaperones. Con el código genético aparece la invariancia secuencial; y, con el spliceosoma, el baraje y la unión de dominios en polipéptidos más largos, lo que proporciona un aumento de la heterogeneidad funcional y estructural de las proteínas desordenadas. Gracias a la interacción de la plasticidad pregenética con el medio, y los “pespuntes” genéticos, se va haciendo la variabilidad de la evolución. Las mutaciones -como los virus- serían daños o beneficios colaterales, fruto de la contingencia.
Así, en el paradigma proteocéntrico -con este continuo baile de exocitosis y endocitosis- se formarían tanto los eucariotas como todos los acariotas (entidades sin núcleo definido): el resto de las arqueas, las bacterias y los virus (ver entrada de 2017).  En este sentido, resulta interesante el que las regiones desestructuradas (características de eucariotas) no tengan actividad enzimática. Entonces, ¿cómo pudo formarse la actividad enzimática específica, que precisa de estructuras proteicas más estructuradas? Las enzimas específicas pudieron originarse, en la etapa genética, aumentando paulatinamente la afinidad desde reconocimientos de ajuste inducido a mecanismos del tipo llave-cerradura. Además, en el interior de las vesículas de exocitosis, tanto el material genético como las proteínas resultantes -ambos producidos de forma contingente, y necesaria, por la maquinaria nuclear que ya había iniciado su andadura genética- pudieron seleccionarse, sin problemas de coherencia funcional, en su encuentro con el premetabolismo mineral exterior. Algunas de estas vesículas alcanzarían la vida libre como acariotas, y otras volverían por endocitosis a la célula protocariota, proporcionando, así, los nutrientes necesarios. En algunos casos, se podrían establecer relaciones de endosimbiosis, integrando, así, el metabolismo exógeno conquistado. Es muy probable que se estableciese una línea evolutiva de endosimbiosis que, en vez de tratarse de un hecho puntual, pudiese continuar en determinados ambientes. Así, el inicio del metabolismo energético eucariota sería por integración funcional, en una línea evolutiva de endosimbiosis sucesivas, desde un metabolismo acariota exógeno.
En este modelo proteocéntrico, iríamos desde la evolución prebiótica hasta el protocariota (con lo que LUCA y LECA serían la misma célula), del que saldrían tres ramas: una rama central, o tronco principal, que constituiría la continuidad eucariota (es interesante recordar que los eucariotas son monofiléticos); otra rama, que partiría próxima al protocariota, que se escindiría en los dos grandes filos de las arqueas; y múltiples ramas entrecruzadas propias de los múltiples filos bacterianos. Además, prácticamente, cada tipo celular coevolucionaría con sus correspondientes virus específicos.  
En el paradigma genocéntrico, la información genética y su variabilidad marcaría el paso de la evolución, desde un origen de la vida procariótico. No obstante, muchos investigadores afirman estar lejos de saber cómo eran las primeras células; cuantos más datos se acumulan más misterios aparecen, y más difícil es casar las piezas del rompecabezas del origen de la célula eucariota a partir de las procariotas. Los principales datos utilizados en este enfoque son de tipo genético, comparando genes de organismos actuales, obtenidos tanto de cultivos celulares como, de forma masiva, aplicando técnicas de análisis metagenómico. Pero algunos investigadores opinan que los datos obtenidos mediante este enfoque presentan ciertas limitaciones. Por una parte, los análisis ponen de manifiesto que, en las primeras etapas de la historia de la vida, diferentes grupos de genes cambiaron a distintas velocidades; produciéndose, en general, una evolución inicial acelerada, por lo que no podemos evaluar igual a unos grupos de genes que a otros. Por otra parte, el paradigma genocéntrico se enfrenta con otras controversias: ¿cuántos dominios presenta el árbol evolutivo, dos o tres? ¿Cómo es el proceso de eucariogénesis: gradual con algún suceso de endosimbiosis -como el origen de la mitocondria y el cloroplasto- o totalmente de endosimbiosis en serie? Como es bien sabido, la “Teoría de la endosimbiosis serial” fue propuesta por Lynn Margulis (1967), y, básicamente, dice que la célula eucariota se formó por la fusión de tres bacterias completas que aportarían, respectivamente: los microtúbulos del citoesqueleto, parcelas del metabolismo, y la mitocondria. La posterior endocitosis, por parte de alguna de estas células eucariotas, de una cianobacteria daría lugar a la célula eucariota vegetal. Por otra parte, investigadores como Carl Woese proponen tres grandes dominios celulares: dos procariotas -Archaea y Bacteria- y uno eucariota, Eukarya; además es partidario de un proceso clásico de evolución gradual, con sólo dos sucesos endosimbióticos, que darían lugar a la mitocondria y al cloroplasto, a partir de una alfaproteobacteria y una cianobacteria, respectivamente. Otros, como J. A. Lake, son partidarios de un árbol con dos dominios, Bacteria y Archaea, con los eucariotas formando una rama secundaria más de estos últimos.
Mediante análisis metagenómicos se ha visto que buena parte de los genes homólogos entre los eucariotas y las arqueas están dentro del super filum TACK (Taumarchaeota, Aigarchaeota, Crenarchaeota y Korarchaeota), incluyendo los genes de la actina, tubulina, sistema de la ubiquitina y una gran parte de genes de la maquinaria ribosómica. Los mayores parecidos entre eucariotas y el grupo TACK se encuentran al comparar las secuencias de los genes involucrados en la transcripción y la traducción: cuatro proteínas ribosomales, la subunidad RpoG de la ARN polimerasa, y el factor de elongación Elf1. En 2015, el grupo liderado por Thijs J. G. Ettema descubrió un nuevo filo de arqueas en las profundidades del Ártico; mediante análisis metagenómico se ha visto que está muy emparentado con el superfilo TACK, y -siguiendo la moda de poner nombre de dioses nórdicos a estos grupos de arqueas- le han denominado phylum Lokiarchaeota. Este grupo de arqueas es una rama monofilética que está muy relacionada con los eucariotas, por lo que se cree que provienen de un mismo ancestro común. En las arqueas de Loki se encontraron genes homólogos de otros genes eucariotas implicados en la forma de las células y en el procesamiento de las membranas: genes de la actina; genes de pequeñas GTPasas con función reguladora relacionados con la fagocitosis; un grupo de genes denominados ESCRT (Endosomal Sorting Complexes Required for Transport) implicados, en eucariotas, en la formación de vesículas y endosomas. Por otra parte, las Lokiarqueas presentan los ribosomas más parecidos a los eucariotas, de todos los grupos procariotas. Con estos datos, los investigadores suponen que la arquea ancestral -de Lokiarchaeota y eucariotas- tuviese algún esbozo de citoesqueleto, la posibilidad de desplegar la formación de vesículas de exocitosis y la capacidad de fagocitar. Esta célula ancestral podría ser perfectamente el protocariota propuesto.
Sin embargo, todos estos genes semejantes no se encuentran reunidos en un solo representante del grupo TACK, sino que están repartidos entre todos ellos. Este inquietante hecho ha recibido explicación, dentro del paradigma genocéntrico, como posibles procesos de pérdida de genes o de transferencia genética horizontal. En la hipótesis del protocariota formador de “semillas” acariotas, este hecho puede explicarse considerando que, inicialmente, tanto la reproducción del protocariota como la formación de vesículas (semillas) propuestas, son sucesos contingentes imperfectos, sin propósito, pero sometidos a selección natural. De esta manera podrían producirse grupos de arqueas, más o menos viables, que portaran genes eucariotas, provenientes del protocariota, pero sin la integración funcional que tenían en éste.
Por otra parte, los genes implicados en procesos de transcripción y traducción no se han visto tan frecuentemente afectados, por procesos de herencia genética horizontal, como los genes del metabolismo. Este hecho, y su explicación, puede ser complementaria de la anterior. Las arqueas provenientes del protocariota ancestral que fuesen formas de reproducción imperfectas, pero viables, escaparían pronto del baile de exocitosis y endocitosis con él; por lo que sus genes habrían llegado más bien por herencia vertical. Sin embargo, los genes del metabolismo son bacterianos, y están sometidos a un gran trasiego de herencia genética horizontal por el baile continuo de exocitosis y endocitosis de los ancestros bacterianos, ya que provendrían de vesículas (semillas) más imperfectas (con menos carga de proteínas y genes, y menor viabilidad), y que, por lo tanto, estarían abocadas a volver a contactar con receptores complementarios del[AOS1]  protocariota. De esta manera, paulatinamente, se iría haciendo el metabolismo eucariota, a partir de los metabolismos exógenos conquistados por las protobacterias. Para la hipótesis de los tres dominios, la aparición de los eucariotas ocurrió muy pronto; y, por ello, sitúa el dominio Eukarya muy próximo al Archaea. Esta proximidad concuerda con la hipótesis del protocariota, pero, en esta última hipótesis, las arqueas proceden de los protocariotas y no al revés. Como ya dijimos anteriormente, en la hipótesis de los dos dominios los eucariotas quedan reducidos a una rama lateral de Archaea, próxima al superphylum TACK.
Otro problema importante por resolver, en este marco teórico, es el relativo a la naturaleza de las membranas de bacterias, arqueas y eucariotas. Las bacterias y los eucariotas presentan enlaces éster en los fosfolípidos de sus membranas, mientras que las arqueas presentan enlaces éter. Dentro del paradigma genocéntrico procariota, se abren dos alternativas para la eucariogénesis mediante fusión de una arquea y una bacteria: que una bacteria fuera la célula hospedadora, y una arquea el endosimbionte hospedado; o que, por el contrario, el hospedador fuera una arquea, y el endosimbionte una bacteria. Dado que la célula eucariota presenta fosfolípidos con enlaces éster, como la bacterias, en el segundo caso sería más difícil explicar el cambio de membrana celular arquea, de enlaces éter, a enlaces éster. De nuevo, creo que la posible explicación desde la hipótesis del protocariota es más fácil: las vesículas de exocitosis serían como las de las células eucariotas y bacterianas, y, en una etapa muy temprana, las primeras arqueas de vida libre -seguramente por adaptación a ambientes hipertermales- pudieron adaptarse al modificarse los enlaces éster a éter. Esta explicación debe ir acompañada de una consideración. En el modelo genocéntrico, está generalmente admitido que la célula eucariota -producida por uno o más sucesos de endosimbiosis entre procariotas- presenta genes relacionados con arqueas y bacterias, y se piensa que proceden de ellos. Se admite, igualmente, que las arqueas aportarían, fundamentalmente, los genes relacionados con la información genética (replicación, transcripción y traducción), y algunos superfilos como TACK aportarían algunos grupos de genes confusamente dispersos; por su parte, las bacterias aportarían los genes del metabolismo, como ya vimos anteriormente. En la hipótesis del protocariota, esto supondría que las arqueas se habrían formado, tempranamente, como resultado de ensayos imperfectos de las primeras divisiones celulares del protocariota, portando constelaciones muy diversas de genes; la selección natural daría pronto cuenta de dos grandes filos de arqueas independientes y con el sello de origen genético eucariótico. Seguramente, las arqueas participarían menos que las bacterias en el baile de endocitosis con posibilidades simbióticas; serían más bien fagocitosis nutricionales. Las bacterias, probablemente menos independientes inicialmente, sí experimentarían procesos de fagocitosis con más posibilidades de endosimbiosis en serie. Colonizarían todos los medios que presentasen un metabolismo mineral previo, y los protocariotas irían incorporándolo paulatinamente a su organismo, según fuera sometido a selección natural; un paso fundamental consistiría en la incorporación del metabolismo oxidativo, mediante endosimbiosis, de la bacteria precursora de la mitocondria. Además de la eficiencia energética, con esta endosimbiosis, los nacientes eucariotas comenzarían a paliar los efectos tóxicos del oxígeno atmosférico. En consonancia, con todo esto, está el hecho de que un grupo de investigadores ha encontrado que las proteínas más antiguas de los eucariotas son las que, como ya hemos visto, guardan relación con las arqueas; mientras que las de edad mediana son de origen bacteriano, pero procedentes de muy distintos grupos de bacterias, no de uno sólo. Les llama la atención que estas proteínas estén presentes en los sistemas de membranas intracelulares del retículo endoplásmico y del aparato de Golgi, lo que plantea la pregunta ¿de qué bacteria, portadora de estos sistemas membranosos, salieron los genes que fueron a parar a los eucariotas? De nuevo, el misterio encuentra una respuesta más fácil en la hipótesis del protocariota, ya que, con este sistema de endomembranas se hace el sistema vesicular de exocitosis y endocitosis con el que se produciría el continuo baile, de ida y vuelta, de las “semillas” acariotas: bacterias y virus, fundamentalmente. Así pues, estos sistemas membranosos no saldrían de ninguna bacteria, desconocida y especial, sino que saldrían del protocariota para formar todas las bacterias: exocitosis de vesículas tipo exosomas, y posterior vuelta, vía endocitosis, portando parcelas del metabolismo mineral exterior.
En cualquier caso, tanto la hipótesis de los dos dominios -con una arquea del superfilo TACK, o similar, como hospedadora de una bacteria- como la hipótesis de los tres dominios, donde sería una bacteria la hospedadora; lo que sigue siendo muy difícil de explicar es la presencia en eucariotas, como esencia del grupo, de 347 genes exclusivos que no están organizados funcionalmente en ningún procariota. El salto no puede ser más abismal, pero, como ya vimos, la hipótesis del protocariota -dentro del paradigma proteocéntrico del origen de la vida- sí puede dar cuenta de estos genes eucariotas, y de su relativa presencia en los acariotas. Con las últimas investigaciones se ha reforzado este estado de la cuestión. Lo ya visto en el super filo TACK, y la hipótesis de los dos dominios, se ha ampliado, mediante análisis metagenómicos, a otros filos: las arqueas de Loki, ya visto, y al superfilo de las arqueas de Asgard (Loki, Thor, Odín y Heindall), con genes similares a los eucariotas que intervienen en el transporte, la transmisión de señales, la degradación de las proteínas y el citoesqueleto (tubulina); pero, de nuevo, las secuencias descubiertas no constituyen el plano de un complejo citoesquelético eucariota completo. La distribución de los genes eucariotas resulta desigual en el superphylum de Asgard. Ningún grupo de arqueas parece poseer el juego completo. Los investigadores llegan a pensar que el pequeño tamaño de las células procariotas puede hacer innecesarios estos mecanismos de tráfico intracelular.
En enero de 2020, un grupo de científicos japoneses han logrado aislar y cultivar arqueas del superphylum Asgard. El éxito ha sido posible gracias a que dejaron crecer estas arqueas con otros organismos del ambiente, lo que indica posibles procesos de simbiosis entre ellas. Esto concuerda, con lo visto hasta ahora, de grupos de arqueas -próximas al superphylum TACK, como Loki y Asgard- con dotaciones genéticas incompletas de genes eucariotas, algunos en apariencia innecesarios. Curiosamente, las arqueas de Asgard aisladas se alimentaban de aminoácidos. Los datos de este trabajo, también cuadran con la hipótesis del protocariota, dentro del paradigma proteocéntrico, que situaría a estos grupos de arqueas, próximos al protocariota, como células imperfectas empujadas a la simbiosis.
En 2015, se publicó el último árbol de la vida, bastante ampliado, ya que incluye a los microorganismos no cultivables, identificados genéticamente mediante técnicas metagenómicas. Así, se ha construido un nuevo árbol de la vida sobre 2000 genomas completos obtenidos de bases de datos públicas, más 1011 genomas nuevos reorganizados a partir de secuencias obtenidas en diferentes ambientes. Con todos estos genomas se compararon las secuencias del ADN correspondiente a 16 proteínas ribosomales, y se obtuvo un árbol con 92 phyla en el dominio Bacteria, 26 phyla en el Archaea y sólo cinco supergrupos en el dominio Eukarya. En este árbol se aprecia que Bacteria es el dominio con más diversidad genética. Archaea es menos abundante y diverso que Bacteria. Los autores de este árbol interpretan que la mucha menor biodiversidad genética de Eukarya se debe a su más reciente evolución.
Como ya expuse anteriormente, creo que hay dos grandes naturalezas esenciales de la vida coexistiendo en los seres vivos:
·       Por un lado, tendríamos una naturaleza -prioritaria en el origen y en la evolución de la vida en la Tierra- claramente proteocéntrica y epigenética, que se materializa en los eucariotas. Éstos provendrían, por línea directa, del protocariota ancestral; identificado, a la vez, como LUCA y LECA.
·       Por otro lado, la segunda naturaleza sería la de las “semillas acariotas”: arqueas, bacterias y virus; las dos últimas son manifiestamente genéticas. Las arqueas tendrían su origen en un punto intermedio entre formas de reproducción imperfecta y semillas.
Es lógico que, como necesidad imperativa, y sin propósito alguno, se fueran produciendo vesículas de distintos tamaños, y con más o menos carga proteica y genética; así se irían afinando paulatinamente las formas reproductivas. El hecho de que, también sin propósito alguno, muchas vesículas presentasen proteínas con complementariedad geométrica o de cargas con las de la membrana protocariota, facilitaría necesariamente la endocitosis de las vesículas. De esta forma, muchas vesículas serían capaces con los recursos moleculares disponibles, de tomar nutrientes del entorno, crecer y multiplicarse. Así, de esta auténtica siembra acariota, las bacterias serían las menos perfeccionadas, y, por lo tanto, las más proclives a acercarse de nuevo al protocariota; y, así, podrían ser fagocitadas por él, o establecer algún tipo de simbiosis con los protocariotas, con otros tipos celulares o con células incompletas. No obstante, paulatinamente, muchas vesículas se irían haciendo bacterias de vida libre, que irían colonizando medioambientes muy diversos, haciendo, poco a poco, el metabolismo energético con los mecanismos genéticos disponibles. Este planteamiento es compatible con la idea de que los eucariotas evolucionaron como quimeras por la vía de fusiones endosimbióticas en las que participarían tanto bacterias como arqueas. En este sentido, se puede explicar la aparición en el nuevo árbol de un gran número de linajes sin ningún representante aislado, esto es, no cultivados. La mayoría de estos se agrupan en una misma región del árbol, denominada CPR (Candidate Phyla Radiation). Los géneros de este nuevo grupo CPR son todos portadores de genomas pequeños, la mayoría con capacidades metabólicas restringidas, no tienen ciclo de Krebs, ni cadena respiratoria; además, presentan problemas para la síntesis de nucleótidos y aminoácidos, por lo que muchos son simbiontes. Los autores se plantean si esto es debido a una pérdida progresiva de capacidades o si, por el contrario, son características genéticas heredadas de una forma ancestral de vida muy simple. De nuevo, pienso que son una prueba más de las “semillas” acariotas imperfectas, en la hipótesis del protocariota propuesta.

Los virus como semillas celulares con función de agentes genéticos móviles
Los virus -desde su posible origen, no finalista, como semillas de la célula protocariota, y su posterior papel como agentes genéticos móviles- tienen tendencia a ser específicos del tipo celular que los produce, y a coevolucionar con él; pero, también sin propósito alguno, pueden interaccionar de forma cruzada con otros tipos celulares.
El hecho de que los virus sean polifiléticos -con un origen diferente para cada familia, y sin compartir genes entre ellas- apoyaría la hipótesis del protocarionte formador de semillas: cada virus coevolucionaría con su célula.
Es muy probable que la selección natural fuese estableciendo sistemas de coevolucionabilidad celular basados en las interacciones proteicas específicas y en el consiguiente intercambio de material genético. Al menos con cierta frecuencia, estos sistemas cooperativos -cooperación sin propósito alguno, de forma involuntaria, sólo favorecida por la selección natural- podrían incluir algún eucariota, algún acariota celular y los virus correspondientes de todos ellos. En este sentido, parece que se exaltaría la interacción entre virus y protocariotas en algunos ambientes extremos.
Con estas premisas, es probable que primero apareciera el sistema protocariota-virus ARN, primer ácido nucleico y primera célula (que derivarían directamente de la relación inicial entre proteínas y ARN, heredada del proceso de splicing). Con la conquista del ADN, probablemente le seguirían los sistemas: protocariota-virus ADN-arqueas, y protocariota-virus ADN-bacterias.   
Existen relaciones evolutivas entre los virus y otros elementos genéticos móviles: viroides, transposones, ARNs satélites y plásmidos; pero, seguramente por su mayor simplicidad, todos estos agentes sean posteriores a la aparición de las células protocariotas entorno al splicing y el resto de la factoría del núcleo: gobierno proteico del ARN -con la selección de módulos proteicos- y los mecanismos de replicación, transcripción y traducción (con ARNt, ribosomas y aminoacil-ARNt sintetasas).
En coherencia con lo expuesto hasta ahora, las similitudes estructurales entre proteínas, con secuencias diferentes, de las cápsidas de varias familias víricas; se pueden deber a procesos de divergencia (más que de convergencia) evolutiva: se parte de los mismos módulos proteicos básicos, pero –como ocurre con todas las proteínas- con una deriva secuencial conservadora de la estructura.
Durante el ciclo de infección vírica, se suele producir un significativo aumento de variabilidad genética y de capacidad adaptativa, mucho mayor en los virus ARN. 

¿Lucha por la existencia o cooperación en la evolución?
Con cierta frecuencia nos encontramos, en varios dominios de la biología, con asociaciones de ideas que siempre me han parecido faltas de rigor científico. Una de las más frecuentes tiene que ver con la utilización de la figura de Darwin y del darwinismo en general como apoyo de ideologías políticas y económicas, como el nazismo y el liberalismo. Este uso espurio -y obviamente peligroso- de la teoría darwiniana, ha calado también entre algunos científicos, en mayor o menor medida, llegando, por una parte, a presentar al darwinismo -sobre todo al neodarwinismo de la teoría sintética- como producto y sustento del liberalismo; y, por otra, al neolamarckismo como estandarte del socialismo. La realidad es que los que así piensan, tratan con poco rigor las obras de Lamarck y de Darwin.
Para empezar, aunque no es el tema que quiero tratar aquí, la esencia de la teoría sintética neodarwinista tiene fuertes desencuentros con la esencia de la teoría de Darwin. Por otra parte, en El origen de las especies por medio de la selección natural, Darwin subraya qué entiende por lucha por la existencia: “utilizo el término lucha por la existencia en el sentido general y metafórico, lo cual implica las relaciones mutuas de dependencia de los seres orgánicos y, lo que es todavía más importante, no sólo la vida del individuo, sino su aptitud y éxito en dejar descendencia”. Además, para Darwin la evolución es el resultado, sin propósito ni dirección, del encuentro casual de necesidades ciegas. Así, la selección natural no es un mecanismo, es el resultado sumario, la acumulación, en cada momento, de las variantes afortunadas con la supervivencia; independientemente de cómo se hayan producido esas manifestaciones variables de la materia viva.
Por otro lado, los humanos somos los únicos animales con capacidad para pensar, para hacer un proyecto, para plantearse una meta. Sin embargo, en estos tiempos aciagos, con la pandemia del coronavirus que ha originado la Covid-19, y con otras muchas otras amenazas pendiendo sobre nuestras cabezas, nos encontramos a científicos y políticos hablando del virus como si fuera una mente maligna que decide estrategias de propagación, enfermedad y muerte; estrategias malvadas, a las que tenemos que responder militarmente porque estamos en guerra contra el virus. Se puede justificar este tratamiento con explicaciones del tipo: “es una manera de hablar”; “así la gente lo entiende mejor”; pero yo creo que siempre es mejor explicar las cosas como son en realidad, ya que, si se explican bien, la gente lo entenderá; porque, quizá, son algunos de los científicos y políticos, que así hablan, quienes no lo entienden bien. El hecho cierto es que “la guerra” debíamos declararla contra nuestra organización -o mejor desorganización- social y económica: la pandemia ha sido fruto de ella. No es este el lugar de entrar en el tema, y, además, mucha gente lo ha tratado ya.
Vuelvo, pues, al discurso de partida: la naturaleza humana y su organización social, económica y política no pueden servir para explicar el resto de la naturaleza, y viceversa. La diferencia fundamental es que nosotros tenemos, para bien o para mal, propósitos, finalidades, y capacidad para corregirlos; el resto de la naturaleza no, aunque, eso sí, mantenga una gran coherencia -que los científicos deben intentar desentrañar- entre la necesidad reglada de los fenómenos y la contingencia histórica de los sucesos.
Así pues, nuestra necesidad social de cooperación, solidaridad y generosidad no puede servir para extrapolarla al entendimiento del origen, naturaleza y evolución de los seres vivos. Hay que mirar a la naturaleza libre de prejuicios políticos: no podemos contraponer, de forma excluyente, relaciones y comportamientos que observamos en la naturaleza, como, por ejemplo, lucha y cooperación. Algunos investigadores, contraponen simbiosis a selección natural. La simbiosis es un tipo de relación, entre individuos de diferentes especies, que supone una discontinuidad, un salto entre las dos previas y el nuevo individuo resultante. Se contraponen aquí el gradualismo -que se atribuye gratuitamente a la selección natural- con el saltacionismo de la simbiosis. Esto tiene un interés especial en procesos tan importantes como el origen de la célula eucariota mediante simbiosis. Aunque resulta difícil de evitar, debemos tener cuidado con la cantidad de detalles que añadimos al elaborar una teoría interpretativa de un hecho. Aún más, el simple enunciado de un hecho ya puede venir preñado de interpretación. Así pues, en el caso del origen de la célula eucariota, ha podido ocurrir que se haya producido una evolución gradual del ancestro común, hasta el eucariota, con un momento puntual de endosimbiosis; o, también, una evolución, más gradual que la anterior, por endosimbiosis seriada; o una mezcla de las dos. Así, los contrarios en este proceso de eucariogénesis pueden ir de la mano; y, además, no tratarse sólo de simbiogénesis vs gradualismo neodarwinista; también juegan aquí los opuestos lucha vs cooperación.
Algunos biólogos piensan que ciertos mecanismos generadores de variabilidad -como la endosimbiosis, la hibridación y la transferencia genética horizontal- unen las ramas del árbol de la vida, a diferencia de la selección natural que las diversifica y separa. Más bien, la selección natural debe ser entendida como el resultado, en cada instante, de la dialéctica material ser vivo-medio; esto es, el estado dinámico, momento a momento, de la estructura material de la naturaleza viva, coseleccionada en su constante interacción.
En resumen, pienso que no hay que ver estos opuestos como entes que se excluyen como regidores principales de la evolución biológica. No todo es lucha y selección, o cooperación y combinación; los opuestos están en las interacciones necesarias y contingentes, como resultado dinámico de estas interacciones; esto es, como información biológica recogida en la función y en la estructura resultantes. Los opuestos se manifiestan en el tejido material de la realidad, en constante interacción entre la necesidad o causalidad de los fenómenos y la contingencia o casualidad de los sucesos. Es de estas interacciones materiales, sin propósito, -y no de ninguna idea regidora- de donde surgen los opuestos o contrarios. Así, en un determinado momento de la evolución prebiótica, de las interacciones entre proteínas y ARN, van surgiendo protofunciones y protoestructuras de las que, mediante selección natural, irán surgiendo la relación de código genético y estructuras como el ribosoma, entre otras. Igual ocurre con la función de corte y empalme del ARNm y el spliceosoma. Igualmente, según las circunstancias ambientales, un evento de endocitosis, puede ser fijado, por selección natural, como fagocitosis o como endosimbiosis; según hemos visto que sucedió muchas veces en el proceso de origen de la célula eucariota con las adquisiciones de la mitocondria y el cloroplasto.
Vemos que, en determinadas circunstancias, las incesantes interacciones entre estructuras biológicas -en principio sin propósito alguno, pero guardando la coherencia funcional de lo ya tejido y seleccionado por la evolución-, pueden dar lugar a una, a nuestros ojos, aparente relación de lucha o de simbiosis.

(Nota 1) LOS EXOSOMAS COMO VESÍCULAS DE EVOLUCIONABILIDAD PROTOCARIOTA.

En una entrada anterior (2017) –Origen de la vida y origen de la célula eucariota- propuse la hipótesis del protocarionte o protocariota, como la primera célula en el origen de la vida. Esta célula primitiva tendría las características básicas de los eucariotas –correspondientes a 347 genes exclusivos de ellos, relacionados con la endocitosis, el sistema de transducción de señales y la síntesis de proteínas en el núcleo- y un particular sistema de evolucionabilidad.

Sin entrar aquí en muchos detalles (ver entrada citada) el propósito de esta nota es la posible relación de los exosomas –por su universalidad, filogénica y funcional, en la comunicación intercelular- con las vesículas o semillas de evolucionabilidad: arqueas, bacterias y virus. Entre las principales ventajas de estas vesículas de evolucionabilidad (el término semillas sólo es para dar fuerza expresiva a la idea de siembra de vesículas acariotas) estaría la exaltación de mecanismos de herencia horizontal, que propiciaran una evolución exógena al protocarionte, como la evolución exógena del metabolismo energético, a cargo de algunas de estas vesículas que devendrían en bacterias. Las vesículas que, al azar, portasen un equipamiento enzimático primitivo, fundamental para realizar un metabolismo básico, podrían ir colonizando ambientes diversos, y ser fagocitados por el protocariota.
Así pues, el metabolismo se desarrollaría desde las vesículas acariotas (bacterias), expulsadas y, posteriormente, endocitadas, de forma sucesiva, por las protocariotas. Sería un metabolismo externo al protocariota y realizado en el acariota con las proteínas y genes que, al menos inicialmente, le proporcionara el protocariota. La externalización tendría como ventaja inicial la selección exterior, en ambientes muy diversos, de las adaptaciones más ventajosas, y que esto fuese más fácil que el desarrollo interno de un complejo sistema de integración de módulos en el protocariota.  
Los eucariotas se formarían mediante el baile continuo de interacciones entre protocariotas y acariotas: los precursores protocariotas más eficaces serían los que comenzaran una actividad fagocítica cada vez más específica, de la que dependería su nutrición, ya que la sopa primigenia se iría esquilmando. Es probable que la aparición del oxígeno -tras la fotosíntesis oxigénica- y su toxicidad para los protocariotas, promoviera en éstos el paso de la fagocitosis a la endosimbiosis, fundamentalmente para aprovechar los sistemas enzimáticos de adaptación al 02, de las bacterias precursoras de las mitocondrias.
Inicialmente, al menos, todas las proteínas con especificidad complementaria, tanto las de las membranas protocariotas como las de las membranas acariotas, procederían de los protocariotas.
Así, durante este largo periodo, la selección natural favorecería las variaciones de los protocariotas que lograran:
1)      Producir exomódulos acariotas, englobados en vesículas exosómicas, con un metabolismo cada vez más eficaz que interiorizara los metabolitos ambientales más apropiados y los transformara convenientemente. Esto constituiría una especie de cultivo celular acariota.
2)      Expulsar –por exocitosis y gemación- y, posteriormente, endocitar, de forma continua, las vesículas y exomódulos con especificidad creciente, y seleccionarlos por su eficacia metabólica, desarrollando así un sistema interno de transducción de señales. Este proceso culminaría con la adquisición de mitocondrias y la consiguiente formación de la célula eucariota. 
3)      Desarrollar los mecanismos genéticos que exaltasen la variabilidad y especificidad: virus, elementos genéticos móviles y otros mecanismos de herencia genética horizontal. 
Así, paulatinamente, se produciría el origen único de la célula eucariota (origen monofilético), con la posterior selección e incorporación de las vesículas y exomódulos acariotas más eficaces -ya que los protocariotas constituirían el único vórtice de esta selección- y, al mismo tiempo, una auténtica explosión de diversidad acariota: arqueas, bacterias y virus. 


BIBLIOGRAFÍA
·       Darwin, C. El origen de las especies. Ed. Bruguera. Barcelona (1980).
·       Ogayar, A. Presentación antigénica y puzle conformacional. Una hipótesis (I y II). Inmunología (1991) Vol. 10, nº 1, 19-23; y nº 3, 97-103.
·       Ogayar, A., Sánchez-Pérez, M. Prions: an evolutionary perspective. International Microbiology (1998) vol. 1, nº 3, 183-190.
·       Imachi, H. et al. Isolation of an archaeon at the prokaryote-eukaryote interface. Nature (2020). Published online: 15 January 2020. https://doi.org/10.1038/s41586-019-1916-6
·       Zaremba-Niedzwiedzka, K. et al. Asgard archaea iluminate the origin of eukaryotic cellular complexity. Nature (2017). Published online: 11 January 2017.   doi:10.1038/nature21031
·       Orígenes de la vida. Temas Investigación y Ciencia, Nº 96, abril/junio 2019:
o   Szostak, Jack W. ¿Cómo nació la vida?
o   Ricardo, Alonso y Szostak, Jack W. El origen de la vida.
o   Trefil, James; Morowitz, Harold J. y Smith, Eric; El origen de la vida.
o   Gabaldón Toni; El origen de las células.
o   McInerney, James O. y O’Connell, Mary J. Nuevos datos sobre el origen de la célula eucariota.









martes, 21 de abril de 2020

PROGRAMA GENÉTICO O INTERACCIÓN ORGANISMO-AMBIENTE




¿Genética o medio ambiente?

Esta disyuntiva aparece frecuentemente en muchos planteamientos biológicos, a veces sin profundizar demasiado en estos conceptos, provocando cierta confusión. A mi juicio, el primer error, por parte de algunos autores, viene de la hipertrofia e imprecisión de los conceptos asociados a “lo genético”; necesariamente acompañado de la minimización y simplificación de lo relativo al medio ambiente. Así, es frecuente encontrar textos donde prácticamente se asimila genotipo con organismo, al exagerar la fórmula: Fenotipo = genotipo + ambiente; en una identificación, parcelada y mecanicista, del fenotipo con el organismo, como mera expresión del genotipo. En este contexto, el medio ambiente aparece meramente, de forma deslavazada, como las influencias externas que afectan al genotipo. Aún más confusión provoca la frecuente identificación -con el mismo planteamiento de la fórmula anterior- de la personalidad humana como la suma de naturaleza y medio ambiente. Aquí, por naturaleza se entiende el genotipo con el que un individuo viene al mundo. Pero el término genotipo se queda pequeño en estos planteamientos. Por una parte, frecuentemente, representa sólo una visión parcial y aislada de ciertos caracteres fenotípicos, refiriéndose, con él, al conjunto pequeño de genes que se exhiben como responsables de un carácter o unos pocos. Por ello, para darle más profundidad e importancia a estos planteamientos reduccionistas, se emplea cada vez más el término “programa genético”; pero ¿Qué se entiende por programa genético? Para llegar a este concepto vamos a tocar, aunque sea someramente, otros que he mencionado previamente, como naturaleza y gen.

¿Qué entendemos por naturaleza? En lo referente al término naturaleza, por su implicación en el concepto básico de la teoría de la evolución darwiniana, voy a recoger la argumentación de Darwin a las críticas de algunos autores a la selección natural, en el sentido de atribuir a este término una elección consciente por parte de los animales que se modifican, y que, por esto mismo, no se podría aplicar a las plantas, por carecer éstas de voluntad. Darwin expresa, dolido, la incomprensión de su concepto evolucionista fundamental (1):

“Se ha dicho que hablo de la selección natural como de un poder activo o divino; pero ¿quién critica a un autor cuando habla de la atracción o de la gravitación como rectoras de los movimientos de los planetas? … También es muy difícil evitar personificar el término Naturaleza; pero por Naturaleza entiendo solamente la acción combinada y los resultados complejos de un gran número de leyes naturales; y por leyes, la sucesión de hechos, en cuanto son conocidos con seguridad por nosotros.”
 Así pues, para Darwin el término Naturaleza tiene el mismo poder y alcance que otros como Cosmos y medio ambiente; aunque, éste, reducido a las dimensiones de la vida en la Tierra-.  En todos estos términos hablamos de seres materiales, de diferentes niveles de integración, que interaccionan y se modifican, de forma regular, sometidos a leyes. El concepto de medio ambiente tiene un uso más práctico, y abarca todos los factores bióticos (los seres vivos y los agentes relacionados con la vida) y los abióticos (seres no vivos, o factores físicos y químicos), que interaccionan entre sí de forma natural. Darwin lo tiene presente, sin nombrarlo especialmente (1):
“…yendo hacia el norte, o ascendiendo una montaña, con mayor frecuencia nos encontramos con formas enanas, debido a la acción directamente perjudicial del clima…”
“…plantas y animales se hallan entrelazados por una trama de complejas relaciones.”
“La estructura de todo ser orgánico está relacionada, de la manera más esencial, con la de todos los seres orgánicos con los que entra en competencia, de los que tiene que escapar o a los que depreda.”
Así pues, Darwin deja claro, en su enfoque evolutivo, cómo las especies se relacionan tanto entre sí como con su ambiente físico y químico, en una red dinámica de interacciones mutuas, mantenidas en el espacio y en el tiempo. Todos los organismos vivos, lo son -tanto en la ontogenia, como en la filogenia y la fisiología- como resultado necesario de esta red dinámica de interacciones naturales.

¿A qué llamamos gen? Como ya hemos visto en post anteriores, el término gen aparece, históricamente, como sustituto de los factores hereditarios que Mendel postuló como unidades o partículas de información, responsables de determinados caracteres observables y heredables. Durante la década de los 40, del siglo XX, se alcanzó la fusión de dos de las ramas de la biología, que nacieron en 1900 y más éxito alcanzarían -la genética y la bioquímica- al relacionar una enfermedad metabólica con los genes. La ciencia estableció, de forma rigurosa, la relación “un gen una enzima”, que más tarde se universalizó a “un gen un polipéptido”. Pero, a algunos, esta relación les parecía demasiado prosaica; así pues, como nos dice Gary Zweiger, un investigador de la Standford University Schooll of Medicine, procuraron elevarla a un terreno más místico (2):
“Morgan et al. establecieron el postulado de la genética: “un rasgo, un gen” e inspiraron un siglo de parloteo acerca de “un gen para…”, donde se podía incluir cualquier característica, conducta o enfermedad.”
“Un gen puede proporcionar la piedra angular… para diagnosticar una enfermedad, tratarla con eficacia… o ganar millones de dólares. Alrededor del gen se ha construido una estructura para la investigación biológica que se conoce como determinismo genético. Es un paradigma científico que ha guiado a muchos investigadores en la búsqueda de genes causales de enfermedad, rasgos, etc.”
Estos comentarios críticos, sobre el gen, tienen aún más importancia dado que Zweiger combina su visión genética académica con la empresarial, en compañías biotecnológicas como Genentech e Incyte.
Otros genetistas prestigiosos, como Richard C. Lewontin, autor y coautor de muchos libros y artículos de éxito -alguno con el conocido evolucionista Stephen Jay Gould-, presentan una visión menos reduccionista y determinista de la biología. Así, en su excelente libro de divulgación Genes, organismo y ambiente (3), dice:
“En primer lugar, así como no puede existir un organismo sin un ambiente, tampoco puede existir un ambiente sin algún organismo.”
“… los organismos determinan biológicamente la naturaleza física efectiva de las señales procedentes del exterior. Transforman una señal física en una completamente diferente y el resultado de este cambio es lo que las funciones del organismo perciben como una variable ambiental.”
“Los fenómenos externos corrientes del mundo físico y biótico pasan a través de un filtro de transformación creado por la biología específica de cada especie y es el producto de esta transformación lo que llega a los organismos y se convierte en algo relevante para ellos.”
No voy a hacer ningún comentario a este respecto; sólo recuerdo que en el último post (4 de marzo de 2020) hablamos del sistema de transducción de señales del exterior, desde la membrana plasmática al interior de la célula, siguiendo una pauta básica general de información biológica (pregenética, genética y epigenética), tanto en la filogenia, como en la ontogenia y en la fisiología:
1.    Cambio ambiental.
2.    Cambio conformacional en las proteínas de la membrana plasmática.
3.    Este cambio conformacional activa un sistema de transducción de señales en cascada hacia el interior de la célula, que también implican determinados cambios conformacionales en proteínas.
4.    Modificaciones genéticas y epigenéticas, de mayor o menor alcance, como respuesta al cambio ambiental.
Además, Lewontín plantea un problema, de índole epistemológica, en la investigación biológica:
“En los últimos trescientos años, el modelo analítico alcanzó un éxito inmenso, porque explica la naturaleza de una manera tal que nos permite manipularla y prever sus comportamientos… Pero el éxito del modelo mecánico, a diferencia del fracaso del modelo holístico, considerado oscurantista, ha producido una visión hipersimplificada de las relaciones entre las partes y el todo y entre las causas y los efectos. El éxito del reduccionismo ingenuo y del análisis simplista se debió en parte a la naturaleza, por así decirlo, oportunista del trabajo científico. Los hombres de ciencia abordan el estudio de aquellos problemas que se adaptan a sus métodos… La ciencia, tal como la practicamos hoy, resuelve los problemas para los cuales sus métodos y sus instrumentos son adecuados, y los científicos pronto aprenden a plantearse sólo las cuestiones que pueden ser resueltas.”

¿Qué es un programa genético?

Es cierto que el enfoque genético -reduccionista y determinista- es como un farol que ilumina, y mucho, una parcela de la realidad; pero que no sólo deja muchas zonas de oscuridad, sino que, además de deslumbrar a los investigadores, proyecta sombras fantasmagóricas acerca de su alcance e importancia, que va desde la más realista relación entre genotipo y fenotipo, la que se da entre la secuencia de bases de un gen y la secuencia de aminoácidos de un polipéptido; hasta la delirante proposición de un programa genético. Es frecuente encontrarse en libros o artículos científicos de biología con expresiones del tipo: “los estímulos pueden desencadenar la activación de programas genéticos en el cerebro”, u otras parecidas. Pero ¿qué es un programa genético? ¿Cómo se hizo y cómo funciona en la ontogenia y en la filogenia? ¿Quién es el programador?
Debo admitir que no he hecho un gran barrido, por libros y revistas científicas, buscando una definición de programa genético; pero creo que mi búsqueda es suficientemente significativa: algunos de los textos más conocidos de Genética; Biología Molecular y Celular; Bioquímica y Biología General. En ningún caso he encontrado esta entrada ni en el glosario ni en el índice analítico; ni siquiera en el texto del Curtis (Invitación a la biología), cuyo capítulo 14 lleva por título:  Desarrollo: La ejecución de un programa genético, que tampoco desarrolla este concepto en ningún epígrafe de este capítulo. Tampoco en la Wikipedia aparece este término claramente definido: aparece programación genética, refiriéndose a la inteligencia artificial inspirada en supuestos principios de la evolución biológica, y una definición muy simple de la Real Academia de Ingeniería: “Conjunto de funciones desarrolladas y expresadas a través de la activación y supresión de los genes en un organismo.” Por otra parte, en los diccionarios generales, todo lo relativo a programa o programar gira alrededor de: instrucciones escritas en lenguaje de programación, proyecto, sucesión de operaciones conducentes a un fin determinado. En general, todo programa tiene un planteamiento teleológico, ya que implica un programador que establezca un proyecto con un orden espacial y temporal: una sucesión de actividades con un sentido y una finalidad.
No obstante, lo más interesante que he encontrado en la Wikipedia, sobre el término programa genético, está en el Atlas of Genetics and Cytogenetics in Oncology and Haematology:
“El programa genético es un mensaje escrito por medio de las letras A, C, G, T. ¿En qué se considera un programa? Lo es en el sentido en que un texto escrito puede transmitir instrucciones. En nuestro lenguaje habitual, el menor enlace de las veintiséis letras de nuestro alfabeto que tiene significación individual es una palabra. El equivalente en el lenguaje genético es un gen. El sentido de la frase, y el sentido de la obra literaria compuesta de frases, no es en ningún caso reducible al sentido de la palabra: la palabra contribuye a este sentido por el juego de las combinaciones. La significación de la palabra suele ser más bien contextual. Del mismo modo, un gen no determina en caso alguno la totalidad de las propiedades biológicas de una célula y con mayor motivo de un organismo.”
Como vemos, todo lo referente al gen y lo genético gira alrededor de símiles o metáforas -según el menor o mayor grado de comparación que le demos- relativos al lenguaje escrito o a la información cifrada. En el texto anterior comparan o identifican gen con palabra: una secuencia de letras, en un determinado orden -esto es, formando una estructura o significante- que representa un concepto mental o significado. Comparan gen con palabra, y no con frase u obra literaria “por el juego de las combinaciones”, y porque “la significación de la palabra suele ser más bien contextual.” Para seguir probando el grado de adecuación de esta metáfora a la información biológica, podríamos identificar el significante con estructura, y el significado con acción (sensu lato con función); y, al igual que ocurre con las palabras en las frases, su significado preciso depende del contexto, esto es del entorno con el que se encuentra el gen. Pero conviene precisar, aún más, la metáfora gen-palabra. Para empezar por lo último señalado, no es el gen el sujeto que interacciona con el entorno o medio ambiente. De la misma manera que no es la palabra la que se encuentra con un contexto -sino la persona que las utiliza según el contexto en el que habla o escribe, combinándolas convenientemente-, no es el gen sino el organismo, celular o pluricelular, y las proteínas -fundamentalmente los receptores de membrana- los que se enfrentan directamente a las contingencias medio ambientales. Por otra parte, al igual que las palabras tienen un significado, y una función en la oración, anterior al significante (estructura); las funciones biológicas preceden, son prioritarias, a las estructuras seleccionadas para realizarlas. Como veremos a continuación, desarrollando la metáfora gen-palabra, las funciones y subfunciones biológicas -que integran los organismos vivos- se sustentan en estructuras -sistemas y subsistemas- que van realizando acciones cada vez más elementales. Tanto las funciones como las estructuras logradas a lo largo de la evolución están jerarquizadas y guardan coherencia en sus respectivos niveles de organización e integración. El nivel de acción más elemental, en las funciones biológicas, está en el nivel supramolecular subcelular, y les corresponde a las proteínas.

¿Qué son las proteínas? Las proteínas son biopolímeros informativos, constituidos por uno o más polipéptidos, que también están formadas por secuencias de letras, correspondientes a veinte aminoácidos. Como ya dijimos anteriormente, la genética se basa en la relación entre genotipo y fenotipo, más una confusa intervención del ambiente. El fundamento molecular de esta relación, sin ningún añadido dogmático, está en la correspondencia, de código genético, entre las secuencias de bases nitrogenadas de los nucleótidos del ADN y las secuencias de aminoácidos de los polipéptidos de las proteínas. Así pues, podríamos considerar a las proteínas como las palabras -con su significado y su significante, esto es, su función y su estructura- y a los genes como los depositarios de la información codificada de las palabras. Extendiendo la metáfora, las proteínas se podrían identificar con la palabra hablada, más vinculada a la acción -tanto en el origen de la humanidad y su evolución, como en el desarrollo del niño y en la lectura de un texto-, mientras que los genes se identificarían mejor con la palabra escrita. Así pues, del mismo modo que los humanos fuimos los agentes que construimos un lenguaje, sobre la actividad social, propiciando así una evolución cultural; podríamos decir que las proteínas son los agentes que -mediante el código genético- construyen su lenguaje molecular, genético y epigenético, su cultura molecular, tanto en la filogenia, como en la ontogenia y en la fisiología celular.  

El dogma central de la biología molecular: un edificio en ruinas

Más que hablar de programa genético, habría que desentrañar el encadenamiento histórico de la herencia pregenética, genética y epigenética; esto es, sensu lato, de toda la información biológica que se ha formado y pasado, a lo largo de la evolución, de una generación a la siguiente. Así pues, partimos del único hecho que el denominado dogma central de la biología molecular (DCBM) ha establecido con rigor científico; esto es, la relación secuencial -en el orden o secuencia de sus monómeros- que se da entre el ADN/ARN y los polipéptidos de las proteínas. Desde que, en el transcurso de la evolución, se estableció esta relación, de código genético, todos los polipéptidos se sintetizan en el ribosoma siguiendo la pauta de la información cifrada en las moléculas del ARN mensajero (ARNm); más el concurso del ARN transferente (ARNt) -portador de los aminoácidos- y de veinte enzimas aminoacil- ARNt sintetasas, que unen específicamente los aminoácidos a los ARNt. Pero lo que no puede decir el DCBM es cuándo se estableció esta relación; ni que el flujo de información es o ha sido siempre unidireccional, del ADN a los polipéptidos; ni que la información secuencial contenida en el orden de los aminoácidos en un polipéptido determine inexorablemente su estructura terciaria conformacional; ni que ésta esté siempre vinculada a una determinada función. Después de la relación secuencial ADN/ARN/Proteínas -auténtica relación genotipo/fenotipo en estado puro- todo es fisiología celular, con la intervención del ambiente molecular. No hay ningún gen que albergue ningún programa de actuaciones, ni genes reguladores, ni gen alguno que acompañe a las proteínas a su posición de trabajo: rutas metabólicas, “máquinas proteicas”, receptores de membrana y rutas de transducción de señales, proteínas reguladoras, etc.
Lewontin (2000), dice al respecto:        
Naturalmente, las informaciones sobre la estructura de las proteínas no están todas almacenadas en la secuencia del ADN porque el plegamiento de los polipéptidos contenidos en las proteínas no está del todo especificado en su secuencia de aminoácidos.
Generalmente los biólogos moleculares no llaman la atención sobre el hecho de que ignoramos cómo se determina la estructura de las proteínas, pero continúan repitiéndonos que es el ADN el que las fabrica.
Los límites metodológicos de los experimentos se confunden con las explicaciones correctas de los fenómenos. La tesis que muchos sostienen, según la cual son los genes los que determinan las características de los organismos, nace de la facilidad con que pueden producirse importantes modificaciones genéticas en el curso de los experimentos… Por otra parte, sólo se toman en consideración aquellos fenómenos que se prestan a ser estudiados mediante ese método.
El hecho de que algunas secuencias de aminoácidos puedan adoptar múltiples conformaciones -en respuesta a distintas interacciones frente al ambiente molecular-, produciendo, así, múltiples fenotipos a partir de una única secuencia, no es obstáculo para que estos fenotipos, así generados, puedan ser heredables. Esto contradice algunos postulados del DCBM, como el que afirma que la información genética fluye unidireccionalmente, como información secuencial -del ADN al ARN, y de éste a las proteínas- que determinará la aparición de un determinado carácter. Por otra parte, el DCBM asume que sólo los caracteres con una base genética son hereditarios, al contrario que los caracteres adquiridos durante la peripecia del ser vivo frente a su medio ambiente, que desaparecerán con él. Por el contrario, hay que tener en cuenta que, en primer lugar, hay más caracteres que proteínas, y más proteínas (y aún más polipéptidos) que genes; lo que difícilmente se puede explicar con el actual sentido de la información biológica, dirigida del ADN a las proteínas. En segundo lugar, desde un punto de vista evolutivo, lo más importante es la permanencia del mensaje biológico en el tiempo, de manera que pueda constituir una tendencia evolutiva en forma de caracteres fenotípicos seleccionables. Así, el ADN puede mantener su invariancia reproductiva y, sobre ella, mutar repetidamente, y, sin embargo, no poder mantener un fenotipo seleccionable. Por el contrario, una variación ambiental, mantenida en el tiempo, puede provocar los mismos cambios fenotípicos, igualmente mantenidos, en una población, en función de la plasticidad de las proteínas y de la información epigenética generada por los organismos de dicha población.
 La herencia, esto es, la información biológica que pasa de una generación a la siguiente, se fundamenta aquí en la invariancia genética de la secuencia de bases del ADN y en la necesaria coherencia de los cambios ambientales mantenidos frente a la misma secuencia de aminoácidos. En general, el denominado ruido del desarrollo es una fuente importante de variaciones fenotípicas, para un organismo, frente a los cambios ambientales que, de forma contingente, acontecen en esta etapa de su ontogenia. Aquí, son importantes tanto los cambios ambientales como el orden en que aparecen. Concretamente, en el nivel supramolecular, la información conformacional de las proteínas más plásticas está supeditada a la sucesión de cambios con los que se encuentran en el ambiente molecular de la célula. Así pues, por decirlo en términos genéticos, y siguiendo la lógica del DCBM, tenemos que pasar de la fórmula Fenotipo = genotipo + ambiente, a Fenotipo = polipéptido + ambiente; naturalmente, cambiando la perspectiva, mecanicista y parcelada, del individuo como fenotipo, a una funcional e integrada del individuo como organismo. Así, tendríamos que ver al polipéptido -como parte de las proteínas- enfrentado a su ambiente molecular, tanto en el nivel subcelular, como de organismo celular y pluricelular.

El fenotipo de las proteínas

Acabamos de ver el planteamiento totalmente determinista del DCBM: una secuencia de ADN, un carácter; mediante el flujo informativo, en un único sentido -y en una relación de código genético-, desde la secuencia de bases del ADN hasta la secuencia de aminoácidos de un polipéptido, pasando por la información, también codificada, del ARN.
Pero el DCBM deja una serie de preguntas abiertas:
·       ¿El flujo de información ha sido siempre en este sentido, del ADN o ARN a los polipéptidos? ¿Pudo inicialmente haber sido a la inversa, de la información conformacional de los polipéptidos a la secuencial del ARN y del ADN?
·       ¿Determina inexorablemente la información secuencial de un polipéptido su estructura terciaria conformacional?
·       ¿Está la estructura tridimensional de una proteína siempre vinculada a una función que determina? O lo que es lo mismo, ¿la función de una proteína viene siempre determinada por su estructura previa?
·       ¿Quién es prioritario en la evolución biológica, la estructura o la función?
Todas estas preguntas se agrupan alrededor de numerosas excepciones que vulneran tanto el DCBM como otros paradigmas actuales, relativos a la relación entre estructura y función. Entre estas excepciones destacan los priones y las proteínas intrínsecamente desestructuradas (IDPs).
Mucho antes del surgimiento de la biología molecular -y su dogma central-, en los albores del nacimiento de la bioquímica, Emil Fischer propuso (1894) el modelo llave-cerradura para explicar el ajuste específico de las enzimas con los sustratos objeto de su actividad enzimática. Con este modelo se asentó el concepto una secuencia, una estructura una función, que ha llegado hasta la actualidad.
 Pero, en los inicios del siglo XX, además de las enzimas, otra familia de proteínas exhibía una fuerte especificidad por sus ligandos. Se trataba de los anticuerpos que presentan una especificidad notable, con distintos grados de afinidad, frente a sus ligandos específicos, denominados antígenos por ser las moléculas generadoras de anticuerpos. Los trabajos de Karl Landsteiner (1868-1943) pusieron de manifiesto que los vertebrados pueden elaborar anticuerpos específicos frente a un número prácticamente ilimitado de determinantes antigénicos. Para algunos inmunólogos, como Landsteiner, y bioquímicos, como Linus Pauling, esta enorme diversidad de anticuerpos específicos implicaba formas geométricas complementarias entre cada determinante antigénico y el correspondiente sitio de unión del anticuerpo. Pauling y Landsteiner propusieron la denominada “teoría del molde directo” (1940) donde el antígeno debía actuar como molde sobre el cual las moléculas de anticuerpo desplegadas (inmaduras) se plegarían hasta adquirir la forma globular (madura). En este proceso de plegamiento, la inmunoglobulina se pondría en contacto con el antígeno moldeándose según la forma complementaria requerida (4). Con este planteamiento, podríamos decir que lamarckiano, sobre la formación de los anticuerpos -anterior al conocimiento de la estructura del ADN y al establecimiento posterior del DCBM- Pauling y Landsteiner se adelantaron a su tiempo, en más de medio siglo, acerca de la influencia del medio ambiente en el fenotipo de las proteínas, concretamente en lo relativo al conocimiento actual sobre las proteínas intrínsecamente desordenadas (IDPs) y su vulneración manifiesta del paradigma estructura-función.
En 1961, Christian B. Anfinsen (1916-1995) reforzaría la creencia una secuencia, una estructura una función, con sus trabajos de desnaturalización y renaturalización, in vitro, de la enzima ribonucleasa. En estos trabajos, de renaturalización, observó que la ribonucleasa era capaz de recuperar su estructura y actividad enzimática al volver a las condiciones fisiológicas adecuadas; concluyendo que en la secuencia de aminoácidos está toda la información necesaria por parte de la proteína para adquirir su conformación nativa: única, estable y formada con un consumo mínimo de energía libre. Al menos para proteínas globulares pequeñas, in vitro, este postulado se conoce como el dogma de Anfinsen.  Pero, en la biosíntesis de proteínas en el ribosoma, las cosas son distintas. En la síntesis in vivo una misma secuencia puede presentar dos conformaciones diferentes. En el ribosoma, distintos factores pueden afectar a la cinética del proceso de biosíntesis de proteínas y, en consecuencia, producir variaciones conformacionales (5). Además, en el proceso de plegamiento correcto influyen otros factores: como, por ejemplo, que la cadena polipeptídica naciente interaccione con el interior del ribosoma, y con otras proteínas como los chaperones moleculares, que facilitan el mantenimiento de su estructura nativa.
Pero ¿hasta qué punto una determinada estructura terciaria y su función específica asociada precisan de una fidelidad secuencial? Al examinar los patrones de variabilidad de diversas familias proteicas observamos que, en contraste con la permisibilidad a los cambios secuenciales, existen fuertes restricciones estructurales a dicha variabilidad, que afectan fundamentalmente a los residuos hidrofóbicos -que forman parte del núcleo hidrofóbico de la proteína-y mucho menos a los residuos hidrofílicos de la superficie globular. En este sentido, la comparación de secuencias de hemoglobinas de distintas especies revela que algunas difieren en 137 de sus 141 aminoácidos conservando su identidad estructural y funcional. Así pues, no es cierto que la información genética contenida en la secuencia de aminoácidos sea muy exclusiva ni para el plegamiento ni para la conformación de las proteínas. Son muchos los factores -externos e internos-que intervienen en el plegamiento y conformación final de las proteínas; y esto dificulta enormemente el encontrar programas para predecir estructuras a partir de secuencias, como bien saben los bioinformáticos.
Antes de meternos más a fondo con las proteínas intrínsecamente desordenadas, quiero abordar más someramente algunas cuestiones relativas a los priones, como proteínas que implican una excepción notable del dogma de Anfinsen y del DCBM; para un desarrollo más en profundidad, de las ideas que voy a exponer a continuación, consultar los posts de 10 de marzo de 2017 y de 4 de marzo de 2020.

Las proteínas que aparentemente se comportan como virus y genes: priones y conformones

Los priones se descubrieron como agentes infecciosos, exclusivamente proteicos, en determinadas enfermedades neurodegenerativas de mamíferos, donde se comportan como un virus. También se asociaron, e identificaron, a determinados procesos de “herencia no mendeliana” donde, aparentemente, se comportan como un gen; en cuyo caso, a estas proteínas funcionales -propagadoras de información conformacional- es mejor denominarlas conformones, para diferenciarlas del comportamiento patológico de los priones (6). En ambos tipos de procesos -patológicos y fisiológicos- los priones y conformones pueden transmitir información estructural y autorreplicarse, induciendo el correspondiente cambio conformacional en otras formas proteicas con idéntica o muy semejante secuencia.  El comportamiento anómalo de estas proteínas hidrofóbicas fue estudiado por S. Prusiner, quien en 1982 acuñó el acrónimo Prión a partir de la denominación de estos agentes como proteinaceus infectious particles, más eufónico que proin, (7). Prusiner propuso la hipótesis de “la proteína sólo”: la propagación priónica se realiza mediante un mecanismo de cambio conformacional o moldeamiento inducido de la proteína celular normal por la proteína patogénica, mediante interacción directa entre ambas. Más sorprendentes aún para el tema que nos ocupa -la prioridad entre información secuencial y conformacional, y entre estructura y función- son las diferencias de los patrones de variabilidad con los virus, a los que, en principio, se asemejan en comportamiento. Antes de seguir con este tema, tan sólo quiero aclarar que utilizo el término prioridad no en el sentido de capricho o preferencia, sino en la acepción de “anterioridad o precedencia de una cosa respecto de otra que depende o procede de ella”. En los patógenos clásicos, las diferencias aparecen en su genoma (ADN o ARN), manifestándose en forma de especies y subespecies o cepas.  Pero, en el caso de los priones, ¿cómo puede sólo una proteína, sin el concurso de los ácidos nucleicos, codificar, producir y transmitir variabilidad? Esto parece imposible en el paradigma genocéntrico actual. El problema se agrava cuando vemos aparecer la inconmensurabilidad en conceptos, como especie y cepa, entre nuevos agentes infecciosos, como los priones, y otros agentes infecciosos clásicos, como los virus. Como hemos visto, una especie vírica viene definida por unas determinadas características genéticas de tipo secuencial, esto es, codificadas en secuencias de bases nitrogenadas de su ADN o ARN. Las subespecies o cepas víricas comprenden algunas variantes secuenciales menores dentro de una especie; que, por lo tanto, es prioritaria a la cepa. Por su parte, para los priones los conceptos de especie y cepa son muy distintos y desconcertantes. La especie de un prión viene definida por la secuencia de la proteína celular normal (PrPc), transformada por él, y perteneciente al último mamífero por el que ha pasado. El paso de priones de una especie a otra viene limitado por lo que se conoce como barrera de especie: la mayor o menor dificultad que tienen los priones producidos en una especie, para propagar sus conformaciones en otra especie. En general, cuanto más se parezcan las secuencias de la proteína del prión (PrP), la priónica (PrPsc) y la forma celular del huésped (PrPc), tanto más será la probabilidad de saltar la barrera de especie. Hasta aquí no parece haber demasiada diferencia con los virus. Pero otros factores también influyen en el fenómeno de la barrera de especie: la cepa del prión y la especificidad de especie de una proteína que actúa como un chaperón, uniéndose a la PrPc y facilitando su conversión en PrPsc. Por su parte, las cepas priónicas se definen como subespecies del agente infeccioso capaces de mantener perfiles fenotípicos específicos. Siguiendo la lógica genética secuencial, del paradigma genocéntrico, las cepas presentarían secuencias que procederían de su especie priónica (que por tanto sería prioritaria a la cepa), pero no es así: la variabilidad que manifiestan las cepas de un prión no son atribuibles a diferencias en la secuencia de aminoácidos. Se ha observado que, además de diferencias fisicoquímicas, las cepas también presentan diferentes conformaciones. Varios estudios apoyan la hipótesis de que cada cepa de prión parece identificarse con una determinada conformación de las diferentes que puede adoptar una especie de PrPsc, identificada por su secuencia. Estas conformaciones se pueden propagar induciendo el correspondiente cambio conformacional en PrPc con secuencias idóneas, cuyas diferencias no supongan una barrera de especie. Esta barrera generalmente será mayor cuanto más alejadas evolutivamente estén las especies, aunque teóricamente podrían existir especies “puente” entre dos que presenten el efecto barrera (6). En este fenómeno de propagación de cepas por especies diferentes se pone de manifiesto que la conformación de la cepa se impone a la secuencia de la especie: nos encontramos tanto con secuencias (especies) que pueden adoptar diferentes conformaciones (cepas), como con conformaciones que pueden estar en diferentes secuencias. Estos datos, relativos a la propagación del fenotipo molecular que caracteriza las distintas cepas proporcionan un fuerte apoyo a la hipótesis de la proteína sólo, tanto en lo relativo a los mecanismos de transmisión priónica como en la codificación de la variabilidad de cepas en la estructura terciaria de este tipo de proteínas. Aquí se nos presenta una paradoja, ¿dónde está la prioridad? ¿En la cepa o en la especie? ¿En la conformación o en la secuencia? Para explicar esta y otras paradojas debemos salirnos del paradigma genocéntrico que incluye el dogma de Anfinsen y el DCBM. Las conformaciones (cepas) no son subespecies en el sentido filogenético, es decir, no han derivado de una especie (definida por su secuencia). Como ya se ha expuesto repetidamente en este blog, muchos hechos -como los recogidos en esta paradoja- llevan a pensar que la evolución de las proteínas se pudo producir en dos etapas distintas:
·       Una primera etapa prebiótica de selección de información conformacional proteica pregenética, origen de los conformones.
·       Una segunda etapa, biótica, donde en coevolución conformacional con el ARN, se establecería el código genético: primero conformacional y luego secuencial.
Así pues, la posible solución de esta paradoja vendría de deslindar y situar correctamente las etapas evolutivas: las cepas (conformaciones) son prioritarias a las especies (secuencias) ya que lo pregenético es prioritario a lo genético y a lo epigenético, y esto tanto en la filogenia, como en la ontogenia y en la fisiología (incluidas sus disfunciones patológicas).
Ahora estamos en condiciones de poder dar alguna respuesta alternativa a las preguntas que nos hicimos antes:
·       ¿El flujo de información ha sido siempre en este sentido, del ADN o ARN a los polipéptidos?
Efectivamente, desde la etapa prebiótica pudo haber sido a la inversa: de la información conformacional de los polipéptidos, y del ARN, a la secuencial del ARN y del ADN, invirtiendo el DCBM (6 y blog 2017). Aún más, hay hechos que apuntan a que, dado que las páginas de la evolución se escriben mediante el continuo diálogo entre organismo y ambiente, es posible que no sólo, desde el origen de la vida, la información conformacional pregenética sea prioritaria a la genética; sino que también esta información conformacional opere en todos los procesos epigenéticos a lo largo de la evolución: en la filogenia, en la ontogenia y en la fisiología.

·       ¿Determina inexorablemente la información secuencial de un polipéptido su estructura terciaria conformacional?
Ya hemos visto sobradamente con las especies y cepas priónicas que la respuesta es no. A continuación, veremos que las IDPs también niegan estos postulados del dogma de Anfinsen y del DCBM.
·       ¿Está la estructura tridimensional de una proteína siempre vinculada a una función que determina? O lo que es lo mismo, ¿la función de una proteína viene siempre determinada por su estructura previa?
Esta pregunta también se contestará preferentemente en el siguiente apartado.

En las proteínas intrínsecamente desordenadas la función es prioritaria a la estructura

En el post anterior -4 de marzo de 2020- tratamos algunos temas relacionados con estas proteínas desestructuradas, que no vamos a repetir (8). Aquí vamos a centrarnos fundamentalmente en cómo estas proteínas intrínsecamente desordenadas (IDPs) desafían el paradigma básico de la biología estructural: “la estructura de las proteínas determina su función”. El DCBM engloba este paradigma con el dogma de Anfinsen, en un paradigma genético superior; y marca un flujo de información secuencial en un único sentido, que determina la estructura y la función de las proteínas: la información genética secuencial fluye unidireccionalmente del ADN a las proteínas, pasando por el ARN, determinando una única secuencia de aminoácidos, que determina una única estructura tridimensional (TD) y una única función. El paradigma genético del DCBM ha conducido la investigación de la estructura proteica hacia proteínas con estructuras únicas, bien definidas, mediante estudios de sus estructuras cristalinas con Rx. Estos estudios estructurales reforzaban una visión estática de las proteínas funcionales como cerraduras únicas para llaves únicas, aunque se admitía un cierto grado de flexibilidad conformacional, como, por ejemplo, en las proteínas alostéricas.
Sin embargo, desde hace una veintena de años se ha acumulado una cantidad notable de conocimiento acerca de muchas proteínas que contienen segmentos funcionales desordenados, parcial o totalmente, carentes de una estructura TD bien definida, pero que pueden adoptar conformaciones funcionales cuando se unen, de forma poco específica, a diversos ligandos (9). Las IDPs y las proteínas híbridas -que contienen tanto dominios ordenados como regiones funcionales intrínsecamente desordenadas (IDPRs)- son muy abundantes en la naturaleza. Tanto las IDPs como las IDPRs poseen sesgos bien reconocibles, en su composición -fundamentalmente hidrofílica- y en su secuencia de aminoácidos. Presentan una notable heterogeneidad estructural, en la que diferentes partes de una determinada cadena polipeptídica pueden exhibir diferentes grados de orden: potencialmente plegable, parcialmente plegable, diferentemente plegable o no plegable. Estos segmentos estructurales cambian de estructura en diferentes momentos, y su distribución también cambia constantemente en respuesta a los cambios ambientales. Así pues, las IDPs y las IDPRs no tienen una única estructura en equilibrio bien definida y existen como uniones heterogéneas de confórmeros. Esta organización estructural en mosaico es crucial para sus funciones, y muchas IDPs están comprometidas en funciones biológicas que dependen de una alta flexibilidad conformacional, como regulación, señalización, control; y, en general, adaptación a los cambios del medio ambiente molecular.  

Evolución ondulante del desorden proteico intrínseco

Para analizar estos datos generales, con más detalle, en principio, vamos a ver cómo las diferencias estructurales -entre los polipéptidos y dominios de las proteínas globulares ordenadas, y las IDPs e IDPRs- se justifican sobre la base de las peculiaridades de sus secuencias de aminoácidos (9). Las IDPs solubles presentan un bajo contenido de residuos hidrofóbicos, y alto de residuos hidrofílicos. Las proteínas globulares ordenadas necesitan un núcleo (core), fuertemente hidrofóbico, sobre el que ordenar su estructura TD. Por ese motivo, las IDPs exhiben, fundamentalmente, una baja cantidad de residuos promotores de orden, y una mucho mayor de residuos promotores de desorden. Entre el primer tipo de residuos destacan: los hidrofóbicos alifáticos (como Ile, Leu y Val) y aromáticos (como Trp, Tyr y Phe); y también Cys y Asn. Entre los residuos promotores de desorden -abundantes en las IDPs- tenemos los apolares hidrofóbicos (Ala y Pro) y los polares hidrófilos (Arg, Gly, Gln, Ser, Glu y Lys). Una escala más completa de residuos (de promotores de orden a promotores de desorden) comprendería: Trp, Phe, Tyr, Ile, Met, Leu, Val, Asn, Cys, Thr, Ala, Gly, Arg, Asp, His, Gln, Lys, Ser, Glu y Pro.   
Las IDPs y las proteínas híbridas -que contienen tanto dominios ordenados como regiones funcionales intrínsecamente desordenadas (IDPRs)- son muy abundantes en la naturaleza -de hecho, han pasado de ser la excepción a ser la regla-, aunque hay mucha mayor representación en eucariotas que en arqueas, y bastante más en éstas que en bacterias. Esta distribución asimétrica en los tres dominios biológicos plantea un problema complejo que requiere una explicación lo más sencilla posible. Uversky lo explica sobre la base del repertorio funcional de las proteínas desordenadas (9). Las IDPs e IDPRs están comúnmente implicadas en procesos de señalización, reconocimiento y regulación; por lo que es frecuente su presencia en las complejas redes de regulación de los eucariotas, especialmente los pluricelulares. Esta asociación de desorden estructural con complejidad morfológica evolutiva está en línea con la lógica del vigente paradigma genocéntrico; aunque se ha visto que muchos eucariotas unicelulares acumulan más cantidad y variabilidad de estructuras desordenadas que los eucariotas pluricelulares. Por esta razón, Uversky razona que la cantidad y variedad de IDPs e IDPRs, en eucariotas unicelulares, iría vinculado al aumento de variabilidad ambiental: mayor para los protistas que para las células eucariotas de un organismo pluricelular, dotado de mecanismos de homeostasis.
Uversky nos muestra en una gráfica -figura 2, de la página 6 de su libro (9)- sobre la distribución del desorden intrínseco en varios proteomas, que algunos virus presentan un promedio de residuos desordenados mayor que bacterias, arqueas y eucariotas; aunque, en general, la distribución del desorden, en los virus analizados, guarda cierta simetría con la de las células de los tres dominios. Además, también es llamativo ver una gran cantidad de arqueas agrupadas con la mayoría de las bacterias en el área de porcentaje bajo de residuos desordenados. Igualmente, también aparecen bastantes arqueas -y un grupo de bacterias- con un porcentaje de desorden similar a algunos eucariotas unicelulares. Una posible explicación de estos datos coincidentes, en determinadas especies de los tres dominios, es la posible coevolución de estas especies en algunos ecosistemas especiales.
A la hora de explicar el origen y evolución de las proteínas desordenadas, Uversky acude a una explicación tortuosa, que denomina “wavy evolution”, sobre la base de una serie de datos, como -además de los analizados anteriormente, entre otros- la vinculación de mecanismos genéticos como el splicing alternativo de ARNm y la generación de IDPs e IDPRs, relacionadas con la señalización y diferenciación celular en eucariotas. Estos datos, le llevan a pensar en la aparición de las estructuras desordenadas alrededor del origen de los eucariotas. Pero, por otra parte, razona que es difícil imaginar la aparición súbita de estructuras ordenadas en la etapa prebiótica; y -tomando como referencia el famoso experimento de Stanley L. Miller and Harold C. Urey, donde sólo se encontraron alrededor de la mitad de los modernos aminoácidos- concluye que las primeras proteínas estarían formadas tan sólo por unos pocos de ellos; apoyándose, también, en la teoría biosintética de la evolución del código genético, de F. Crick, donde una forma primitiva de éste (con dobletes antes de la aparición de tripletes) codificaría tan sólo para unos pocos aminoácidos.

¿Cuáles serían los primeros aminoácidos? Con estas y otras premisas, se ha intentado saber qué aminoácidos son más o menos antiguos. Así, se ha propuesto la siguiente lista con el supuesto orden de aparición de los aminoácidos: Gly/Ala, Val/Asp, Pro, Ser, Glu/ Leu, Thr, Arg, Asn, Lys, Gln, Ile, Cys, His, Phe, Met, Tyr, Trp. Muchos de los primeros aminoácidos (como Gly, Asp, Glu, Pro y Ser) son promotores de desorden y abundan en las IDPs; mientras que los promotores de orden (Cys, Trp, Tyr y Phe) fueron incorporados posteriormente.  La leucina (Leu) y la valina (Val) aparecen como excepciones, ya que serían aminoácidos tempranos, pero promotores de orden.  
Interpretar los datos obtenidos, en cualquier campo de la actividad científica, supone enhebrarlos con el hilo de un razonamiento causal y lógico, para construir un discurso o argumento. Pero los datos, así unidos, pueden ofrecer diversas interpretaciones: según los ensartemos en un orden u otro; según los unamos todos o escarbemos entre ellos, escogiendo sólo los que nos interesan; o, lo que es peor, según veamos el dato sólo como dato -obtenido rigurosamente mediante el método científico experimental- o, por el contrario, lo distorsionemos elevándolo injustificadamente a teoría o a dogma. En este último caso, el dato no se deja enhebrar, y opera más bien como una roca dura que desvía el curso de un río, ocasionando un meandro. Por este motivo, al construir una teoría, debemos apreciar tanto la integración del mayor número de datos significativos posible, como la sencillez de sus explicaciones, en un discurso directo e inclusivo, sin desvíos innecesarios.  
Los datos aquí presentados sugieren que los primeros polipéptidos fueran intrínsecamente desordenados, pero Uversky propone que, éstos, carecieran de cualquier actividad catalítica; y, que, por el contrario, actuasen como chaperones del ARN. Argumenta, a favor de esta hipótesis: que está en línea con “the RNA world theory”; y que, durante la evolución de la actividad enzimática, la catálisis sería transferida desde el ARN a las ribonucleoproteínas, primeramente, y después a las proteínas. Continúa su argumentación valorando positivamente la capacidad, como chaperones, de las proteínas desordenadas para mantener la estructura del ARN, dada su tendencia al plegamiento incorrecto. Igualmente valora la mayor variabilidad de las propiedades físicas y químicas de los aminoácidos frente a los nucleótidos, y la mayor estabilidad estructural de las proteínas respecto al ARN; concluyendo, por lo tanto, que la transición de la actividad enzimática desde las ribozimas a las proteínas, guarda una lógica evolutiva. Pero, y aquí viene otro meandro en el curso de la argumentación: una catálisis eficiente requiere una estructura estable, por lo que la actividad enzimática generaría una fuerte presión selectiva a favor de las estructuras ordenadas y bien plegadas. Uversky propone que la evolución global de las proteínas desordenadas sigue una senda ondulada (wavy pattern): primero, proteínas muy desordenadas con actividad de chaperones del ARN; seguida de sustitución gradual por enzimas bien plegadas y con estructuras muy ordenadas; y, por último, con la aparición de los eucariotas, el desorden fue “reinventado” para hacer frente a sus complejos procesos de regulación.
En relación con todo esto, otra cuestión importante hace referencia a la comparación de la velocidad de cambio evolutivo entre las proteínas y regiones desordenadas (IDPs e IDPRs) y las ordenadas. Los datos disponibles ofrecen un poco de todo, pero, aunque en la generalidad de las proteínas los residuos hidrofílicos -característicos de las estructuras desordenadas- son más permisivos con los cambios que los hidrofóbicos; la explicación no puede atender exclusivamente a consideraciones estructurales, siendo tan importantes o más las funcionales. Efectivamente, es bien sabido que generalmente, en las proteínas globulares, los residuos hidrofóbicos forman parte del núcleo (core) de la proteína, y que, por lo tanto, presentan fuertes restricciones estructurales al cambio. Por el contrario, también en general, los residuos hidrofílicos están más en superficie, y, si no están implicados directamente en alguna relación funcional, son más permisivos con los cambios. No obstante, siempre hay excepciones a esta regla: residuos hidrofóbicos implicados en las interacciones con el ligando; o, mejor aún, anfipáticos como la Tyr, que dan mucho juego en el sitio de unión, por su doble posibilidad de interacción, polar y apolar. En cualquier caso, vemos que las excepciones a las generalidades estructurales atienden siempre a criterios funcionales. Así, por ejemplo, en la comparación interespecífica de las mismas enzimas, la variabilidad se concentra en residuos permisivos con la estructura TD de la enzima en cuestión, y está totalmente restringida en los residuos que forman el centro catalítico, específico del sustrato. Por el contrario, en los anticuerpos, la variabilidad se concentra en las tres regiones determinantes de la variabilidad (CDRs 1, 2 y 3) de los dominios variables de las cadenas pesadas y ligeras de las inmunoglobulinas. No hay una velocidad de cambio de los residuos independiente de la funcionalidad global de la proteína, en la célula y en el individuo pluricelular.
No obstante, se observa una tendencia significativa de selección positiva, en proteínas, de IDPRs en comparación con regiones de hélices α, láminas β o estructura terciaria. Uversky lo explica por el potencial adaptativo de estas regiones, mediante variación genética, que facilitaría la evolucionabilidad de células y organismos. En este sentido, en el último post -de 4 de marzo de 2020- vimos algún ejemplo (anticuerpos catalíticos) de cómo las proteínas pueden especializarse adaptativamente, con un aumento de especificidad y afinidad, pasando de estructuras más desordenadas a más ordenadas, al tiempo que se selecciona un mecanismo funcional de tipo llave-cerradura a partir de otro de tipo ajuste inducido. Estos procesos de transición de estructuras más desordenadas (adaptadas directamente a los cambios del ambiente molecular) a más ordenadas -mediante mecanismos genéticos, más o menos dirigidos- podrían representar el modelo general de especialización funcional de las proteínas.
Antes de continuar con otros aspectos de las IDPs, vamos a recapitular los datos mostrados por Uversky, y su forma de enlazarlos (evolución ondulada de las IDPs), para razonar otro posible relato, más directo. Podemos empezar con los hallazgos de splicing (corte y empalme) alternativo de ARNm, que codifica para IDPRs con mucha más frecuencia que para regiones estructuradas. De momento, sólo quiero señalar que tanto el mecanismo del splicing como el complejo molecular que lo ejecuta, el spliceosoma, constituyen una de las señas de identidad eucariota. Por otra parte, se otorga una prioridad al ARN sobre las proteínas, basada en: la insuficiencia de aminoácidos entre las moléculas obtenidas en el experimento de Miller; en el código primitivo de dupletes, que formarían proteínas con aminoácidos promotores de desorden; en la actividad catalítica de las ribozimas (según el modelo del mundo de ARN), aunque con la ayuda de IDPs como chaperones no específicos. Con estas y otras premisas, vamos a mostrar que la hipótesis de la “wavy evolution” de las IDPs, puede ser sustituida por otra más directa.

Origen y evolución de las proteínas: desde la “sopa primordial” hasta los eucariotas, sin “meandros

Primeramente, vamos a analizar de nuevo algunos de los datos vistos hasta ahora. En primer lugar, si en el experimento de Miller no aparecieron los veinte aminoácidos que constituyen todas las proteínas biológicas; debemos tener en cuenta que menos aún aparecieron las bases nitrogenadas, que son la esencia informativa de los ácidos nucleicos (ARN y ADN). Por otra parte, es difícil encontrar, en las revisiones sobre la etapa prebiótica del origen de la vida, referencia alguna a los experimentos de síntesis prebiótica de Sidney Fox acerca de lo que él denominó proteinoides termales y microesferas.

¿Qué son los proteinoides termales y las microesferas de Fox? Al igual que Miller, Fox consiguió la síntesis de aminoácidos a partir de moléculas inorgánicas. Con algunos de estos monómeros -especialmente los obtenidos por Miller- consiguió la síntesis de polipéptidos a los que llamó proteinoides termales; y, a partir de éstos, obtuvo unos glóbulos, que realizaban algunas actividades enzimáticas poco específicas, a los que llamó microesferas. Todos estos procesos los llevó a cabo con el concurso de energía térmica (entre 130º y 180º C) compatible con las emanaciones termales en zonas volcánicas (abundantes en la etapa prebiótica terrestre). A diferencia de los coacervados de Oparin -que portaban una enzima, extraída de una célula actual-, las microesferas de Fox presentaban una actividad enzimática inherente a su propia estructura, como reacciones de oxidación, rotura de enlaces por hidrólisis, etc. Las microesferas de Fox, además de proteínas, están rodeadas de una membrana parecida a la bicapa lipídica, y son capaces de crecer y dividirse mediante fenómenos de bipartición y de gemación; así como de llevar a cabo la fusión entre microesferas.
Para tener una visión, lo más panorámica posible, de todos los datos manejados hasta ahora, vamos a revisar las clasificaciones de aminoácidos -según su capacidad promotora de desorden u orden, y según su supuesto orden de aparición en la Tierra- indicando, en cursiva, los aminoácidos mayoritarios en la síntesis de Miller; y, en negrita, los aminoácidos obtenidos por Fox.
 Así, en la lista de aminoácidos según su capacidad promotora de desorden u orden, colocando los residuos de promotores de desorden a promotores de orden: Pro, Glu, Ser, Lys, Gln, His, Asp, Arg, Gly, Ala, Thr, Cys, Asn, Val, Leu, Met, Ile, Tyr, Phe y Trp.
Igualmente, la lista con el supuesto orden de aparición de los aminoácidos quedaría así: Gly/Ala, Val/Asp, Pro, Ser, Glu/ Leu, Thr, Arg, Asn, Lys, Gln, Ile, Cys, His, Phe, Met, Tyr, Trp.  
Como vimos anteriormente, muchos de los propuestos como primeros aminoácidos (Gly, Asp, Glu, Pro y Ser) son promotores de desorden y abundan en las IDPs; mientras que los promotores de orden (Cys, Trp, Tyr y Phe) serían incorporados posteriormente.  Pero, la leucina (Leu) y la valina (Val) aparecen como excepciones, ya que serían aminoácidos tempranos y promotores de orden; y, por otra parte, hay que tener en cuenta que aminoácidos como Ile, Tyr y Phe, propuestos para su aparición tardía en el escenario de síntesis prebiótica, y promotores de orden, aparecen en la síntesis llevada a cabo por Sidney Fox.

¿Cuáles eran realmente los aminoácidos obtenidos en el experimento de Miller? Además de estos datos, en 2008, un grupo de investigadores rescató muestras archivadas de otros experimentos realizados en 1958, simulando otros ambientes, con el aparato que inicialmente usó Miller en 1953 (10). Aplicando modernas técnicas analíticas -de cromatografía (HPLC) y de espectometría (MALDI-TOF)-, entre otras moléculas, se encontraron los veinte aminoácidos proteicos. Naturalmente, se comprobó que éstos no resultasen de contaminación alguna. Las nuevas condiciones de la simulación de Miller se han considerado como modelo de la síntesis orgánica abiótica en ambientes volcánicos, con una alta concentración de H2S. Además, los aminoácidos más abundantes en las condiciones prebióticas de este experimento son muy semejantes a los más abundantes en algunos meteoritos carbonáceos. En ambos ambientes resulta fundamental la intervención del H2S para la síntesis de estos aminoácidos. Además de los aminoácidos más abundantes en los experimentos de 1953: Glu, Asp, Gly, y Ala; en los experimentos de 1958 también aparecieron en abundancia: Ser, Thr, Cys, Leu, Met e Ile.
La nueva lista de aminoácidos, colocando los residuos de promotores de desorden a promotores de orden, quedaría así: Pro, Glu, Ser, Lys, Gln, His, Asp, Arg, Gly, Ala, Thr, Cys, Asn, Val, Leu, Met, Ile, Tyr, Phe y Trp. Donde los aminoácidos subrayados son los “rescatados” de los experimentos de Miller de 1958.   
Con esta nueva perspectiva, no sólo podríamos contar, potencialmente, con todos los aminoácidos para construir otro posible relato del origen de la vida; sino que, entre los candidatos a pertenecer al grupo de los más abundantes, tenemos una cantidad importante tanto de promotores de desorden como de promotores de orden.  

¿Cómo fue el primer código genético? Continuando con las premisas que nos llevaban de la síntesis prebiótica a la evolución ondulada de las IDPs, pasando por un mundo de ARN, vamos a abordar el origen del código genético secuencial, bien sea con tripletes o con dobletes. Todo lo que se va a contar a continuación aparece con más detalle en el post de 2017, y en el post del 4 de marzo de 2020. En este y en los otros post, hemos visto que dentro del dominio de información conformacional pregenética tenemos las características esenciales o constitutivas de las proteínas -anteriores a la información genética que empieza con el código genético- tanto en lo relativo a la plasticidad proteica específica de estructuras desordenadas frente a ligandos diversos, como en la propagación de conformaciones por medio de proteínas tipo prión, a las que denominamos conformones.
Esta información pregenética se establecería en la etapa de evolución prebiótica y daría lugar, entre otras cosas, a la selección de ribonucleoproteínas (RNPs), estableciendo un código conformacional -entre las estructuras tridimensionales de proteínas y ARNs- previo al código genético secuencial. Este código no sería degenerado y está representado por la especificidad enzimática de las 20 aminoacil ARNt sintetasas: una por cada aminoácido y por su correspondiente ARNt, caracterizado por el lazo D de su estructura, no por su anticodón. La invariancia en la información secuencial condiciona, pero no determina, la plasticidad conformacional de las proteínas, sobre todo en aquellas que mantienen porciones funcionales, más o menos grandes, de estructura desordenada.   
Conviene subrayar, aquí, la importancia funcional de las IUPs, ya que intervienen como reguladoras en procesos celulares clave, tales como transcripción, traducción, transducción de señales y ciclo celular; así como en muchos procesos de adaptación molecular. Así pues, es posible que la funcionalidad esencial de la célula -y no determinados procesos exóticos- precise del concurso de éstas y, también, de otras proteínas -como las HSPs-chaperones y los conformones- ya que, estas últimas, poseen tanto alguna región desestructurada como un potente núcleo hidrofóbico (core), que les proporciona estabilidad y capacidad de modificar a otras proteínas. Esta acción conjunta de los tres tipos de proteínas puede estar implicada en los principales procesos celulares y etapas biológicas, desde el origen de la vida, es decir: en la ontogenia, en la filogenia y en la fisiología celular. A este respecto conviene resaltar que tanto los priones-conformones como las IUPs son muy resistentes a factores fisicoquímicos (calor, ácidos, radiaciones UV) característicos de ambientes extremos, como los que pudieron darse en la etapa prebiótica del origen de la vida.
Por otra parte, como ya hemos visto, las IUPs intervienen en muchas funciones de evidente implicación epigenética: metilaciones, acetilaciones, glicosilaciones, fosforilaciones, factores de transcripción, regulación de la transcripción y traducción, histonas, aminoacil-ARNt sintetasas, ensamblaje de grandes complejos proteicos, ribosoma, citoesqueleto, etc. Los polipéptidos desestructurados actúan como chaperones y proteínas HSPs (por ejemplo, en el estrés hidríco), y también forman parte de esta familia de proteínas, lo cual confirmaría la relación funcional ancestral de las HSPs-chaperones con las IUPS y priones-conformones; por lo que es probable que las HSPs-chaperones surgieran como una familia proteica con características funcionales y estructurales intermedias entre las otras dos.
Así pues, en un paradigma proteocéntrico, la etapa prebiótica y pregenética podría caracterizarse por la coevolución de información conformacional -de estos tres tipos de proteínas, en interacción con las ribozimas, formando RNPs- de la que surgiría el código genético: primero conformacional y luego secuencial. Este triunvirato proteico puede constituir el mecanismo general de adaptación al medio en el nivel supramolecular: las IUPs se moldearían funcionalmente por unión a nuevos ligandos; las HSPs participarían estabilizando y guardando la coherencia funcional de las estructuras proteicas resultantes, tanto las pregenéticas como las genéticas; y los conformones seleccionarían y propagarían las nuevas conformaciones.  
Es probable que la evolución de las IDPs haya ido de polipéptidos cortos (pregenéticos) -que formarían asociaciones de miniestructuras cuaternarias- a polipéptidos más largos (con síntesis genética), con dominios de estructura variable en el espacio y en el tiempo; y siempre acompañados de conformones y chaperones. Con el código genético aparece la invariancia secuencial; y, con el spliceosoma, el baraje y la unión de dominios en polipéptidos más largos, lo que proporciona un aumento de la heterogeneidad funcional y estructural de las proteínas desordenadas. Gracias a la interacción de la plasticidad pregenética con el medio, y los “pespuntes” genéticos, se va haciendo la variabilidad de la evolución. Las mutaciones -como los virus- son daños o beneficios colaterales, fruto de la contingencia.

¿Cómo sería la primera célula? En el análisis genómico comparado, las bacterias aparecen como las portadoras de los genes del metabolismo, las arqueas portan genes del procesamiento y transmisión de la información genética (replicación, transcripción y traducción); mientras que los genes exclusivos de los eucariotas también están implicados en la factoría del núcleo -spliceosoma incluido-, en la transducción de señales y en los mecanismos de exocitosis y endocitosis. Así, en la lógica del paradigma proteocéntrico, la primera célula tendría una naturaleza esencialmente eucariota; sería básicamente una arquea, similar a un núcleo, con un metabolismo elemental limitado a la producción de proteínas en la factoría del núcleo, y una fisiología centrada en el tránsito de información externa, de la membrana celular al núcleo -rutas de transducción de señales-, y de respuesta adaptativa interna, del núcleo a la membrana celular. En el inicio y en el final de ambas rutas informativas debe estar presente la triada formada por IUPs, HSPs-chaperones y conformones. En este sentido, parece que tanto los priones-conformones, como las IUPs están principalmente, o más representadas, en los eucariotas, lo que reforzaría esta hipótesis, sin recovecos. Además, este flujo de información, entre el primordio de célula eucariota (a la que denomino protocariota) y el medio externo, iría reforzado por una continua y contingente producción de vesículas de exocitosis (cargadas, en principio al azar, de proteínas y ácidos nucleicos) que, sin propósito alguno, colonizarían el medio exterior, e interiorizarían y seleccionarían partes de su “metabolismo” mineral abiótico. Muchas de estas vesículas estarían abocadas a volver, por endocitosis, a las células protocariotas. De esta manera, se iría haciendo, lentamente y de forma exógena, el metabolismo energético. Así, en el paradigma proteocéntrico -con este continuo baile de exocitosis y endocitosis- se formarían tanto los eucariotas como todos los acariotas (entidades sin núcleo definido): el resto de las arqueas, las bacterias y los virus (ver post de 2017).  En este sentido, resulta interesante el que las regiones desestructuradas (características de eucariotas) no tengan actividad enzimática. Las enzimas específicas pudieron formarse, en la etapa genética, aumentando paulatinamente la afinidad desde reconocimientos de ajuste inducido a mecanismos del tipo llave-cerradura. Además, en el interior de las vesículas de exocitosis, tanto el material genético como las proteínas resultantes -ambos producidos de forma contingente, y necesaria, por la maquinaria nuclear que ya había iniciado su andadura genética- pueden seleccionarse, sin problemas de coherencia funcional, en su encuentro con el premetabolismo mineral exterior. Algunas de estas vesículas alcanzarían la vida libre como acariotas, y otras volverían por endocitosis a la célula protocariota, proporcionando, así, los nutrientes necesarios. En algunos casos, se podrían establecer relaciones de endosimbiosis, integrando, así, el metabolismo exógeno conquistado. Es muy probable que se estableciese una línea evolutiva de endosimbiosis que, en vez de tratarse de un hecho puntual, puede continuar en determinados ambientes. Así, el inicio del metabolismo energético eucariota sería por integración funcional, en una línea evolutiva de endosimbiosis sucesivas, desde un metabolismo acariota exógeno.
Pienso que este relato enhebra mejor, y de forma directa, una cantidad mayor de datos para explicar el origen y evolución de las proteínas, que la evolución ondulante de las IDPs. En este modelo proteocéntrico, iriamos desde la evolución prebiótica hasta el protocariota (una arquea representativa de LUCA), del que saldrían tres ramas: una rama central, o tronco principal, que constituiría la continuidad eucariota (recuerdo que los eucariotas son monofiléticos); otra rama, que partiría próxima al protocariota, que se escindiría en los dos filos de las arqueas; y múltiples ramas entrecruzadas propias de los múltiples filos bacterianos. Además, prácticamente, cada tipo celular coevolucionaría con sus correspondientes virus específicos.   

Heterogeneidad estructural y funcionalidad de IDPs e IDPRs: la función es prioritaria a la estructura

En el libro de Uversky (9), se destaca la gran heterogeneidad estructural de las IDPs y sus regiones, sobre la base de sus largas secuencias extendidas, y una distribución no homogénea de su capacidad de plegamiento. Esta heterogeneidad abarca elementos estructurales que van desde: potencialmente plegable, parcialmente plegable, diferentemente plegable y no plegable. Así, diferentes partes de una molécula presentan diferentes grados de orden; y esta distribución cambia constantemente en el tiempo: un segmento de la proteína tendrá diferentes estructuras en diferentes intervalos de tiempo. El resultado es que, en cualquier determinado momento, una IDP tiene una estructura diferente de la estructura que tenga en otro momento. Naturalmente, esto parece obedecer a la capacidad de respuesta funcional, y no a una intermitencia programada. Otro nivel de heterogeneidad estructural está determinado por el hecho de que muchas proteínas son híbridas de dominios ordenados y desordenados; y que este carácter es crucial para sus funciones.
Las proteínas funcionales despliegan un espectro de estructuras que puede ir desde completamente ordenadas a proteínas totalmente carentes de estructura, con prácticamente todas las posibilidades intermedias: bien plegadas y carentes de cualquier región desordenada; un número limitado de regiones desordenadas; cantidad notable de regiones desordenadas; semejantes a glóbulo fundido; comportamiento de glóbulos prefundidos y mayoritariamente desestructuradas. En esta clasificación no hay límites precisos entre orden y desorden, donde las más estructuradas presentan algún grado de flexibilidad, y las más desordenadas siempre tienen algún grado de estructura residual.  
Efectivamente, las IDPs están implicadas en una gran cantidad de procesos vitales merced a su gran plasticidad conformacional, que les permite regular las funciones de sus ligandos, y promover el ensamblaje de complejos supramoleculares. Las IDPs están implicadas en rutas de reconocimiento, señalización, regulación y control; en las que interaccionan con muchos ligandos de forma específica, pero con baja afinidad. Así pues, entre otras funciones, actúan como:
·       Auténticos centros de conexión de proteínas en redes proteicas de señalización.
·       Proteínas andamio, interaccionando con varios ligandos a la vez, en la parte central de algunos complejos y rutas. Proporcionan, así, orientación espacial selectiva y coordinación temporal entre las proteínas en juego.
·       Las estructuras desordenadas en el control de la transcripción: factores de transcripción, histonas y proteínas ribosomales; muy importantes en eucariotas.
·       Las estructuras desordenadas en la regulación de algunas rutas celulares: modificaciones postraducción, señalización, muerte celular programada, entre otras.
·       Regulación funcional mediante IDPs y splicing alternativo.
·       Regulación funcional mediante IDPs y modificaciones postraducción.
·       Entre las últimas incorporaciones a la lista de IDPS está la de los chaperones, con lo que la terna funcional de proteínas, desde la etapa prebiótica, propuesta anteriormente: IDPs, conformones y chaperones; se ve apoyada por los hechos.


Las proteínas desordenadas median la interacción entre organismo y ambiente


La gran plasticidad conformacional de las IDPs se pone de manifiesto cuando observamos reconocimientos múltiples entre distintas secuencias y un sitio de unión común; con diferentes plegamientos de las IDPs formando complejos con sus ligandos, que, así, pueden actuar abrazándolos, envolviéndolos, pinzándolos, acorchetándolos, penetrándolos, etc. Igualmente, una IDP puede presentar diferentes conformaciones, más o menos ordenadas, tras su unión con ligandos de diferente naturaleza. Esta característica se conoce como la unión de uno para muchos -donde una única región desordenada puede unirse a varios ligandos estructuralmente diversos. Además. Las IDPs permiten grandes superficies de interacción -mucho mayores que las proteínas estructuradas- en los complejos formados con otras proteínas y ligandos, incluidos el ARN y el ADN. La enorme flexibilidad de las IDPs no sólo permite la interacción entre los ligandos unidos por ellas, sino que, también, les permite participar en la cascada de interacciones: la IDP que se une al primer ligando induce un plegamiento parcial que genera un nuevo sitio de unión para un segundo ligando, etc.
Las proteínas desestructuradas refutan el paradigma dominante: una secuencia, una estructura, una función, ya que estas proteínas presentan una heterogeneidad tanto estructural como funcional; dependiendo la estructura de la funcionalidad. Estas características de las proteínas desordenadas las hacen muy especiales como agentes biológicos del nivel supramolecular, que median la comunicación entre el interior y el exterior de los organismos celulares y pluricelulares, esto es -sensu lato- la comunicación entre el ser vivo y su medio ambiente.
La enorme heterogeneidad funcional y estructural de las proteínas intrínsecamente desordenadas nos permite concebir una nueva dinámica de los organismos frente a sus ambientes, radicalmente distinta del paradigma del programa genético. Incluso partiendo de un paradigma proteocéntrico de información conformacional, las propiedades de estas proteínas permiten que pasemos de las redes de cambios conformacionales predominantemente intercatenarios (entre proteínas distintas de una ruta), a cambios intercatenarios pero conectados por una cuerda con nudos o una superficie envolvente de cambios intracatenarios de las IDPs. Estas proteínas, flexibles y extendidas, constituyen un auténtico “sistema nervioso” de la célula: conectan la entrada de información del medio ambiente al interior del organismo celular, coordinan y regulan las funciones de la fisiología celular -incluidos los cambios epigenéticos- y la respuesta celular frente a la información medioambiental.

BIBLIOGRAFÍA
1.    Darwin, C. El origen de las especies. Ed. Bruguera. Barcelona (1980).
2.   Zweiger, G. El genoma: transducción, información, anarquía y revolución en las ciencias biomédicas. Mc Graw-Hill. Interamericana, (2002).
3.    Lewontin, R. C. Genes, organismo y ambiente. Gedisa editorial. Barcelona (2000).
4.  Ogayar, A. y Sánchez-Pérez, M. Algunos hitos conceptuales en la Historia de la Inmunología. Capítulo 1 de Introducción a la Inmunología Humana. Miguel Sánchez-Pérez (ed). Editorial Síntesis. Madrid (1997).
5.    Martínez del Pozo, A. ¿Estaba Christian Anfinsen en lo cierto? Anales de Química.
6. Ogayar, A., Sánchez-Pérez, M. Prions: an evolutionary perspective. International Microbiology (1998) vol. 1, nº 3, 183-190.
7.    Prusiner, S. B. Novel proteinaceus infectious particles cause scrapie. Science (1982), 216: 136-144.
8.    Tompa, P. Intrinsically unstructured proteins. Trends in Biochemical Sciences (2002), vol. 27, nº 10, 527-533.
9.    Uversky, V. N. Intrinsically disordered proteins. Springer, (2014).

1.   Parker, E. T. et al. Primordial synthesis of amines and amino acids in a 1958 Miller H2S-rich spark discharge experiment. PNAS (2011), vol. 108, nº 14, 5526-5231.