ARCIMBOLDO, a supercomputing method for crystallographic ab initio protein structure solution below atomic resolution

Author

Rodríguez Martínez, Dayté Dayana

Director

Usón Finkenzeller, Isabel

Tutor

Biarnés Fontal, Xavier

Date of defense

2013-12-17

Legal Deposit

B.29581-2013

Pages

116 p.



Department/Institute

Universitat Ramon Llull. IQS

Abstract

Els actuals mètodes ab initio per a la resolució d'estructures macromoleculars estan generalment limitats a casos de proteïnes petites que difracten a resolució atòmica (1.2Å màxim) llevat que continguin àtoms pesats. ARCIMBOLDO1 és un mètode general per a la resolució d'estructures amb dades de difracció de fins 2Å que s'executa en un entorn de multiso lució. Està basat en l'ús del programa Phaser2, per a la localització de petits fragments model com α-hèlixs (la seva presència es pot predir per endavant) combinat amb els algoritmes de modificació de la densitat implementats en el programa SHELXE. ARCIMBOLDO va ser especialment dissenyat per funcionar en un supercomputador o en un grid d'ordinadors coordinat per Condor3. A part d'explotar la presència d'α-hèlixs com informació de partida, a l'ARCIMBOLDO es poden incorporar també altres fonts d'informació, per exemple, es poden proposar com a models de recerca fragments més complexos que la ubiqua cadena principal de l'α-hèlix mitjançant el modelatge de cadenes laterals sobre la cadena principal. També es poden utilitzar estructures macromoleculars amb baixa homologia per extreure petits fragments de recerca, perquè tot i que les estructures en general no siguin prou semblants com per fer un ús convencional del mètode de reemplaçament molecular, les similituds locals es poden explotar amb èxit. Per a aquests casos el programa executa en paral•lel una bateria de prova amb models alternatius i selecciona el més prometedor d'acord amb una determinada figura de mèrit. Una altra font d'informació de partida pot ser la informació experimental, la mateixa pot incorporar-se al mètode de les dues maneres següents: • Localització d'un fragment anòmal explotant les diferències anòmales o dades de l'experiment de MAD5. • Localització d'un fragment model quan una subestructura anòmala ha estat previament determinada per un altre programa. Les dues fonts d'informació poden combinar-se en el procés d'expansió, però en qualsevol dels casos anteriors, la clau de l'èxit consisteix en el control del flux de treball per maximitzar les probabilitats d'èxit, mentre s'evita la creació d'un nombre intractable de processos paral•lels. Referències: 1 DD Rodrguez, C Grosse, S Himmel, C Gonzalez, IM de Ilarduya, S Becker, GM Sheldrick, and I Uson. Crystallographic ab initio protein structure solution below atomic resolution. Nature methods, 6(9):651{653, 2009. 2 AJ McCoy, RW Grosse-Kunstleve, PD Adams, MD Winn, LC Storoni, and RJ Read. Phaser crystallographic software. Journal of applied crystallography, 40(4):658{674, 2007. 3 GM Sheldrick. Experimental phasing with SHELXC/D/E: combining chain tracing with density modification. Acta Crystallographica Section D, 66(4): 479{485, 2010. 4 D Thain, T Tannenbaum, and M Livny. Distributed computing in practice: The condor experience. Concurrency and Computation: Practice and Experience, 17(2-4):323{356, 2005. 5 WA Hendrickson and CM Ogata. Phase determination from multiwavelengthanomalous diffraction measurements. Methods in Enzymology, 276:494{523,1997.


ARCIMBOLDO, un método de supercomputación para la determinación cristalográfica ab initio de estructuras de proteínas con resolución inferior a la atómica. RESUMEN: Los actuales métodos Ab initio para la resolución de estructuras macromoleculares están generalmente limitados a casos de proteínas pequeñas que difractan a resolución atómica (1.2Å máximo) a menos que contengan átomos pesados. ARCIMBOLDO1 es un método general para la resolución de estructuras con datos de difracción de hasta 2Å que se ejecuta en un entorno de multisolución. Está basado en el uso del programa Phaser2, para la localización de pequeños fragmentos modelos como α-hélices -cuya presencia puede predecirse de antemano- combinado con los algoritmos de modificación de la densidad implementados en el programa SHELXE3. ARCIMBOLDO fue especialmente diseñado para funcionar en un supercomputador o en un grid de computadoras coordinado por Condor4. Aparte de explotar la presencia de α-hélices como información de partida, en ARCIMBOLDO se pueden incorporar también otras fuentes de información, por ejemplo, se pueden proponer como modelos de búsqueda fragmentos más complejos que la ubicua cadena principal de la α-hélice mediante el modelado de cadenas laterales sobre la cadena principal. También se pueden utilizar estructuras macromoleculares con baja homología para extraer pequeños fragmentos de búsqueda, porque aún cuando las estructuras en general no sean suficientemente parecidas como para hacer un uso convencional del método de reemplazo molecular, las similitudes locales pueden explotarse exitosamente. Para estos casos el programa ejecuta en paralelo una batería de prueba con modelos alternativos y selecciona el más prometedor de acuerdo con una determinada figura de mérito. Otra fuente de información de partida puede ser la información experimental, la misma puede incorporarse al método de las dos siguientes maneras: • Búsqueda de un fragmento anómalo explotando las diferencias anómalas o datos del experimento de MAD5. • Búsqueda de un fragmento modelo cuando una subestructura anómala ha sido previamente determinada por otro programa. Ambas fuentes de información pueden combinarse en el proceso de expansión, pero en cualquiera de los casos anteriores, la clave del éxito radica en el control del flujo de trabajo para maximizar las probabilidades de éxito, a la vez que se evita la creación de un número intratable de procesos paralelos. Referencias: 1 DD Rodrguez, C Grosse, S Himmel, C Gonzalez, IM de Ilarduya, S Becker, GM Sheldrick, and I Uson. Crystallographic ab initio protein structure solution below atomic resolution. Nature methods, 6(9):651{653, 2009. 2 AJ McCoy, RW Grosse-Kunstleve, PD Adams, MD Winn, LC Storoni, and RJ Read. Phaser crystallographic software. Journal of applied crystallography, 40(4):658{674, 2007. 3 GM Sheldrick. Experimental phasing with SHELXC/D/E: combining chain tracing with density modification. Acta Crystallographica Section D, 66(4): 479{485, 2010. 4 D Thain, T Tannenbaum, and M Livny. Distributed computing in practice: The condor experience. Concurrency and Computation: Practice and Experience, 17(2-4):323{356, 2005. 5 WA Hendrickson and CM Ogata. Phase determination from multiwavelengthanomalous diffraction measurements. Methods in Enzymology, 276:494{523,1997.


Ab initio macromolecular phasing has been so far limited to small proteins diffracting at atomic resolution (beyond 1.2Å) unless heavy atoms are present. ARCIMBOLDO1 is a general ab initio phasing method for 2Å data, that works in a multosilution framework, based on the combination of localizing predicted small model fragments (like α-helices) with Phaser2, and density modification with SHELXE3. The method was designed to perform in a grid of computer or a supercomputer running Condor. Further than the use of α-helices as starting information, other sources of stereochemical or experimental information can be exploited as well, fragments that are more sophisticated than the ubiquitous main-chain α-helix can be proposed by modelling side chains onto the main-chain or extracted from low-homology models -even if the conventional molecular-replacement approach has been unsuccessful- since locally their structure may be similar enough to the unknown one. In such cases, the program may test a set of alternative models in parallel against a specified figure of merit and proceed with the selected one(s). Experimental information can also be incorporated to the method in two ways: • Searching within ARCIMBOLDO for an anomalous fragment against anomalous differences or MAD5 data. • Finding model fragments when an anomalous substructure has been determined with another program. Both sources of information may be combined in the expansion process. In any of the above cases the key is to control the workflow to maximize the chances of success while avoiding the creation of an intractable number of parallel processes. KEYWORDS: ab initio phasing, fragment search, molecular replacement, density modification, supercomputing. References: 1 DD Rodrguez, C Grosse, S Himmel, C Gonzalez, IM de Ilarduya, S Becker, GM Sheldrick, and I Uson. Crystallographic ab initio protein structure solution below atomic resolution. Nature methods, 6(9):651{653, 2009. 2 AJ McCoy, RW Grosse-Kunstleve, PD Adams, MD Winn, LC Storoni, and RJ Read. Phaser crystallographic software. Journal of applied crystallography, 40(4):658{674, 2007. 3 GM Sheldrick. Experimental phasing with SHELXC/D/E: combining chain tracing with density modification. Acta Crystallographica Section D, 66(4): 479{485, 2010. 4 D Thain, T Tannenbaum, and M Livny. Distributed computing in practice: The condor experience. Concurrency and Computation: Practice and Experience, 17(2-4):323{356, 2005. 5 WA Hendrickson and CM Ogata. Phase determination from multiwavelengthanomalous diffraction measurements. Methods in Enzymology, 276:494{523,1997.

Keywords

resolució ab initio; localització de fragments; reemplaçament molecular; modificació de la densitat; supercomputació; resolución ab initio; búsqueda de fragmentos; reemplazo molecular; modificación de la densidad; supercomputación; ab initio phasing; fragment search; molecular replacement; density modification; supercomputing

Subjects

577 - Material bases of life. Biochemistry. Molecular biology. Biophysics

Knowledge Area

Bioenginyeria

Documents

ARCIMBOLDO.pdf

11.66Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)