Mètodes estadístics per al refinament del diagnòstic dels síndromes limfoproliferatius de cèl·lula B

Author

Clot Razquin, Guillem

Director

Sànchez, Àlex (Sànchez Pla)

Beà Bobet, Sílvia M.

Date of defense

2017-09-12

Pages

214 p.



Department/Institute

Universitat de Barcelona. Departament de Genètica, Microbiologia i Estadística

Abstract

Els síndromes limfoproliferatius crònics de cèl·lula B (B-CLPD) engloben diverses entitats heterogènies de tumors hematològics. Aproximadament un 15% dels casos no es poden classificar correctament en cap entitat mitjançant els criteris diagnòstics convencionals. Aquests casos sense un diagnòstic definitiu es consideren B-CLPD, not otherwise specified (B-CLPD, NOS). Determinades informacions moleculars, com són l'expressió gènica i les alteracions en el material genètic, podrien contenir trets específics de cada entitat. La tecnologia dels microarrays permet mesurar l'expressió de milers de gens o la quantitat de material genètic en milers de regions de manera simultània, el qual facilita la identificació de biomarcadors candidats. El primer objectiu d'aquesta tesi ha sigut el de construir un predictor, basat en informació de dues plataformes de microarrays diferents (expressió i copy-number), capaç de classificar les diferents entitats de B-CLPD. Per tal de construir-lo, s'ha utilitzat una cohort de 159 pacients leucèmics distribuïts en nou entitats de B-CLPD diferents. Degut al cost econòmic d'utilitzar dues plataformes, ha sigut molt important avaluar l'increment que suposa en la precisió del predictor utilitzar-ne dues en comptes d'una. La metodologia utilitzada ha permès concloure que l'expressió gènica, com a font única, obté precisions similars a les de combinar les dues fonts. El segon objectiu ha sigut construir un predictor utilitzant només la font d'expressió. Per tal de minimitzar el risc d'overfitting, la metodologia proposada ha permès obtenir un predictor senzill i fàcil de contrastar amb coneixements biològics previs. Aquest predictor ha inclòs 55 gens i ha sigut capaç de distingir sis de les nou entitats. Les tres restants s'han categoritzat com Miscellaneous. Els predictors basats en tecnologies d'alt rendiment, com són els microarrays, són difícils d'implementar a la rutina clínica. Existeixen tècniques més simples, com la quantitative PCR (qPCR), però que tenen l'inconvenient de només poder mesurar uns pocs gens simultàniament. El primer pas per tal de construir un predictor basat en qPCR és seleccionar un petit subconjunt de gens a mesurar en aquesta tecnologia, on la selecció es fa en base a la informació obtinguda dels microarrays. Aquest canvi de tecnologia té dos inconvenients: i) el nombre de gens a traslladar a qPCR és limitat, i ii) la correlació entre les dues tecnologies no és perfecta, provocant que les capacitats predictives observades en els microarrays no sempre es reprodueixin en qPCR. El tercer objectiu d'aquesta tesi ha sigut seleccionar un subconjunt de 35 gens a traslladar a qPCR, on la metodologia proposada ha tingut en compte tres rellevàncies (biològica, estadística i multivariant) dels gens per tal de maximitzar la reproductibilitat de la informació al canviar de plataforma. Degut a que la metodologia que s'ha utilitzat per a la selecció de gens és complexa d'aplicar a la pràctica, s'ha proposat lassoVoting, un mètode més senzill i que s'ha demostrat que és adequat quan l'estructura de correlació està ordenada. Amb els 35 gens seleccionats, s'ha utilitzat una mostra de 44 pacients dels 159 inicials per construir el predictor en qPCR. Aquest predictor ha inclòs 8 gens i s'ha provat exitosament en una cohort de validació independent de 63 pacients. Degut a la incapacitat de l'expressió gènica per distingir les tres entitats Miscellaneous, el quart objectiu d'aquesta tesi ha sigut avaluar si altres trets moleculars i genètics publicats en la literatura permeten distingir-les. S'han identificat diversos trets que, un cop s'han descartat les altres sis entitats en base a l'expressió gènica, les poden discriminar. Finalment, en una cohort de 64 B-CLPD, NOS, s'han classificat a una entitat específica 29 casos utilitzant només l'expressió gènica i 14 utilitzant l'expressió i trets moleculars/genètics. En els 21 restants, només s'han pogut descartar sis entitats.


B-cell chronic lymphoproliferative disorders (B-CLPD) encompass a heterogeneous group of hematologic tumors. Gene expression and genetic aberrations could contain specific features of each entity. Microarray technologies can be used to measure the expression of thousands of genes or the genetic material in thousands of regions simultaneously, a useful characteristic for biomarker discovery. The first objective of this thesis was to build a predictor that, based on information of two microarray platforms (expression and copy-number), could assist in the diagnosis of nine entities of B-CLPD. The methodology used to address this allowed to conclude that gene expression alone was enough to discriminate most entities, an important result due to the high cost of using two platforms. The second objective was to build a predictor using only gene expression data. The proposed methodology was able to obtain a predictor easy to correlate with previous biological knowledge. Prediction models build with microarray data are difficult to implement into the clinical practice. Quantitative PCR (qPCR) is an easier technique to implement, but can only measure a limited number of genes. The third objective of this thesis was to build a predictor based on qPCR. The first step to build this predictor was to transfer a subset of genes from microarray to qPCR. The proposed methodology took into account the statistical, biological and multivariate relevance of each gene, three important aspects to maximize the reproducibility of the results between microarray and qPCR. Due to the complex methodology used to select this subset, lassoVoting was proposed, a simpler method that has been shown to improve the selection when the correlation structure is organized. The expression (microarray and qPCR) predictors were unable to distinguish three of the nine entities. The four objective was to combine this two predictors with previous biological knowledge to improve the discrimination of these entities. Several molecular and genetic features have been identified that could distinguish them once expression ruled out the other six entities. Finally, the combination of expression and other molecular/genetic features had been successfully applied in a cohort of 64 patients that cannot be reliably classified by current diagnostic criteria.

Keywords

Mètodes estadístics; Métodos estadísticos; Statistical methods; Limfomes; Linfomas; Lymphomas; Cèl·lules B; Células B; B cells; Tumors; Tumores

Subjects

575 - General genetics. General cytogenetics

Knowledge Area

Ciències Experimentals i Matemàtiques

Documents

GCR_TESI.pdf

4.267Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)