Autor: Adrian Alberto Carvajal Ferrer
Director: PhD. Oscar Eduardo Gualdrón Guerrero
RESUMEN
El interés en la selección de variables de las investigaciones en cualquier campo de la ciencia es un tema que en los últimos años ha incrementado considerablemente su interés, ya que la mayoría de las investigaciones buscan contar con datos representativos y veraces para identificar determinados parámetros clave o marcadores inherentes a cada objeto de estudio. Pero debido a la dimensionalidad de los datos derivadas de las diferentes medidas, las investigaciones tienden a ser tediosas en cuanto a su análisis y tiempos dedicados a las mismas.
El principal objetivo de esta tesis fue el estudio y desarrollo de nuevos métodos de selección de variables acoplados con modelos predictivos y métodos de reconocimiento de patrones, con el fin de disminuir la dimensionalidad de los datos y optimizar los procesos de identificación, clasificación y/o cuantificación en diversos sistemas y su aplicación en: datos metabolómicos, Nariz Electrónica, medición de conjunto de mezclas de vapor binario, reconocimiento de imágenes y de voz. Además, se propone un nuevo algoritmo de selección de variables usados con los Modelos Máquinas de Vectores Soporte de Mínimos Cuadrados (LS-SVM) y Simulated Annealing (SA) en aplicaciones de reconocimiento de patrones. El método propuesto se basa en hibridizar métodos estocásticos como SA junto al SVM y LS-SVM. Los resultados obtenidos muestran que es posible reducir el número de variables sin penalizar los resultados de clasificación demostrando una alta confiablidad.
Bibliografía
Nuevos biomarcadores genéticos para el cáncer de próstata esporádico
<http://hdl.handle.net/10481/23501> [Citado el 06-06-2013 de 2013].
ANDROS, C. P. Fundamentos y funciones de la espectrometría de masas. 2013.vol. 1, no. 1, p. 1-17.
ARANGO, S. S. Biomarkers for the evaluation of human health risks. En:Revista
Facultad Nacional de Salud Pública. 2012. vol. 30, no. 1, p. 75-82.
BETANCOURT, G. A. Las máquinas de soporte vectorial (svms). En:Scientia et
Technica. 2005. vol. 1, no. 27, p. 1-6.
BEVILACQUA, A. Optimizing Parameters of a Motion Detection System by Means of a Genetic Algorithm. En:WSCG SHORT PAPERS proceedings. 2003. vol. 1, no.1, p. 1-8.
BROADHURST, D., GOODACRE, R., JONES, A., ROWLAND, J.J., KELL, D.B.
Genetic algorithms as a method for variable selection in multiple linear regression and partial least squares regression, with applications to pyrolysis mass spectrometry. En:Analytica Chimica Acta. 1997. vol. 348, no. p. 71–86.
CANALES, J. C., ZHANG, X. L. y LIU, W. Y. Clasificación de grandes conjuntos
de datos vía Máquinas de Vectores Soporte y aplicaciones en sistemas biológicos. Trabajo de grado Doctor en Ciencias. Mexico: Cinvestav. Facultad de Computacion, 2009. 208 p.
CONTRERAS, Rodolfo. Fundamentos Modernos De Química General, edición:
edición de la universidad de Pamplona, 1999. 274 p
Instituto Roche | Agentes en Biotecnología y salud | Introducción a la
Metabolómica [on line].
<http://www.institutoroche.es/Biotecnologia_agentes_en_biotecnologia_y_salud/V
41.htmlfiles/4/V41.html> [Citado el Abril de 2013].
INFORME DEL PRESIDENTE A LA ASAMBLEA. XXVII CONGRESO SVC
PEÑÍSCOLA 2010. 2010: Memorias. 117.
FERNÁNDEZ-CABALLERO, A., et al., Una Perspectiva de la Inteligencia Artificial
en su 50 Aniversario. En: España: G. Q. L. Roda, 2006. p. 442
GARCÍA, D. E. y MEDINA, M. G. Composición química, metabolitos secundarios,
valor nutritivo y aceptabilidad relativa de diez árboles forrajeros. En:Zootecnia
Trop. 2006. vol. 24, no. 3, p. 233.
118
GUALDRON GUERRERO, O. E. Desarrollo de diferentes métodos de selección de
variables para sistemas multisensoriales. Trabajo de grado Doctorado en
ingeniería Electrónica: Departament D`Enginyeria Electrònica Elèctrica I
Automàtica. Facultad de Enginyeria Electrònica Elèctrica I Automàtica. 2006. 185
p.
JESÚS, M. y CUBERO, Á. NEW GENETIC BIOMARKERS FOR SPORADIC
PROSTATE CANCER. vol. no. p.
KIRKPATRICK, S., JR., D. G. y VECCHI, M. P. Optimization by simmulated
annealing. En:science. 1983. vol. 220, no. 4598, p. 671-680.
LENDASSE, A., et al., LS-SVM hyperparameter selection with a nonparametric
noise estimator. En: Artificial Neural Networks: Formal Models and Their
Applications–ICANN 2005. 2005. p. 625-630
LEVEL, S. M. y TROPICAL, N. V. O. S. F., FODDER. Composición proximal,
niveles de metabolitos secundarios y valor nutritivo del follaje de algunos árboles
forrajeros tropicales. En:Arch. Zootec. 2006. vol. 55, no. p. 373-384.
LINDON, J. C., NICHOLSON, J. K. y HOLMES, E. The handbook of
metabonomics and metabolomics. 2011. p.
MARTÍN GÓMEZ, M. C. y BALLESTEROS GONZÁLEZ, M. Espectrometría de
masas y análisis de biomarcadores. En:Monografías de la Real Academia
Nacional de Farmacia. 2010. vol. no. p.
MAYORQUÍN, A. E. R., et al. Aplicación de la Genómica y la Proteómica en el
estudio de las bases moleculares del envejecimiento. 2012. vol. no. p. 49-60.
MISEVIČIUS, A. A modified simulated annealing algorithm for the quadratic
assignment problem. En:Informatica. 2003. vol. 14, no. 4, p. 497-514.
OSELLA, C., et al. DOUGH PROPERTIES RELATED TO BAKING QUALITY
USING PRINCIPAL COMPONENT ANALYSIS ANÁLISIS DE COMPONENTES
PRINCIPALES ENTRE PROPIEDADES DE MASA Y PRODUCTOS
PANIFICADOS. En:CYTA-Journal of Food. 2008. vol. 6, no. 2, p. 95-100.
Caracterización y estudios metabolómicos de compuestos fenólicos bioactivos
mediante técnicas separativas acopladas a espectrometría de masas
<http://www.encuentros.uma.es/encuentros100/omicas.htm> [Citado el de 04-03-2013].
RAMÍREZ RAMÍREZ, F. A. Negociación de acciones en la Bolsa de Valores de
Colombia en el corto plazo aplicando el método R. Trabajo de grado Maestría en Administración Económica y Financiera. Facultad de Ingenieria Industrial, 2007. 279 p.
REBOLLO, I., GRAÑA, M. y HERNÁNDEZ, C. Aplicacion de algoritmos
estocosticos de optimizacion al problema de la disposicion de objetos noconvexos. En:Revista Investigacion Operacional. 2001. vol. 22, no. 2, p. 184-191.
REGALADO, L. G. C., Biología celular y molecular: guía de estudio. En: 2001. p.91-112
RITUERTO, E. L. La resonancia magnética nuclear como herramienta en el
estudio y control del proceso de vinificación. Trabajo de grado Universidad de La Rioja. Facultad de 2012. 264 p.
ROSSI, F. y VILLA, N., Recent advances in the use of SVM for functional data
classification. En: Functional and Operatorial Statistics. 2008. p. 273-280
ROZO MURILLO, L. V. y FRANCO SOTO, J. Tecnologías bioinformáticas para el análisis de secuencias de ADN. 2011. vol. no. p.
SCHMIDT, C. W. Metabolomics: what's happening downstream of DNA.
En:Environmental Health Perspectives. 2004. vol. 112, no. 7, p. A410.
STASHENKO, E. E., JARAMILLO, B. E. y MARTÍNEZ, J. R. Comparación de la
composición química y de la actividad antioxidante in vitro de los metabolitos
secundarios volátiles de plantas de la familia Verbenaceae. En:Rev. Acad.
Colomb. Cienc. 2003. vol. 27, no. 105, p. 579-597.
SUTTER, J. M. y KALIVAS, J. H. Comparison of forward selection, backward
elimination, and generalized simulated annealing for variable selection.
En:Microchemical journal. 1993. vol. 47, no. 1, p. 60-66.
TREJOS, J. y CASTILLO, W., Simulated annealing optimization for two-mode
partitioning. En: Classification and Information Processing at the Turn of the
Millennium. 2000. p. 135-142
VAPNIK, V. The nature of statistical learning theory. 2000. p.