IMPLEMENTACIÓN DE UN MÉTODO ESTOCÁSTICO DE BÚSQUEDA, ACOPLANDO TÉCNICAS DE CLASIFICACIÓN, MÁQUINAS DE VECTORES DE SOPORTE (SVM) PARA LA SELECCIÓN DE VARIABLES EN SISTEMAS MULTISENSORIALES.

 

Autor: Adrian Alberto Carvajal Ferrer

Director: PhD. Oscar Eduardo Gualdrón Guerrero

 

RESUMEN

 

El interés en la selección de variables de las investigaciones en cualquier campo de la ciencia es un tema que en los últimos años ha incrementado considerablemente su interés, ya que la mayoría de las investigaciones buscan contar con datos representativos y veraces para identificar determinados parámetros clave o marcadores inherentes a cada objeto de estudio. Pero debido a la dimensionalidad de los datos derivadas de las diferentes medidas, las investigaciones tienden a ser tediosas en cuanto a su análisis y tiempos dedicados a las mismas.


El principal objetivo de esta tesis fue el estudio y desarrollo de nuevos métodos de selección de variables acoplados con modelos predictivos y métodos de reconocimiento de patrones, con el fin de disminuir la dimensionalidad de los datos y optimizar los procesos de identificación, clasificación y/o cuantificación en diversos sistemas y su aplicación en: datos metabolómicos, Nariz Electrónica, medición de conjunto de mezclas de vapor binario, reconocimiento de imágenes y de voz. Además, se propone un nuevo algoritmo de selección de variables usados con los Modelos Máquinas de Vectores Soporte de Mínimos Cuadrados (LS-SVM) y Simulated Annealing (SA) en aplicaciones de reconocimiento de patrones. El método propuesto se basa en hibridizar métodos estocásticos como SA junto al SVM y LS-SVM. Los resultados obtenidos muestran que es posible reducir el número de variables sin penalizar los resultados de clasificación demostrando una alta confiablidad.

 

Bibliografía

 

Nuevos biomarcadores genéticos para el cáncer de próstata esporádico

<http://hdl.handle.net/10481/23501> [Citado el 06-06-2013 de 2013].

 

ANDROS, C. P. Fundamentos y funciones de la espectrometría de masas. 2013.vol. 1, no. 1, p. 1-17.

 

ARANGO, S. S. Biomarkers for the evaluation of human health risks. En:Revista

Facultad Nacional de Salud Pública. 2012. vol. 30, no. 1, p. 75-82.

 

BETANCOURT, G. A. Las máquinas de soporte vectorial (svms). En:Scientia et

Technica. 2005. vol. 1, no. 27, p. 1-6.

 

BEVILACQUA, A. Optimizing Parameters of a Motion Detection System by Means of a Genetic Algorithm. En:WSCG SHORT PAPERS proceedings. 2003. vol. 1, no.1, p. 1-8.

 

BROADHURST, D., GOODACRE, R., JONES, A., ROWLAND, J.J., KELL, D.B.

Genetic algorithms as a method for variable selection in multiple linear regression and partial least squares regression, with applications to pyrolysis mass spectrometry. En:Analytica Chimica Acta. 1997. vol. 348, no. p. 71–86.

 

CANALES, J. C., ZHANG, X. L. y LIU, W. Y. Clasificación de grandes conjuntos

de datos vía Máquinas de Vectores Soporte y aplicaciones en sistemas biológicos. Trabajo de grado Doctor en Ciencias. Mexico: Cinvestav. Facultad de Computacion, 2009. 208 p.

 

CONTRERAS, Rodolfo. Fundamentos Modernos De Química General, edición:

edición de la universidad de Pamplona, 1999. 274 p

Instituto Roche | Agentes en Biotecnología y salud | Introducción a la

Metabolómica [on line].

<http://www.institutoroche.es/Biotecnologia_agentes_en_biotecnologia_y_salud/V

41.htmlfiles/4/V41.html> [Citado el Abril de 2013].

 

INFORME DEL PRESIDENTE A LA ASAMBLEA. XXVII CONGRESO SVC

PEÑÍSCOLA 2010. 2010: Memorias. 117.

 

FERNÁNDEZ-CABALLERO, A., et al., Una Perspectiva de la Inteligencia Artificial

en su 50 Aniversario. En: España: G. Q. L. Roda, 2006. p. 442

 

GARCÍA, D. E. y MEDINA, M. G. Composición química, metabolitos secundarios,

valor nutritivo y aceptabilidad relativa de diez árboles forrajeros. En:Zootecnia

Trop. 2006. vol. 24, no. 3, p. 233.

118

 

GUALDRON GUERRERO, O. E. Desarrollo de diferentes métodos de selección de

variables para sistemas multisensoriales. Trabajo de grado Doctorado en

ingeniería Electrónica: Departament D`Enginyeria Electrònica Elèctrica I

Automàtica. Facultad de Enginyeria Electrònica Elèctrica I Automàtica. 2006. 185

p.

 

JESÚS, M. y CUBERO, Á. NEW GENETIC BIOMARKERS FOR SPORADIC

PROSTATE CANCER. vol. no. p.

 

KIRKPATRICK, S., JR., D. G. y VECCHI, M. P. Optimization by simmulated

annealing. En:science. 1983. vol. 220, no. 4598, p. 671-680.

LENDASSE, A., et al., LS-SVM hyperparameter selection with a nonparametric

noise estimator. En: Artificial Neural Networks: Formal Models and Their

Applications–ICANN 2005. 2005. p. 625-630

 

LEVEL, S. M. y TROPICAL, N. V. O. S. F., FODDER. Composición proximal,

niveles de metabolitos secundarios y valor nutritivo del follaje de algunos árboles

forrajeros tropicales. En:Arch. Zootec. 2006. vol. 55, no. p. 373-384.

 

LINDON, J. C., NICHOLSON, J. K. y HOLMES, E. The handbook of

metabonomics and metabolomics. 2011. p.

 

MARTÍN GÓMEZ, M. C. y BALLESTEROS GONZÁLEZ, M. Espectrometría de

masas y análisis de biomarcadores. En:Monografías de la Real Academia

Nacional de Farmacia. 2010. vol. no. p.

 

MAYORQUÍN, A. E. R., et al. Aplicación de la Genómica y la Proteómica en el

estudio de las bases moleculares del envejecimiento. 2012. vol. no. p. 49-60.

 

MISEVIČIUS, A. A modified simulated annealing algorithm for the quadratic

assignment problem. En:Informatica. 2003. vol. 14, no. 4, p. 497-514.

 

OSELLA, C., et al. DOUGH PROPERTIES RELATED TO BAKING QUALITY

USING PRINCIPAL COMPONENT ANALYSIS ANÁLISIS DE COMPONENTES

PRINCIPALES ENTRE PROPIEDADES DE MASA Y PRODUCTOS

PANIFICADOS. En:CYTA-Journal of Food. 2008. vol. 6, no. 2, p. 95-100.

Caracterización y estudios metabolómicos de compuestos fenólicos bioactivos

mediante técnicas separativas acopladas a espectrometría de masas

<http://www.encuentros.uma.es/encuentros100/omicas.htm> [Citado el de 04-03-2013].

 

RAMÍREZ RAMÍREZ, F. A. Negociación de acciones en la Bolsa de Valores de

Colombia en el corto plazo aplicando el método R. Trabajo de grado Maestría en Administración Económica y Financiera. Facultad de Ingenieria Industrial, 2007. 279 p.

 

REBOLLO, I., GRAÑA, M. y HERNÁNDEZ, C. Aplicacion de algoritmos

estocosticos de optimizacion al problema de la disposicion de objetos noconvexos. En:Revista Investigacion Operacional. 2001. vol. 22, no. 2, p. 184-191.

 

REGALADO, L. G. C., Biología celular y molecular: guía de estudio. En: 2001. p.91-112

 

RITUERTO, E. L. La resonancia magnética nuclear como herramienta en el

estudio y control del proceso de vinificación. Trabajo de grado Universidad de La Rioja. Facultad de 2012. 264 p.

 

ROSSI, F. y VILLA, N., Recent advances in the use of SVM for functional data

classification. En: Functional and Operatorial Statistics. 2008. p. 273-280

 

ROZO MURILLO, L. V. y FRANCO SOTO, J. Tecnologías bioinformáticas para el análisis de secuencias de ADN. 2011. vol. no. p.

 

SCHMIDT, C. W. Metabolomics: what's happening downstream of DNA.

En:Environmental Health Perspectives. 2004. vol. 112, no. 7, p. A410.

 

STASHENKO, E. E., JARAMILLO, B. E. y MARTÍNEZ, J. R. Comparación de la

composición química y de la actividad antioxidante in vitro de los metabolitos

secundarios volátiles de plantas de la familia Verbenaceae. En:Rev. Acad.

Colomb. Cienc. 2003. vol. 27, no. 105, p. 579-597.

 

SUTTER, J. M. y KALIVAS, J. H. Comparison of forward selection, backward

elimination, and generalized simulated annealing for variable selection.

En:Microchemical journal. 1993. vol. 47, no. 1, p. 60-66.

 

TREJOS, J. y CASTILLO, W., Simulated annealing optimization for two-mode

partitioning. En: Classification and Information Processing at the Turn of the

Millennium. 2000. p. 135-142

VAPNIK, V. The nature of statistical learning theory. 2000. p.