Diccionario de Secuencias Peptídicas

con Aplicaciones en Biotecnología de Proteinas
[ DiPep-BiPro ]


Datos Generales

Resumen

The research Team


Codigo: 1FD97-0372

Coordinador.
Oswaldo Trelles
Departamento de Arquitectura de Computadores
Universidad de Málaga

Palabras Clave
Secuencias Peptídicas, bases de datos de secuencias biológicas, BioInformática,
Minería de datos, Paralelismo, Epítopos, alergias, antígenos

Financiación : Fondo Europeo de Desarrollo Regional (FEDER)
Período : Inicio 01.03.1999 Finalización 31.12.2001

Socios
Arquitectura de Computadores (U.Málaga) ..............Dr. Oswaldo Trelles
Dept. de Genética (U.Málaga)........................... Dr. Guillermo Thode
Hospital Carlos Haya, SAS Andalucía ..................Dr. Miguel Blanca
VESALIO Software (Málaga)........................... Dr. Antonio García

Colaboradores
Unidad de BioComputación (CNB-Madrid)............ Dr. José María Carazo
Unidad de Diseño de Proteinas (CNB-Madrid) .......Dr. Alfonso Valencia
Fac. Ciencias Químicas (U.Complutense) ...........Dra. Rosalía Rodríguez
Informática Médica (IMIM, Barcelona)................... Dr. Roderic Guigó
Glaxo Wellcome S.A. .........................................Dr. Joaquín Dopazo


Resumen

Este documento describe un Proyecto de Demostración en las áreas prioritarias de Biotecnología y Tecnologías de la Información y de las Comunicaciones, con cargo a los fondos FEDER cuyo objetivo es el diseño,implantación y explotación de un Diccionario o base de datos de Secuencias Peptídicas con Aplicaciones en Biotecnología de Proteinas y en el área de Análisis de Secuencias Biológicas en general.

En resumen, el proyecto propone desarrollar un sistema BioInformático capaz de detectar pequeñas secuencias peptídicas asociadas a un significado biológico a partir de información almacenada en las bases de datos de secuencias biológicas organizar esta nueva información y desarrollar un conjunto de aplicaciones que permitan utilizarla de forma cotidiana en los procesos de análisis de secuencias y de forma especial en las tareas de diseño de proteínas.

La utilidad del sistema será valorada utilizando el Diccionario en aplicaciones de interés para las industrias farmacéuticas y de bioingeniería, en las que se evaluarán también las ventajas que aportaría la disponibilidad de esta nueva información en la reducción de tiempos de cálculo y sensibilidad de las búsquedas.

Para alcanzar estos objetivos se proponen las siguientes líneas de trabajo que incluyen la coordinación entre las diversas instituciones y grupos de investigación participantes en el proyecto:

(1) Los grupos de investigación de Biología abordarán: (a) la descripción de los criterios biológicos con que se buscarán los patrones, los mecanismos que se emplearán para valorar su significado y los conjuntos de prueba para validar los resultados; (b) la descripción de las principales modalidades de explotación de la información obtenida (aplicaciones), en especial los mecanismos de búsqueda, análisis y evaluación de péptidos.

(2) Los grupos de investigación de Computación aportarán : (a) El desarrollo e implementación de los algoritmos para la identificación de péptidos a partir de la descripción de las señales y de las BD de secuencias biológicas decididas en (1). Debido al gran volumen de datos que el proyecto pretende manejar, es previsible la necesidad de utilizar técnicas de computación de alto rendimiento y paralelismo, por lo que estos grupos también suministrarán las plataformas para la ejecución de estos algoritmos. (b) La definición de la arquitectura que dará soporte al almacenamiento y el desarrollo de las interfases avanzadas de acceso a la información local y remota vía internet. (c) Los protocolos de actualización de la información en base a la aparición de nuevas secuencias biológicas y a la nueva información sobre secuencias ya establecidas y (d) el desarrollo del software necesario para la interrogación, búsqueda, recuperación y manipulación de la información obtenida, en la línea de las aplicaciones seleccionadas.

(3) Interpretación y validación de los resultados producidos en las etapas 1 y 2. La información obtenida en esta etapa realimentará las decisiones y diseños elaborados en (1) y (2).

(4) La utilidad del Diccionario propuesto será demostrada mediante su utilización por los grupos de [Empresas y Laboratorios] en las siguientes aplicaciones: (a) Identificación de epítopos en proteínas alergénicas, (b) predicción de genes (c) información para la anotación automática de secuencias y (d) búsqueda de secuencias diana de capacidad antifúngica. Además es previsible la posibilidad de utilizar el Diccionario en otras aplicaciones, como el análisis de genomas, y en general, en el desarrollo de nuevas estrategias de análisis de secuencias a la luz de la nueva información disponible.

(5) Para la difusión de resultados se preparará la documentación técnica sobre la implementación del Diccionario de Péptidos en conjunto con los principales resultados del proyecto, lo que incluye la preparación de manuales, tutoriales y CD-ROMs con los prototipos que se vayan generando. La disponibilidad del Diccionario será un motor importante para la promoción de la actividad biotecnológica en la región, lo que impulsará nuevos desarrollos y colaboraciones en los sectores académicos (líneas de formación e investigación), sanitarios (nuevos abordajes en el diseño de fármacos), e industriales (desarrollo de software, servicios de explotación de la información). Las aplicaciones elegidas mostrarán la utilidad del proyecto para potenciar y facilitar sus tareas (reducción de los tiempos de cálculo, mayor sensibilidad en las búsquedas, mayores posibilidades en la interrogación), su enorme potencial económico y social y sus posibilidades para establecer una línea de trabajo de amplias expectativas a nivel regional, nacional e internacional.

Además de los cuatro grupos que conforman el consorcio, todos ellos con una amplia experiencia en su área de trabajo, participan también cinco grupos de expertos colaboradores como potenciales usuarios de los desarrollos que se vayan produciendo, para que a través de sus necesidades disjuntas puedan dar una opinión importante, aportar su experiencia en momentos claves del proyecto y evaluar la utilidad del sistema desarrollado.