Normal view MARC view ISBD view

Evaluación comparativa del desempeño computacional de la ejecución de consultas usando la base de datos Chembl / Samantha Penélope Molina Sierra

By: Molina Sierra, Samantha Penélope.
Contributor(s): Carrera Izurieta, Iván Marcelo [Director].
Material type: Mixed materialsMixed materialsQuito : EPN, 2018Description: 146 hojas : ilustraciones, 29 x 21 cm + CD-ROM 8634.Subject(s): Benchmarking | Bases de datos | Desarrollo de softwareOther classification: T-IS/ Online resources: Texto completo
Contents:
LA BIBLIOTECA CENTRAL NO DISPONE DE ESTA TESIS EN FORMATO FÍSICO.
Dissertation note: FACULTAD DE INGENIERIA DE SISTEMAS Tesis (Ingeniero en Sistemas de Computación e Informática). -- Escuela Politécnica Nacional. 2018 Summary: Resumen .- En los últimos veinte años, la cantidad de información de naturaleza molecular generada ha sido muy extensa y se espera que esta siga creciendo conforme aparezcan nuevos avances médicos. Por tanto, la bioinformática debe enfrentar varios desafíos tales como: almacenamiento de datos, procesamiento de datos y administración de recursos computacionales. Estos desafíos pueden verse ejemplificados en la base de datos ChEMBL que está conformada por 75 tablas y cuyas consultas pueden llegar a durar más de treinta minutos; lo cual se considera ineficiente. Bajo la premisa de mejorar el rendimiento de esta base de datos se han planteado dos posibles soluciones: (1) simplificar el modelo de datos original, considerando la información más relevante para este estudio, y (2) adaptar el modelo simplificado a un nuevo modelo de base de datos No SQL basado en grafos. Para evaluar los dos modelos, compararlos y elegir la mejor solución se ha realizado una evaluación de desempeño computacional usando la metodología Planificación de la Capacidad.Summary: Abstract.- In the last twenty years the molecular information has been generated widely and expect it will grow according with the medical advances. Therefore, the bioinformatic should face some challenges such as: data storage, data processing and management of computational resources. These challenges can be exemplified in ChEMBL database, which is formed by 75 tables and the execution time of a query can take around thirty minutes. This is a problem and it is considered inefficient. Under the premise of improve the performance of this database two possible solutions have been proposed: (1) simplify the original data model according with the most relevant information, (2) adapt the simplify model to a new No SQL data model based on graphs. These two models were evaluated using a computational performance evaluation based on Capacity Planning.
Tags from this library: No tags from this library for this title.
    average rating: 0.0 (0 votes)
Item type Current location Call number Copy number Status Date due Barcode Item holds
Tesis Tesis BIBLIOTECA GENERAL
T-IS/1455/CD 8634 (Browse shelf) Ej. 1 Not For Loan BC19040368
Total holds: 0

FACULTAD DE INGENIERIA DE SISTEMAS Tesis (Ingeniero en Sistemas de Computación e Informática). -- Escuela Politécnica Nacional. 2018

Bibliografía: páginas 87 - 90.

LA BIBLIOTECA CENTRAL NO DISPONE DE ESTA TESIS EN FORMATO FÍSICO.

Resumen .- En los últimos veinte años, la cantidad de información de naturaleza molecular generada ha sido muy extensa y se espera que esta siga creciendo conforme aparezcan nuevos avances médicos. Por tanto, la bioinformática debe enfrentar varios desafíos tales como: almacenamiento de datos, procesamiento de datos y administración de recursos computacionales. Estos desafíos pueden verse ejemplificados en la base de datos ChEMBL que está conformada por 75 tablas y cuyas consultas pueden llegar a durar más de treinta minutos; lo cual se considera ineficiente. Bajo la premisa de mejorar el rendimiento de esta base de datos se han planteado dos posibles soluciones: (1) simplificar el modelo de datos original, considerando la información más relevante para este estudio, y (2) adaptar el modelo simplificado a un nuevo modelo de base de datos No SQL basado en grafos. Para evaluar los dos modelos, compararlos y elegir la mejor solución se ha realizado una evaluación de desempeño computacional usando la metodología Planificación de la Capacidad.

Abstract.- In the last twenty years the molecular information has been generated widely and expect it will grow according with the medical advances. Therefore, the bioinformatic should face some challenges such as: data storage, data processing and management of computational resources. These challenges can be exemplified in ChEMBL database, which is formed by 75 tables and the execution time of a query can take around thirty minutes. This is a problem and it is considered inefficient. Under the premise of improve the performance of this database two possible solutions have been proposed: (1) simplify the original data model according with the most relevant information, (2) adapt the simplify model to a new No SQL data model based on graphs. These two models were evaluated using a computational performance evaluation based on Capacity Planning.

Samantha Penélope Molina Sierra 70820 cedido 0.20 Ej. 1 Biblioteca Central 2018/03/07

There are no comments for this item.

Log in to your account to post a comment.

Powered by Koha