Rendimiento de bases de datos columnares

##plugins.themes.bootstrap3.article.main##

Mario Raul Morales-Morales https://orcid.org/0000-0002-7493-8072
Jhonatan W. Durán-Cazar http://orcid.org/0000-0002-8574-1435
Eduardo J. Tandazo-Gaona http://orcid.org/0000-0002-2209-3952
Santiago Morales Cardoso http://orcid.org/0000-0002-3833-9654

Keywords

análisis de datos, base de datos columnar, en memoria, NoSQL, rendimiento

Resumen

En la actualidad para el éxito de las empresas es decisiva la capacidad de procesar de manera eficiente una considerable cantidad de datos de una amplia gama de fuentes en cualquier lugar y momento. El análisis de datos se convierte en una estrategia clave para la mayoría de las grandes organizaciones para lograr una ventaja competitiva. Por tanto, surgen nuevas cuestiones a ser tomadas en cuenta a la hora de almacenar y consultar cantidades masivas de datos que, en general, las bases de datos relacionales tradicionales no pueden abarcar. Estas cuestiones incluyen desde la capacidad de distribuir y escalar el procesamiento o el almacenamiento físico, hasta la posibilidad de utilizar esquemas o tipos de datos no usuales. El objetivo principal de la investigación es evaluar el rendimiento de las bases de datos columnares en analítica de datos. Efectuar una comparación con bases de datos de tipo relacional, para determinar su eficiencia, realizando mediciones en distintos escenarios de pruebas. El presente estudio pretende proporcionar (evidencia científica) un instrumento que facilite a los profesionales interesados en la analítica de datos una base para sus conocimientos, al incluir cuadros y tablas comparativos con datos cuantitativos con los que se pueda sustentar las conclusiones de esta investigación. Se usa una metodología aplicada y de diseño descriptivo cuantitativo-comparativo al ser el que mejor se ajusta al estudio de características de eficiencia de bases de datos. En la medición se usa el método de promedios para n número de tomas y se soporta en la herramienta Aqua Data Studio que garantiza una alta confiabilidad al ser un programa especializado para la administración de bases de datos. Finalmente, se ha logrado determinar que las bases columnares tienen un mejor rendimiento en ambientes de análisis de datos.
Abstract 141 | PDF Downloads 82 PDF (English) Downloads 10 EPUB Downloads 9 HTML (English) Downloads 2 HTML Downloads 13

Citas

[1] A. B. M. Moniruzzaman and S. A. Hossain, “NoSQL database: New era of databases for big data analytics - classification, characteristics and comparison,” International Journal of Database Theory and Application, vol. 6, no. 4, pp. 1–5, 2013. [Online]. Available: http://bit.ly/2XaKoPK
[2] M. F. Pollo Cattaneo, M. López Nocera, and G. Daián Rottoli, “Rendimiento de tecnologías NoSQL sobre cantidades masivas de datos,” Cuaderno Activa, no. 6, pp. 11–17, 2014. [Online]. Available: http://bit.ly/2Rb8zrO
[3] I. Mihaela-Laura, “Characteristics of in-memory business intelligence,” Informatica Economica, vol. 18, no. 3, pp. 17–25, 2014. [Online]. Available: http://doi.org/10.12948/issn14531305/18.3.2014.02
[4] D. Robles, M. Sánchez, R. Serrano, B. Adárraga, and D. Heredia, “¿Qué características tienen los esquemas NoSQL?” Investigación y desarrollo en TIC, vol. 6, no. 1, pp. 40–44, 2015. [Online]. Available: http://bit.ly/2MJ1wZa
[5]M. Marqués, Bases de datos. Universitat Jaume, 2011. [Online]. Available: http://bit.ly/2RcPtS9
[6] E. Ramez and B. N. Shamkant, Fundamentals of Database Systems. Pearson Education., 2015. [Online]. Available: http://bit.ly/2IG3pAk
[7] G. Hahn and J. Packowski, “A perspective on applications of in-memory analytics in supply chain management,” Decision Support Systems, vol. 76, pp. 45–52, 2015. [Online]. Available: https://doi.org/10.1016/j.dss.2015.01.003
[8] H. Plattner and B. Leukert, The In-Memory Revolution. Springer, 2015. [Online]. Available: http://bit.ly/2F3ezhO
[9] M. R. Morales Morales and S. L. Morales Cardoso, “Inteligencia de negocios basada en bases de datos in-memory,” Revista Publicando, vol. 11, no. 2, pp. 201–217, 2017. [Online]. Available: http://bit.ly/2WB3vmC
[10] R. Babeanu and M. Ciobanu, “In-memory databases and innovations in Business Intelligence,” Database Systems Journal, vol. 6, no. 1, pp. 59–67, July 2015. [Online]. Available: http://bit.ly/2wZLFL7
[11] V. D. Shetty and S. J. Chidimar, “Comparative study of SQL and NoSQL databases to evaluate their suitability for big data application,” International Journal of Computer Science and Information Technology Research, vol. 4, no. 2, pp. 314–318, 2016. [Online]. Available: http://bit.ly/2KlNZor
[12] A. T. Kabakus and R. Kara, “A performance evaluation of in-memory databases,” Journal of King Saud University - Computer and Information Sciences, vol. 29, no. 4, pp. 520–525, 2017. [Online]. Available: https://doi.org/10.1016/j.jksuci.2016.06.007
[13] M. T. González-Aparicio, M. Younas, J. Tuya, and R. Casado, “Testing of transactional services in NoSQL key-value databases,” Future Generation Computer Systems, vol. 80, pp. 384–399, 2018. [Online]. Available: https://doi.org/10.1016/j.future.2017.07.004
[14] A. Nayak, A. Poriya, and D. Poojary, “Type of NoSQL databases and its comparison with relational databases,” International Journal of Applied Information Systems (IJAIS), vol. 5, no. 4, pp. 16–19, 2013. [Online]. Available: http://bit.ly/2X2fIQQ
[15] S. Simon, “Report to brewer’s original presentation of his CAP theorem at the symposium on principles of distributed computing (PODC) 2000,” University of Basel, HS2012, Tech. Rep., 2018. [Online]. Available: http://bit.ly/2XFBo2l
[16] E. Brewer, “Cap twelve years later: How the ‘rules’ have changed,” Computer, vol. 45, no. 2, pp. 23–29, Feb 2012. [Online]. Available: https://doi.org/10.1109/MC.2012.37
[17] M. Indrawan-Santiago, “Database research: Are we at a crossroad? Reflection on NoSQL,” in 2012 15th International Conference on Network-Based Information Systems, Sep. 2012, pp. 45–51. [Online]. Available: https://doi.org/10.1109/NBiS.2012.95
[18] GENBETA, NoSQL: clasificación de las bases de datos según el teorema CAP. GENBETA, 2019. [Online]. Available: http://bit.ly/2WHVvR4
[19] R. D. L. Engle, B. T. Langhals, M. R. Grimaila, and D. D. Hodson, “Evaluation criteria for selecting NoSQL databases in a single-box environment,” International Journal of Database Management Systems (IJDMS), vol. 10, no. 4, pp. 1–12, 2018. [Online]. Available: http://bit.ly/2ZgXEQc
[20] Crowd, Best Relational Databases Software. Crowd. Inc, 2019. [Online]. Available: http://bit.ly/2RbQPge
[21] DB-Engines. (2019) Db-engines ranking of wide column stores. [Online]. Available: http://bit.ly/2KOBYHs
[22] Kaggle, Corporación Favorita Grocery Sales Forecasting, 2019. [Online]. Available: http://bit.ly/2F7QYMS
[23] J. W. Durán Cazar, E. J. Tandazo Gaona, and M. R. Morales Morales, Estudio del rendimiento de una base de datos columnar en el análisis de datos. Tesis de Grado. Universidad Central del Ecuador, 2018. [Online]. Available: http://bit.ly/2KhB0nl