Introducción al Particionamiento

Autores/as

Maria Beatriz Bernábe Loranca
Benemérita Universidad Autónoma de Puebla

Palabras clave:

Particionamiento, equivalencias, clúster, algoritmos, medoides, P-Mediana

Sinopsis

Recientemente el volumen de datos generados por distintas actividades ha tenido un incremento además de veloz, importante. A partir de la multiplicidad, origen, variabilidad y número de datos, se persigue que su uso en el análisis permita extraer información valiosa con el fin de evadir incertidumbre y de producir conocimientos que ayuden en la toma de decisiones.

Existen distintas áreas que se encargan del procesamiento y análisis de los datos masivos, dichas disciplinas se apoyan de técnicas enmarcadas en Data Science (DS), Big Data (BD) y Data Mining (DM) entre otros. En particular, una técnica computacional que se identifica como una herramienta de utilidad demandada en tales disciplinas es el agrupamiento de datos. 

Por el lado de BD, se puede decir que su propósito fundamental es evaluar grandes volúmenes de datos que superan la capacidad de los procesamientos informáticos, el objetivo principal es analizar en el menor tiempo posible y de forma eficaz, toda la información utilizando herramientas o softwares para hallar patrones comunes. Sin embargo, DM aunque también analiza grandes volúmenes, comprende un conjunto de técnicas y tecnologías que permiten explorar extensas bases de datos de manera automática y busca a la vez encontrar patrones repetitivos que expliquen el comportamiento de estos datos para obtener una información específica tal que las distintas tareas de una empresa se resuelvan, por ejemplo la optimización.

A veces suelen confundirse los propósitos de algunas áreas cuando se utilizan herramientas que se relacionadas mutuamente entre sí, entonces parece oportuno señalar las diferencias, sobre todo cuando un manuscrito se ocupa de discutir una particular técnica/herramienta, tal como lo es este compendio de 1 volumen que incorpora el tema de introducción al Particionamiento a lo largo del documento.

 

Este es el primer volumen de una serie de 3, el cual se divide en 5 capítulos. El objetivo es proveer material estructurado que permita la comprensión de este tema para estudiantes de distintos grados a partir del nivel licenciatura. 

El contenido de este libro, dedicado a una introducción al Particionamiento, es de gran interés cuando se toma como herramienta computacional, en particular, en la solución de problemas de áreas ingenieriles donde el agrupamiento se encuentra implícito; por ejemplo, si se discuten problemas de diseño de zonas o bien de diversos temas de Investigación de Operaciones como los problemas de ruteo, de asignación, agente viajero etc. En este punto, el Particionamiento se puede expresar como un modelo de optimización, lo cual se aborda en la segunda parte del libro y consecuentemente, permite observar otras bondades del Particionamiento, sobre todo cuando se trata como instrumento algorítmico para ayudar a dar respuestas tanto a problemas muy específicos de Investigación de Operaciones (IO), de Optimización o de Inteligencia Artificial (IA) entre otros.

Aunque se encuentra relacionada la IO con la Optimización, la IO se utiliza para programar actividades sujetas a recursos escasos, y para ello, hace uso de técnicas de modelado matemático, análisis estadístico y optimización. Entonces, la IO busca resolver problemas ante una serie de restricciones con criterios de decisión. Para el caso de la teoría de Optimización clásica, se constituye por un conjunto de resultados, métodos analíticos y numéricos enfocados a encontrar e identificar al mejor candidato de entre una colección de alternativas sin tener que enumerar y evaluar explícitamente todas esas alternativas. En matemáticas, ciencias de la computación o economía, Optimización matemática se entiende como la selección del mejor elemento con respecto a algún criterio de un conjunto de unidades disponibles, no obstante, es razonable afirmar que la investigación operativa es uno de los campos de la matemática y que sus bases son la optimización debido a la necesaria maximización o minimización de una función de costo, donde se eligen sistemáticamente valores de entrada que son tomados de un conjunto, y que el valor de la función es procesado computacionalmente.

La generalización de la teoría de la optimización y otras formulaciones, comprende un área grande de las matemáticas aplicadas, pero en general, la optimización significa el descubrimiento de los "mejores valores" para alguna función objetivo con un dominio definido, es decir, se refiere a la capacidad de hacer o resolver alguna cosa de la manera más eficiente posible y, en el mejor de los casos, utilizando la menor cantidad de recursos.

Considerando lo anterior, se hace énfasis y se justifica que el espacio de este libro, persigue asimilar el beneficio del Particionamiento como herramienta computacional en la solución de problemas de IO y de áreas afines donde el agrupamiento se encuentra tácito o explícito. En este sentido, es importante mencionar que en las últimas décadas, el término optimización se ha vinculado al mundo de la informática, de las matemáticas, de la gestión de procesos y en la economía, además de la anhelada eficiencia de un sistema, teoría de colas y simulación entre otros. Por otra parte, y en un contexto amplio, la IA se comprende considerando su origen y la manera en que la inteligencia se codifica trasladándose a aparatos para realizar operaciones u optimizar procesos para la toma de decisiones.  Nótese aquí la conexión entre IO e IA.

Hablar de IA ni es fácil y mucho menos corto el asunto. Aquí nos ubicamos para insistir no la relación con múltiples áreas, sino con la IO y principalmente con el Particionamiento. Evidentemente, tanto la IA como la IO tienen un cruce en lo que se conoce como la toma de decisiones, lo cual no significa que esta fase sea la única que las sitúa en un pedazo del mismo escenario.

Aunque son muchas las áreas que utilizan la IA para dar solución a sus problemas, la IA es y seguirá siendo una rama de las ciencias de la computación y el Particionamiento es, fue y será una herramienta necesaria no sólo en computación.

Capítulos

  • Capítulo 1. Preliminares
  • Capítulo 2. Introducción al Particionamiento
  • Capítulo 3. Propuestas tradicionales del Particionamiento
  • Capítulo 4. Particionamiento por medoides
  • Capítulo 5. P-Mediana y Particionamiento

Citas

Aldenderfer, M. S. & Blashfield, R K. (1984). Cluster Analysis. Series: Quantitative Applications in the Sociai Sciences. California Sage Publications, Inc.

Aloise, D. (2009). Exact algorithms for minimum sum-of-squares clustering. Ecole Polytechnique Montreal (ACM Digital Library).

Amoroso, M. S. & Ávila, H. S. (2015). Aplicación de las técnicas de agrupamiento para la distribución cuasi-óptima de una red híbrida WDM-TDM/PON en cascada multinivel que da soporte a una Smart Grid o Smart City [tesis de Ingeniero Electrónico, Universidad Politécnica Salesiana]. Repositorio Institucional. http://dspace.ups.edu.ec/handle/123456789/7736.

Anil, J. (2012). Data Clustering: 50 Years Beyond K-Means. Michigan State University.

Ankerst, M., Breunig, M. M., Kriegel, H. P. & Sander, J. (1999, Jun 3). OPTICS: Ordering points to identify the clustering structure [conference session]. ACM SIGMOD Record. https://dl.acm.org/doi/10.1145/304182.304187

Atkeson, C., Moore, A. & Schaal, S. (1997). Locally Weighted Learning. Artificial Intelligence Review, 11, 11-73. https://doi.org/10.1023/A:1006559212014

Ayala, J., Aguilar, I., García, F. & Gómez, H. (2019) Introducción al análisis de algoritmos (1a ed.). Editorial Centro de Estudios e Investigaciones para el Desarrollo Docente.

Baeza, R. & Ribeiro, B. (1996). Modern information retrieval: The concepts and technology behind search. Reading M.A., Addison-Wesley.

Bailey, K. (1994). Typologies and Taxonomies: An Introduction to Classification Techniques (vol 102). Quantitative Applications. SAGE Publications.

Bakamidis, S. G. (1993, April 30). An exact fast nearest neighbour identification technique [conference session]. IEEE International Conference on Acoustics, Speech and Signal processing, Minneapolis, MN, USA. https://doi.org/10.1109/ICASSP.1993.319898

Bernábe, B. (2010). Diseño y desarrollo de un modelo para la determinación de zonificación óptima [tesis de doctorado, Universidad Nacional Autónoma de México]. Repositorio de Tesis DGBSDI. https://ru.dgb.unam.mx/handle/DGB_UNAM/TES01000652934

Bernábe-Loranca, M. B., González-Velazquez, R., Guillén Galván, C & Granillo- Martínez, E. (2021, December 15). A model of compactness-homogeneity for territorial design [conference session]. 21st International Conference on Intelligent Systems Design and Applications, https://link.springer.com/chapter/10.1007/978-3-030-96308-8_32

Bichot, C. E. & Siarry, P. (2013). Graph Partitioning. ISTE. Wiley.

Bell, D. (1958). The principles of sorting. The Computer Journal, 1(2), 71–77. https://doi.org/10.1093/comjnl/1.2.71

Bose, R. C. & Nelson, R. J. (1962). A sorting problem. Journal of the ACM (JACM), 9(2), 282–296. https://doi.org/10.1145/321119.321126

Carrera, J. V. (2005). Clasificación temática de textos basada en transformaciones semánticas [tesis de doctorado, Instituto Politécnico Nacional]. https://www.saber.cic.ipn.mx/SABERv3/Repositorios/webVerArchivo/25861/3

Cattell, R. (1943). The Description of Personality: Basic Traits Resolved Into Clusters. American psychological association.

Curry, H. B. (2010) Foundations of Mathematical Logic (Dover Books on Mathematics) (2a ed). Dover Publications.

Church, R. L. (2003). COBRA: A New Formulation of the Classic p-Median Location Problem. Annals of Operations Research, 122, 103–120. https://doi.org/10.1023/A:1026142406234

Church, R. L. (2008). BEAMR: an exact and approximate model for the p-median problema. Computers and Operation Research, 35(2), 417-26. https://doi.org/10.1016/j.cor.2006.03.006

Daskin, M. S. (1995). Network and Discrete Location: Models, Algorihtms, and Aplications. John Willey&Sons, Inc.

Deerwester, S., Dumals, S., Furnas, T., Landauer, G. & Harshman, R. (1990). Indexing by latent semantic analysis. Journal of the American Society for Information Science, 41(6), 391-407. https://doi.org/10.1002/(SICI)1097-4571(199009)41:6<391:AID-ASI1>3.0.CO;2-9

Delattre, M. & Hansen, P. (1980). Bicriterion cluster analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-2(4), 277-291. https://doi.org/10.1109/TPAMI.1980.4767027

Díaz, G. J., Bernábe, L. B., Olivares, B. E., Luna R. D., Martínez, F. J., (2012). Relajación lagrangeana para el problema de Particionamiento de áreas geográficas. Revista de Matemática: Teoría y Aplicaciones, 19(2),169-181. https://www.redalyc.org/articulo.oa?id=45326926004

Diday, E. (1972). Optimisation en classification automatique et reconnaissance des forms. R.A.I.R.O. Recherche opérationnelle, 6(V3), 61-95. https://doi.org/10.1051/ro/197206V300611

Diday E., Lemaire J., Pouget J. & Testu F. (1982). Eléments d’Analyse de Données. Dunod.

Drezner, Z. (1995). Facility location: A survey of applications and methods. Springer.

Dohan, D., Karp, S. & Matejek., B. (2015). K-median algorithms: theory in practice. https://www.cs.princeton.edu/courses/archive/fall14/cos521/projects/kmedian.pdf

Egner, R. E., Denonn, L.E. (1961). Bertrand Russell Escritos básicos 1903-1959, Allen & Unwin.

Estivill-Castro, V. (2002). Why so many clustering algorithms — A Position Paper. ACM SIGKDD Explorations Newsletter, 4(1), 65-75. doi:10.1145/568574.568575.

Everitt, B. S. (1993). Cluster Analysis (3a ed.). Edward Arnold.

Fraenkel, A. A., Bar-Hillel, Y., Lévy, A. (1973). Foundations of Set Theory (2a ed, Vol. 67), Elsevier Science.

Ferreira, C. E., Martin, A., de Souza, C.C., Weismantel, R. & Wolsey, L. A. (1998). The node capacitated graph partitioning problem: A computational study. Mathematical Programming, 81, 229-256. https://doi.org/10.1007/BF01581107

Firdaus, S. & Uddin, M. A. (2015). A survey on clustering algorithms and complexity analysis. IJCSI International Journal of Computer Science Issues, 12(2), 62-85. https://www.ijcsi.org/papers/IJCSI-12-2-62-85.pdf

Forgy, E. W. (1965). Cluster analysis of multivariate data: efficiency versus interpretability of classifications. Biometrics, 21, 768-780 https://www.semanticscholar.org/paper/Cluster-analysis-of-multivariate-data-%3A-efficiency-Forgy/5c4feeae0d911e30866b7149c1195cd8c007199b

Friedman, J., Hastie, T. & Tibshirani, R. (2001). The elements of statistical learning (Vol. 1). Springer.

García, F. (2001). Matemática discreta. Thomson Learning.

Gersho, A. & Gray, R. (1991). Vector Quantization and Signal Compression. Kluwer Academic.

Gierz, G., Hofmann, K. H., Keimel, K., Lawson, J. D., Mislove & Scott, D. S. (2003). Continuous Lattices and Domains. Encyclopedia of Mathematics and its Applications, Vol. 93, Cambridge University Press

Giraldo, F. A., León, E. & Gómez, J. (2013). Caracterización de flujos de datos usando algoritmos de agrupamiento. Tecnura, 17(37), 153-166. https://doi.org/10.14483/udistrital.jour.tecnura.2013.3.a13

Gordon, A. D. (1987). A review of hierarchical classification. Journal of the Royal Statistical Society, Series A (General), 150(2), 119–137. http://dx.doi.org/10.2307/2981629

Han, J., Kamber, M. & Tung, A. K. H. (2001). Spatial Clustering Methods in Data Mining: A Survey. In H. J. Miller & J. Han (eds.), Geographic Data Mining and Knowledge Discovery, Research Monographs in GIS (pp 187 217). Taylor and Francis

Han, J. & Kamber, M. (2006). Data mining: Concepts and techniques, (7a ed.). Morgan Kaufmann.

Hansen, P. & Delattre, M. (1978). Complete-link cluster analysis by graph coloring. Journal of the American Statistical Association, 73 (362), 397-403. https://doi.org/10.2307/2286672

Hansen, P., Jaumard, B. & Frank, O. (1989). Maximum sum-of-splits clustering. Journal of Classification, 6, 177-193. https://doi.org/10.1007/BF01908598

Hansen, P. & Aloise, D. (2009). A survey on exact methods for minimum sum-of-squares clustering, pp 1-2, http://www.math.iit.edu/Buck65files/msscStLouis.pdf

Hansen, P. & Jaumard, B. (1997). Cluster analysis and mathematical programming. Mathematical Programming, 79, 191-215. https://doi.org/10.1007/BF02614317

Hartigan, J. (1975). Cluster algorithms. John Wiley & Sons.

Hartigan, J. A. (1974). Clustering Algorithms. John Wiley & Sons, Nueva York. Pp. 251-276 Math. Sci. Hum, 82 (1983), 85-92. https://people.inf.elte.hu/fekete/algoritmusok_msc/klaszterezes/John%20A.%20Hartigan-Clustering%20Algorithms-John%20Wiley%20&%20Sons%20(1975).pdf

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical learning: Data Mining, Inference, and Prediction. (2a ed). Springer.

Hernández, S. (2009). Clasificadores rápidos basados en el algoritmo del vecino más similar para datos mezclados [tesis de doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica]. INAOE Repositorio. http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/386

Hess, S. W. & Samuels, S. A. (1971). Experiences with a sales districting model: criteria and implementation. Management Science, 18(4), 41-54. https://doi.org/10.1287/mnsc.18.4.P41

Hinneburg, A. & Keim, D. A. (1998). An Efficient Approach to Clustering in Large Multimedia Databases with Noise. Institute of Computer Science, University of Halle, Germany, American Association for Artificial Intelligence KDD-98, pp. 58-65.

Holmes, M. R. (2012). Alternative Axiomatic Set Theories. In Edward N. Zalta (Eds.), Handbook of the History of Logic The Stanford Encyclopedia of Philosophy. https://plato.stanford.edu/archives/win2021/entries/settheory-alternative

Huertas, A. & Manzano, M. (2002). Teoría de Conjuntos. https://webs.ucm.es/info/pslogica/teoriaconjuntos.pdf

IEEE Standard for Floating-Point Arithmetic. (2019). IEEE Std 754-2019 (Revisión de IEEE, 754(2008)), 1-84. doi: 10.1109/IEEESTD.2019.8766229

Jain, A. K. (2010). Data Clustering: 50 Years Beyond K-Means. Pattern Recognition Letters, 31(8), 651-666. https://doi.org/10.1016/j.patrec.2009.09.011

Johnson, S. C. (1967). Hierarchical Clustering Schemes. Psychometrika, 32, 241-254. https://doi.org/10.1007/BF02289588

Kalcsics, J., Nickel, S. & Schröder, M. (2005). Toward a unified territorial design approach: Applications, algorithms, and GIS integration, TOP, 13(1), 1–56. https://doi.org/10.1007/BF02578982

Kanungo, T., Netanyahu, N. & Wu, A. (2002). An efficient K means algorithm: Analysis and Implementation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 24(7), 881–892. https://www.cs.umd.edu/~mount/Projects/KMeans/pami02.pdf

Kaufman, L. & Rousseeuw, P. (1987). Clustering by means of medoids. In Y. Dodge (Ed.), Statistical Data Analysis, based on the LI Norm (pp. 405-416), Elsevier/North Holland, Amsterdam.

Kaufman, L. & Rousseeuw, P. J. (2005). Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley, Hoboken, http://dx.doi.org/10.1002/9780470316801.ch1

Kariv, O., & Hakimi, S. L. (1979). An Algorithmic Approach to Network Location Problems. Part II: The p-Medians. SIAM Journal on Applied Mathematics, 37(3), 539–560. http://www.jstor.org/stable/2100911

Knuth, D. (1998). The Art of Computer Programming: Sorting and Searching. (2a ed). Addison Wesley.

Lipschutz, S. (1970). Teoría de Conjuntos y Temas Afines, Teoría y 530 problemas resueltos, Serie de compendios SCHAUM. Mc Graw-Hill.

Macmillan, W. (1994). Optimization modelling in GIS framework: the problem of political redistricting. In Fotheringham and P. Rogerson (Eds.), Spatial Analysis and GIS (pp 221-246). Taylor & Francis.

MacQueen, J. (1966, 7 January). Some methods for classfication and analysis of multivariate observations [conference sesión]. 5th Symposium of Mathematics, Statistics and Probability, Universtity of California Press, Berkeley. https://books.google.com.gt/books?id=IC4Ku_7dBFUC

Mark, J. V., Katherine, S. P. & Jennifer, B. (2002). A New Partitioning Around Medoids Algorithm. Journal of Statistical Computation and Simulation, 73(8), 575-584. https://www.tandfonline.com/doi/abs/10.1080/0094965031000136012

Martin, W. A. (1971). Sorting. ACM Computing Surveys, 3(4), 147–174. https://dl.acm.org/doi/10.1145/356593.356594

Mayer-Schönberger, V. & Cukier, K. (2013). Big Data: A Revolution That Will Transform How We Live, Work and Think. Publisher John Murray.

Merle, D., Hansen, P., Jaumard, B & Mladenovic, N. (2000). An interior point algorithm for minimum sum-of-squares clustering. SIAM J. SCI. Comput. Society for Industrial and Applied Mathematics, 21(4), 1485–1505. https://epubs.siam.org/doi/abs/10.1137/S1064827597328327?mobileUi=0

Minkowski, H. (1953). Geometrie der Zahlen. Chelsea.

Müllner, D. (2013). Fastcluster: Fast Hierarchical, Agglomerative Clustering Routines for R and Python. Journal of Statistical Software, 53(9), 1–18. https://doi.org/10.18637/jss.v053.i09

Muñoz, J. M. (2002). Introducción a la Teoría de Conjuntos (4a ed.). Universidad Nacional de Colombia.

Niijima, S., & Kuhara, S. (2005, December 19). Effective nearest neighbor methods for multiclass cancer classification using microarray data [conference session].16th International Conference on Genome Informatics, Pacifico Yokohama, Japan. http://giw.hgc.jp/giw2005/program.pdf https://www.researchgate.net/publication/239947005_A_Classification_Framework_Applied_to_Cancer_Gene_Expression_Profiles

Newmann, J. V. (1925). Eine Axiomatisierung der Mengenlehre. Journal fürdie reine und angewandte Mathematik, 154, 219–240. https://gdz.sub.uni-goettingen.de/id/PPN243919689_0154

Oubiña, L. (1974). Introducción a la Teoría de Conjuntos (7a ed.). Eudeba.

Park, H. S. & Jun, C. H. (2009). A simple and fast algorithm for K-medoids clustering. Expert Systems with Applications, 36(2), 3336-3341. https://dl.acm.org/doi/10.1016/j.eswa.2008.01.039

Pérez, M. A. (2007). Mejora al algoritmo de agrupamiento K-means mediante un nuevo criterio de convergencia y su aplicación a bases de datos poblacionales de cáncer. II Taller Latino Iberoamericano de Investigación de Operaciones.

Pinzón, A. (1975). Conjuntos y Estructuras. Harla.

Prisco, C. A. D. (1997). Una introducción a la teoría de conjuntos y los fundamentos de la matemática. Centro de Lógica, Epistemologia e História da Ciência, Universida de Estadual de Campinas, S. P.

Piza, E., Murillo, A. & Trejos, J. (1999). Nuevas técnicas de Particionamiento en clasificación automática. Revista de Matemática: Teoría y Aplicaciones, 6(1), 51–66. https://revistas.ucr.ac.cr/index.php/matematica/article/view/168

Rattigan, M. J., Maier, M. & Jensen, D. (2007, June 20). Graph clustering with network structure indice [conference session]. 24th international conference on Machine learning, Corvalis Oregon. https://dl.acm.org/doi/10.1145/1273496.1273595

Reese, J. (2006). Solution methods for the p-median problem: An annotated bibliography, Nerworks 48(3): 125–142. https://onlinelibrary.wiley.com/doi/10.1002/net.20128

Régnier, S. (1983). Sur quelques aspects mathématiques des problèmes de classification automatique, Mathématiques et sciences humaines, 82, 13-29. http://www.numdam.org/article/MSH_1983__82__13_0.pdf

ReVelle, C. S. and Swain, R. W. (1970). "Central Facilities Location," Geographical Analysis, 2(1), 30-42. https://onlinelibrary.wiley.com/doi/10.1111/j.1538-4632.1970.tb00142.x

Rincón, B. (2010). Diseño de zonas geométricamente compactas utilizando celdas cuadradas [tesis de doctorado, Universidad Nacional Autónoma de México]. Repositorio de Tesis DGBSDI. http://132.248.9.195/ptb2010/diciembre/0665196/Index.html

Robert, G., & Ross, I. (1993). The R Project for Statistical Computing. (version 3.5.1) [software]. R. https://www.r-project.org/

Roberts, S. J. (1997). Parametric and non-parametric unsupervised cluster analysis. Pattern Recognition, 30(2), 261-272. https://www.scirp.org/(S(351jmbntvnsjt1aadkposzje))/reference/ReferencesPapers.aspx?ReferenceID=1884877

Romero, D., Burguete, J., Martínez, L. E. & Velasco, J. R. (2006). Un enfoque de optimización combinatoria para la construcción de marcos de muestreo en hogares. Boletín de los Sistemas Nacionales Estadístico y de Información Geográfica, Instituto Nacional de Estadística, Geografía e Informática, 2(1), 44-51. https://www.inegi.org. mx/contenido/productos/prod_serv/contenidos/espanol/bvinegi/productos/integracion/especiales/BoletinSNEIG/2006/Bsneig3.pdf

Romero, M., González, R., Estrada, M., Martínez, J. L. & Bernábe, M. B. (2019). Solution Search for the Capacitated P-Median Problem using Tabu Search. International Journal of Combinatorial Optimization Problems and Informatics, 10(2), 17-25. https://www.ijcopi.org/ojs/article/view/118

Sebastiani, F. (2002). Machine learning in automated text categorization. ACM Computing Surveys, 34(1), 1-47. https://dl.acm.org/doi/10.1145/505282.505283

Shirabe, T. (2005). A Model of Contiguity for Spatial Unit Allocation. Geographical Analysis, 37(1), 2-16. https://onlinelibrary.wiley.com/doi/abs/10.1111/j.1538-4632.2005.00605.x

Skiena, S. (1990). Implementing Discrete Mathematics: Combinatorics and Graph Theory with Mathematica, Addison-Wesley.

Sloane, N. J. A. (2022). The on-line encyclopedia of integer sequences. OEIS Foundation Inc. https://oeis.org/A000110

Steven, R. (2008). Lattices and Ordered Sets. Springer.

Struyf, A., Hubert, M., & Rousseeuw, P. (1997). Clustering in an Object-Oriented Environment. Journal of Statistical Software, 1(4), 1–30. https://doi.org/10.18637/jss.v001.i04

Tan, P., Steinbach, M. & Kumar, V. (2005). Introduction to Data Mining. Addison-Wesley Longman Publishing Co., Inc.

Trejos, Z. J. (2009). Modelos de Clasificación Automática, Centro de Investigación en Matemática Pura y Aplicada (CIMPA). Universidad de Costa Rica.

Tryon, R. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards brother, Incorporated, lithoprinters and publishers.

Tsybakov, A. B. (2009). Introduction to nonparametric estimation. Springer Science+Business Media.

Varela, F. (2018). Un estudio computacional de diferentes técnicas de clustering. [tesis de maestria en técnicas estadísticas, Universidad de Santiago de Compostela]. Repositorio de Tesis http://eio.usc.es/pub/mte/descargas/ProyectosFinMaster/Proyecto_1354.pdfVarela, F. (2018). Un estudio computacional de diferentes técnicas de clustering. [tesis de maestría en técnicas estadísticas, Universidad de Santiago de Compostela]. Repositorio de Tesis http://eio.usc.es/pub/mte/descargas/ProyectosFinMaster/Proyecto_1354.pdf

Von-Luxburg, U., Williamson, R. C. & Guyon, I. (2011, July 2). Clustering: Science or Art? [conference session]. JMLR: Workshop on Unsupervised and Transfer Learning, Bellevue, Washington, USA http://proceedings.mlr.press/v27/luxburg12a/luxburg12a.pdf

Vicente, E., Rivera, L., & Mauricio, D. (2005). GRASP en la resolución del problema de clustering. Revista de Investigación de Sistemas e Informática, 2(2), 16–25. https://revistasinvestigacion.unmsm.edu.pe/index.php/sistem/article/view/3110

Villagra, A., Guzman, A., Pandolfi, D. & Leguizamon, G. (2009). Análisis de medidas nosupervisadas de calidad en clusters obtenidos por K-means y Particle Swarm Optimization. Revista Ciencia y Tecnología, edición especial CICA 2009, 1(1), 1-8. https://dspace.palermo.edu/ojs/index.php/cyt/article/view/782/684

Xu, R. & Wunsch, D. (2005). Survey of clustering algorithms. IEEE Transactions on neural networks, 16(3), 645-678. https://ieeexplore.ieee.org/document/1427769

Ward, J. H. (1963). Hierarchical Groupings to optimise an objective function. Journal of the American Statistical Association, 58(301), 236-244. https://www.tandfonline.com/doi/abs/10.1080/01621459.1963.10500845

Webb, A. R. (2003). Statistical pattern recognition. John Wiley & Sons.

Wolf, G. (2012). Foundations of location analysis. International Series in Operations Research & Management Science, 26(3), 577-578. https://www.tandfonline.com/doi/abs/10.1080/13658816.2011.631498?journalCode=tgis20

Yolis, E. (2003). Algoritmos genéticos aplicados a la categorización automática de documentos, Revista Eletrônica de Sistemas de Informação, 2(2). doi: 10.5329/RESI.

Zhang, Q., Couloigner, I. (2005, may 9). A New and Efficient K-Medoid Algorithm for Spatial Clustering [conference session], ICCSA Computational Science and Its Applications. https://doi.org/10.1007/11424857_20

Zoltners, A. & Sinha, P. (1983). Towards a unified territory alignment: A review and model. Management Science, 29(11) 1237-1256. https://pubsonline.informs.org/doi/abs/10.1287/mnsc.29.11.1237

Descargas

Publicado

junio 1, 2022

Colección

Licencia

Creative Commons License

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.

Detalles sobre esta monografía

ISBN-13 (15)

978-607-8759-31-6