CLUSTERING:DATA SCIENCE
CLUSTERING:DATA SCIENCE
Los Clustering son algoritmos agrupan automáticamente ( y sin supervisión ), a un grupos de elementos en "Clusters".
El objetivo del algoritmo de Clustering es que cada cluster seas internamente coherente (mismas carateristicas) pero distinto a los demás clusters.
Aplicación del Clustering:
- Segmentación de Mercado
- Redes Sociales
- Organizar Cluster de Computadoras
- Entender información astronómica: ejemplo formación de galaxias
Por otro lado los insight (características, visión) obtenidas se puede utilizar para aprendizaje supervisado.
Los algoritmos de clustering mas importantes son:
1) Cluster Jerarquico: Es el algoritmo de clustering mas simple,genera soluciones muy buenas, genera descomposición jerárquica de puntos, también usada en Análisis de Exploración de datos (dendogramas).
Pero su desventaja es su eficiencia y su escalabilidad en volúmenes muy grandes.
2) K-means: Es uno de los algoritmos de clustering mas importantes y probablemente el mas conocido.Problemas es necesario estimar o conocer la cantidad de cluster,tiende a generar cluster esféricos y de similar tamaño.
3) DBSCAN: Density Based Spatial Clustering of applications with noise,concepto distinto de clusted-grupo denso, permite tener puntos que no son parte de algún cluster (noise, ruido).Tenemos dos hiper-parametros, k, e, donde un punto esta en una región mas densa, si hay k puntos con distancia menor a e.(incluye el punto).
Problema , bastante sensible a los parámetros, es difícil de estimar e,como densidad se define a prior , entonces no maneja cluster con distintas densidades,como es plano no puede encontrar cluster mas pequeños dentro d euno grande.
4) HDBSCAN: Basado en DBSCAN Y cluster jerárquico, soluciones el problema de cluster de distintas densidades,
Los algoritmos de clustering mas importantes son:
- Cluster Jerarquico
- k-means
- Clustering espectral
- HDBSCAN y DBSCAN
1) Cluster Jerarquico: Es el algoritmo de clustering mas simple,genera soluciones muy buenas, genera descomposición jerárquica de puntos, también usada en Análisis de Exploración de datos (dendogramas).
Pero su desventaja es su eficiencia y su escalabilidad en volúmenes muy grandes.
2) K-means: Es uno de los algoritmos de clustering mas importantes y probablemente el mas conocido.Problemas es necesario estimar o conocer la cantidad de cluster,tiende a generar cluster esféricos y de similar tamaño.
3) DBSCAN: Density Based Spatial Clustering of applications with noise,concepto distinto de clusted-grupo denso, permite tener puntos que no son parte de algún cluster (noise, ruido).Tenemos dos hiper-parametros, k, e, donde un punto esta en una región mas densa, si hay k puntos con distancia menor a e.(incluye el punto).
Problema , bastante sensible a los parámetros, es difícil de estimar e,como densidad se define a prior , entonces no maneja cluster con distintas densidades,como es plano no puede encontrar cluster mas pequeños dentro d euno grande.
4) HDBSCAN: Basado en DBSCAN Y cluster jerárquico, soluciones el problema de cluster de distintas densidades,
Publicado por : Yuscu Meco
y esto como afecta a la verduleria
ResponderBorrarEn teoría nos permitiría cosas como agrupar el contenido de una forma mucho inteligente y así poder adivinar con mas exactitud lo que el usuario quiere ver.
Borrarel sticky
BorrarEn teoría nos permitiría cosas como agrupar el contenido de una forma mucho inteligente y así poder adivinar con mas exactitud las verduras que quiere el cliente.
BorrarDonde esta el
ResponderBorrarEl resumen nivel 10 ?
Es para analizar un muestra de puntos en un espacio y determinar con exactitud sí existen aglomeraciones en los mismos, osea busca patrones de coincidencia básicamente.
Borrarel sticky
BorrarEste blog ha sido eliminado por un administrador de blog.
Borrarel doc especificando "el post no es mio asi que no me empiezen a putear" grin
ResponderBorrarMe leyó la mente jeje.
Borrarel sticky
Borrarasí que me seguis borrando los comentarios? te voy a re domar este blog pedorro gordo down asi como te dome la pagina varias veces gordo pelotudo
ResponderBorrarmuy bonito todo eso y bla bla mas bien queremos saber si tendra medidas de seguridad contra los trolls que fastidian yuspe y su estupido razonamiento de "solo dale ban de 30 minutos para que razone" fue una de las causas de que todo se fue al carajo se tomaran medidas serias o de nuevo tendremos que fumarnos todo ese drama de los trolls como aqui en el blog
ResponderBorrarSí, parece que ya aprendió, esta bastante firme con eso últimamente, hasta me pidió que busque la forma de darles un ban permanente a los trolls de aquí.
Borrarpues esperemos que si , despues de tantas caidas por que al fin de cuentas el unico que sigue perdiendo es el
BorrarPor fin alguien que lo entiende!
BorrarPor algún motivo, todos hablan como sí el servidor se montara solo o algo así, como sí fuera copiar y pegar, yo también a veces monto servidores pero nunca monte uno mas potente que el que tenia 1peluchinga, no se como lo logro Yuscu y ademas como logro pagarlo.
pues si el unico que perdio en todo esto fue el yuspe hasta dinero que no se le reembolso de esos server pero pues bue a ver si aprender o se vuelve a hundir
Borrarel sticky
BorrarHaceme mod o te ganas un ataque de voxed, ultimo ultimo aviso
ResponderBorrarestos niños down que nomas vivien jodiendo
BorrarLos vamos a domarlos mas les vale que atiendan a nuestras demandas
Borrarel sticky
ResponderBorrarel pinochoo
BorrarPor que mejor no haces un articulo sobre progresismo, pegging, pañuelos verdades, la lucha de las pibas contra el patriarcado, cosas importantes.
ResponderBorrarEsta pagina debe ser lo mas progre posible.
Hablo el usuario mas amado de 1p todos quieranlo
BorrarEso lo podes hacer en toronja, para eso sí sirve jeje.
Borrarel sticky
BorrarNick rivera vos sabes programar aplicaciones de windows ? Estaria bueno armarse un p2p para 1peluchinga no ?
ResponderBorrar