Logo
Uniopèdia
Comunicació
Disponible a Google Play
Nou! Descarregar Uniopèdia al dispositiu Android™!
Instal·la
Accés més ràpid que el navegador!
 

Clusterització de dades

Índex Clusterització de dades

La clusterització de dades és una tècnica molt comuna en l'anàlisi estadística de dades.

34 les relacions: Algorisme, Algorisme de maximització d'expectativa, Algorisme k-means, Anàlisi de components principals, Aprenentatge automàtic, Aprenentatge no supervisat, Índex de Jaccard, Camí (teoria de grafs), Classificació, Clúster, Correlació, Dendrograma, Diagrama de Voronoi, Distribució de probabilitat, Distribució normal, Distribució normal multivariable, Estadística, Estàndard d'or (prova), Estimació de la densitat del nucli, Falsos positius i falsos negatius, Graf (matemàtiques), Graf cicle, Mapa autoorganitzat, Matriu de confusió, Mètrica (matemàtiques), Mean-Shift, NP (Complexitat), Observació atípica, Precisió i reclam, Signe (matemàtiques), Sobreajustament (overfitting), Teoria de la informació, UPGMA, Xarxa neuronal.

Algorisme

nombres primers Un algorisme (o, alternativament, algoritme) és un conjunt finit d'instruccions o passos que serveixen per a executar una tasca o resoldre un problema.

Nou!!: Clusterització de dades і Algorisme · Veure més »

Algorisme de maximització d'expectativa

Agrupació EM de dades d'erupció Old Faithful. El model inicial aleatori (que, a causa de les diferents escales dels eixos, sembla ser dues el·lipses molt planes i amples) s'ajusta a les dades observades. En les primeres iteracions, el model canvia substancialment, però després convergeix als dos modes del guèiser. Visualitzat amb ELKI. En estadístiques, un algorisme de maximització d'expectativa (EM) és un mètode iteratiu per trobar estimacions de màxima probabilitat (local) o màxim a posteriori (MAP) de paràmetres en models estadístics, on el model depèn de variables latents no observades.

Nou!!: Clusterització de dades і Algorisme de maximització d'expectativa · Veure més »

Algorisme k-means

Lalgorisme K-means és un mètode d'agrupament que té com a objectiu la partició d'un conjunt n observacions en k grups en el qual cada observació pertany al grup més proper a la mitjana.

Nou!!: Clusterització de dades і Algorisme k-means · Veure més »

Anàlisi de components principals

eix cartesià. En la imatge els punts s'han representat formant agrupacions d'elements diferenciats per la seva forma i color. Lanàlisi de components principals (ACP, PCA en anglès), en estadística, és una tècnica utilitzada per reduir la dimensionalitat d'un conjunt de dades per a poder-les representar gràficament en gràfics de dues o tres dimensions agrupant diverses variables de les dades en factors, o components, compostos per l'agrupació de diverses variables.

Nou!!: Clusterització de dades і Anàlisi de components principals · Veure més »

Aprenentatge automàtic

Laprenentatge automàtic ("machine learning" en anglès) és un camp de la intel·ligència artificial que està dedicat al disseny, l'anàlisi i el desenvolupament d'algorismes i tècniques que permeten que les màquines evolucionin.

Nou!!: Clusterització de dades і Aprenentatge automàtic · Veure més »

Aprenentatge no supervisat

Representació d'un algoritme d'agrupació (no supervisat) L'aprenentatge no supervisat (unsupervised learning, en anglès) és un camp de l'aprenentatge automàtic format per algoritmes que aprenen patrons a partir de dades no etiquetades.

Nou!!: Clusterització de dades і Aprenentatge no supervisat · Veure més »

Índex de Jaccard

L'índex de Jaccard és una mesura de semblança entre dues particions d'objectes (per exemple, entre les categories resultants d'aplicar dos métodes de categorització).

Nou!!: Clusterització de dades і Índex de Jaccard · Veure més »

Camí (teoria de grafs)

negre gruixut) En teoria de grafs, un camí o ruta és una seqüència de vèrtexs dins d'un graf tal que hi ha una aresta entre cada vèrtex i el següent.

Nou!!: Clusterització de dades і Camí (teoria de grafs) · Veure més »

Classificació

Una classificació és la determinació d'una categoria d'entre un conjunt finit de categories establertes per a un objecte o concepte.

Nou!!: Clusterització de dades і Classificació · Veure més »

Clúster

El concepte clúster en informàtica és utilitzat per definir diversos tipus d'associacions de computadors força diferenciades entre elles.

Nou!!: Clusterització de dades і Clúster · Veure més »

Correlació

La correlació estadística és una mesura estadística que indica la força i la direcció d'una relació lineal entre dues variables aleatòries.

Nou!!: Clusterització de dades і Correlació · Veure més »

Dendrograma

Un dendrograma (del grec dendron 'arbre', -gramma 'dibuix') és un tipus d'il·lustració gràfica o diagrama de dades en forma d'arbre que organitza les dades en subcategories que es van dividint en unes altres fins a arribar al nivell de detall desitjat (assemblant-se a les branques d'un arbre que es van dividint en unes altres successivament).

Nou!!: Clusterització de dades і Dendrograma · Veure més »

Diagrama de Voronoi

435x435px Diagrames de Voronoi. Els diagrames de Voronoi, que duen el nom del matemàtic Georgy Voronoi, són una construcció geomètrica que permet fer una partició del pla euclidià.

Nou!!: Clusterització de dades і Diagrama de Voronoi · Veure més »

Distribució de probabilitat

Carl Friedrich Gauss (1777–1855). Percentatges de probabilitat a la distribució normal. En probabilitats i estadística les expressions distribució de probabilitat o llei de probabilitat tenen diversos sentits: per nombrosos autors, són sinònimes de Probabilitat, però molts altres autors les reserven per a les probabilitats a \mathbb^n, n\ge 1.

Nou!!: Clusterització de dades і Distribució de probabilitat · Veure més »

Distribució normal

La distribució normal, també coneguda com a distribució gaussiana, és una important família de distribucions de probabilitat contínues i és aplicable a molts camps.

Nou!!: Clusterització de dades і Distribució normal · Veure més »

Distribució normal multivariable

En teoria de probabilitat i estadística, la distribució normal multivariable o multidimensional o distribució gaussiana multivariable o multidimensional és una generalització de la distribució normal unidimensional (univariable) en dimensions superiors.

Nou!!: Clusterització de dades і Distribució normal multivariable · Veure més »

Estadística

lang.

Nou!!: Clusterització de dades і Estadística · Veure més »

Estàndard d'or (prova)

En medicina (i menys en estadística) s'anomena estàndard d'or o prova de referència a la millor prova de diagnòstic disponible en condicions raonables.

Nou!!: Clusterització de dades і Estàndard d'or (prova) · Veure més »

Estimació de la densitat del nucli

distribuïts normalment utilitzant diferents amplades de banda de suavització. En estadística, l'estimació de la densitat del nucli (amb acrònim anglès KDE) és l'aplicació de suavització del nucli per a l'estimació de la densitat de probabilitat, és a dir, un mètode no paramètric per estimar la funció de densitat de probabilitat d'una variable aleatòria basada en nuclis com a pesos.

Nou!!: Clusterització de dades і Estimació de la densitat del nucli · Veure més »

Falsos positius i falsos negatius

En les proves mèdiques i, més generalment, en la classificació binària (del sí o no), on un fals positiu és un error en què el resultat de la prova indica indegudament la presència d'una condició, com una malaltia (un resultat positiu), quan en realitat no hi és present; mentre que un fals negatiu és un error en què un resultat de prova no indica, indegudament, la presència d'una condició (el resultat és negatiu), quan en realitat hi és present.

Nou!!: Clusterització de dades і Falsos positius i falsos negatius · Veure més »

Graf (matemàtiques)

Representació d'un graf etiquetat, amb 6 vèrtexs i set arestes En teoria de grafs, un graf és una representació abstracta d'un conjunt d'objectes on alguns parells dels objectes estan connectats per enllaços.

Nou!!: Clusterització de dades і Graf (matemàtiques) · Veure més »

Graf cicle

Un graf cicle de longitud 6 En teoria de grafs, un graf cicle o graf cíclic és un graf que consisteix d'un conjunt de vèrtexs connectats mitjançant una cadena tancada.

Nou!!: Clusterització de dades і Graf cicle · Veure més »

Mapa autoorganitzat

Synapse. Un mapa autoorganitzat (SOM) o un mapa de característiques autoorganitzats (SOFM) és una tècnica d'aprenentatge automàtic no supervisat que s'utilitza per produir una representació de dimensions baixes (normalment bidimensional) d'un conjunt de dades de dimensions superiors mentre es preserva l'estructura topològica del dades.

Nou!!: Clusterització de dades і Mapa autoorganitzat · Veure més »

Matriu de confusió

En el camp de la intel·ligència artificial una matriu de confusió és una eina de visualització que s'utilitza sobretot en l'aprenentatge supervisat.

Nou!!: Clusterització de dades і Matriu de confusió · Veure més »

Mètrica (matemàtiques)

longitud (12) per a la mateixa ruta. En la mètrica euclidiana, el camí verd té una longitud de 6 \sqrt2 \approx 8,49, i és l'únic camí mínim. En matemàtiques, una mètrica o funció distància és una funció que defineix una distància entre cada parell d'elements d'un conjunt.

Nou!!: Clusterització de dades і Mètrica (matemàtiques) · Veure més »

Mean-Shift

Mean Shift és un potent i versàtil algorisme no paramètric iteratiu que es pot utilitzar per a molts propòsits com trobar modes, clustering, etc.

Nou!!: Clusterització de dades і Mean-Shift · Veure més »

NP (Complexitat)

En complexitat computacional, NP és la classe de complexitat que conté els problemes de decisió que es poden resoldre amb una màquina de Turing no determinista usant una quantitat de temps de computació polinòmic, temps polinòmic.

Nou!!: Clusterització de dades і NP (Complexitat) · Veure més »

Observació atípica

En estadística, una observació atípica o dada atípica o és un valor que difereix tan àmpliament de la resta de dades que podem pensar que s'ha comès un error.

Nou!!: Clusterització de dades і Observació atípica · Veure més »

Precisió i reclam

Precisió i reclam En reconeixement de patrons, recuperació d'informació i classificació (aprenentatge automàtic), la precisió és la fracció de casos veritablement positius entre els casos seleccionats com a positius.

Nou!!: Clusterització de dades і Precisió i reclam · Veure més »

Signe (matemàtiques)

El signe és el que defineix la propietat de ser, en principi un nombre, a les matemàtiques, positiu o negatiu.

Nou!!: Clusterització de dades і Signe (matemàtiques) · Veure més »

Sobreajustament (overfitting)

L'ús de la línia verda com a classificador s'adapta millor a les dades amb els quals hem entrenat al classificador, però està massa adaptada a ells, de manera que davant de noves dades probablement donarà més errors que la classificació usant la línia negra. xarxa neuronal). L'error d'entrenament es mostra en blau, mentre que l'error de validació es mostra en vermell. Si l'error de validació s'incrementa mentre que el d'entrenament decreix pot ser que s'estigui produint una situació d'overfitting. En l'aprenentatge automàtic, el sobreajustament (en anglès: overfitting) és l'efecte de sobreentrenar un algorisme d'aprenentatge amb unes certes dades pels quals es coneix el resultat desitjat.

Nou!!: Clusterització de dades і Sobreajustament (overfitting) · Veure més »

Teoria de la informació

La teoria de la informació estudia la quantificació, l'emmagatzamatge i la comunicació de la informació.

Nou!!: Clusterització de dades і Teoria de la informació · Veure més »

UPGMA

UPGMA (Unweighted Pair Group Method with Arithmetic mean) és el nom en anglès d'un algorisme d'agrupament jeràrquic (clustering).

Nou!!: Clusterització de dades і UPGMA · Veure més »

Xarxa neuronal

xarxa neuronal artificial avançada Una xarxa neuronal és una xarxa o circuit de neurones, o en un sentit modern, una xarxa neuronal artificial, composta de neurones o nodes artificials.

Nou!!: Clusterització de dades і Xarxa neuronal · Veure més »

SortintEntrant
Hey! Estem a Facebook ara! »