Taula de continguts
11 les relacions: Apache Cassandra, Apache Hive, Apache Mahout, Apache Pig, Apache Spark, CouchDB, Jeff Dean, Llac de dades, Nutch, Paral·lelisme de Dades, Tecnologies web.
Apache Cassandra
Helenos és una interfície d'usuari gràfica per a Cassandra Apache Cassandra és un sistema d'administració de bases de dades distribuïdes de codi obert dissenyat per manipular grans quantitats de dades en diversos servidors, oferint una alta disponibilitat sense un únic punt de fallada.
Veure MapReduce і Apache Cassandra
Apache Hive
Apache Hive és un projecte de programari d'emmagatzematge, agrupament, gestió i anàlisi de dades construït sobre Apache Hadoop.
Veure MapReduce і Apache Hive
Apache Mahout
Apache Mahout és un projecte de software de Apache Software Foundation que permet la creació gratuïta d’aplicacions de Machine learning a través de la implementació d’algoritmes d’aprenentatge computacional distribuïts i escalables.
Veure MapReduce і Apache Mahout
Apache Pig
Apache Pig és una plataforma d'alt nivell per crear programes que s'executen a Apache Hadoop.
Veure MapReduce і Apache Pig
Apache Spark
Fig. 1 Estructura interna de l'Apache Spark Apache Spark és una plataforma de codi obert orientat a l'analítica i processat de dades massives.
Veure MapReduce і Apache Spark
CouchDB
Apache CouchDB, o simplement CouchDB, és un sistema de gestió de base de dades orientat a documents, escrit majoritàriament en llenguatge Erlang i distribuït sota la llicència Apache.
Veure MapReduce і CouchDB
Jeff Dean
Jeffrey Adgate "Jeff" Dean (nascut el 23 de juliol de 1968) és un informàtic i enginyer de programari nord-americà.
Veure MapReduce і Jeff Dean
Llac de dades
Un llac de dades (data lake en anglès) és un sistema o dipòsit de dades emmagatzemades en el seu format natural / en brut, normalment objectes binaris o fitxers.
Veure MapReduce і Llac de dades
Nutch
Nutch és un programari de motor de cerca construït sota la filosofia de codi obert, altament extensible i escalable.
Veure MapReduce і Nutch
Paral·lelisme de Dades
Divisió d'un conjunt de dades en petits subconjunts per tractar-los en paral·lel El paral·lelisme de dades és un mètode de paral·lelització el qual en lloc de dependre del procés o de la concurrència de la tasca, està relacionat tant amb el flux com amb l'estructura de la informació.
Veure MapReduce і Paral·lelisme de Dades
Tecnologies web
Les tecnologies web són un conjunt de protocols i especificacions que són utilitzades per la World Wide Web (generalment abreujada com a Web o www) al mateix temps que la componen.