Logo
Uniopèdia
Comunicació
Disponible a Google Play
Nou! Descarregar Uniopèdia al dispositiu Android™!
Instal·la
Accés més ràpid que el navegador!
 

Aranya web

Índex Aranya web

Funcionament d'una aranya web Una aranya web o robot web (web crawler en anglès) és un programari que inspecciona pàgines Web de forma metòdica i automatitzada.

27 les relacions: Aprenentatge automàtic, Aranya (desambiguació), Archive.today, Bot (Internet), Cerca en profunditat, Cercador d'escriptori, Cercadors de vídeos, Common Crawl, Cronologia de la intel·ligència artificial, Element d'enllaç canònica, HTTP 451, International Internet Preservation Consortium, Larry Page, Linguee, Mojeek, Motor de cerca, Nutch, Optimització per a motors de cerca, Optimització publicitària, Protocol d'exclusió de robots, Robot de correu brossa, Schema.org, Tecnologies web, Test de CAPTCHA, Web archiving, Web semàntic, 12ft.

Aprenentatge automàtic

Laprenentatge automàtic ("machine learning" en anglès) és un camp de la intel·ligència artificial que està dedicat al disseny, l'anàlisi i el desenvolupament d'algorismes i tècniques que permeten que les màquines evolucionin.

Nou!!: Aranya web і Aprenentatge automàtic · Veure més »

Aranya (desambiguació)

* Zoologia;.

Nou!!: Aranya web і Aranya (desambiguació) · Veure més »

Archive.today

archive.today (abans archive.is) és un lloc web que emmagatzema instantànies de pàgines web.

Nou!!: Aranya web і Archive.today · Veure més »

Bot (Internet)

Un bot (abreviatura de robot) és un programa informàtic que efectua automàticament tasques repetitives a través d'Internet. Normalment, aquests bots executen tasques simples i estructuralment repetitives, que serien impossibles de realitzar per una sola persona. L'ús majoritari dels bots és en el que s'anomena rastrejament web, en el qual un script automàtic capta, analitza i arxiva informació d'un servidor web a diverses vegades la velocitat que ho faria una persona. Cada servidor pot tenir un fitxer anomenat robots.txt, contenint regles per al rastrejament d'aquell servidor. També, els bots poden ser implementats per a tasques que requereixin una resposta més ràpida que la que podria oferir un humà (p.

Nou!!: Aranya web і Bot (Internet) · Veure més »

Cerca en profunditat

Una cerca en profunditat (en anglès Depth First Search, DFS) és un algorisme que permet recórrer tots els nodes d'un arbre o graf de manera ordenada, però no uniforme.

Nou!!: Aranya web і Cerca en profunditat · Veure més »

Cercador d'escriptori

Un cercador d'escriptori és una eina informàtica que busca documents dins d'un ordinador personal (en comptes de fer-ho a Internet) com per exemple l'historial de navegació web, arxius de correu electrònic, documents de text, arxius de so, d'imatges o de vídeo.

Nou!!: Aranya web і Cercador d'escriptori · Veure més »

Cercadors de vídeos

Els cercadors de vídeos són programes informàtics dissenyats per trobar vídeos emmagatzemats en dispositius digitals, ja sigui en servidors a través d'Internet o en unitats de memòria d'un mateix equip informàtic.

Nou!!: Aranya web і Cercadors de vídeos · Veure més »

Common Crawl

Common Crawl és una organització sense ànim de lucre 501(c)(3) que rastreja el web i proporciona lliurement els seus arxius i conjunts de dades al públic.

Nou!!: Aranya web і Common Crawl · Veure més »

Cronologia de la intel·ligència artificial

Esquematització del prompting en IA Aquesta és una cronologia de la intel·ligència artificial, de vegades anomenada alternativament intel·ligència sintètica, amb la seva evolució al llarg dels segles.

Nou!!: Aranya web і Cronologia de la intel·ligència artificial · Veure més »

Element d'enllaç canònica

Un Element d'enllaç canònica és un element HTML que ajuda als programadors de web a evitar contingut duplicat tot especificant la "canònica", o "preferida", versió de la pàgina web com a part de l'optimització per a motors de cerca.

Nou!!: Aranya web і Element d'enllaç canònica · Veure més »

HTTP 451

Codi d'estat HTTP 451 retornat per la pàgina web Defense Distributed a un client a Pennsilvània, 30 de juliol de 2018. Dins les xarxes informàtiques HTTP 451 No disponible per raons legals és un codi d'estat del protocol HTTP que indica que l'usuari demana accedir a un recurs que no pot ser servit per raons legals, com una pàgina web censurada per un govern.

Nou!!: Aranya web і HTTP 451 · Veure més »

International Internet Preservation Consortium

L'International Internet Preservation Consortium (Consorci Internacional per a la Preservació d'Internet) és una organització internacional formada per biblioteques nacionals i universitàries, arxius, museus i institucions de patrimoni cultural i de recerca d'arreu del món, dedicada a promoure la col·laboració internacional per tal de preservar el coneixement i la informació continguda a Internet i fer-la accessible a les futures generacions, fomentant el desenvolupament i ús d'eines, tècniques i estàndards comuns que permetin la creació d'arxius internacionals i recolzant a les biblioteques nacionals dels diferents països per afrontar l'arxivament web i llur preservació.

Nou!!: Aranya web і International Internet Preservation Consortium · Veure més »

Larry Page

Lawrence Edward "Larry" Page, (nascut el 26 de març de 1973 a Lansing, Michigan, Estats Units) és el cofundador de l'empresa Google Inc.

Nou!!: Aranya web і Larry Page · Veure més »

Linguee

Linguee és un servei web que proporciona un diccionari bilingüe en línia.

Nou!!: Aranya web і Linguee · Veure més »

Mojeek

Mojeek és un motor de cerca amb seu al Regne Unit basat en rastrejadors que proporciona resultats de cerca independents utilitzant el seu propi índex de pàgines web, creat mitjançant l'aranya web, en lloc d'utilitzar resultats d'altres motors de cerca.

Nou!!: Aranya web і Mojeek · Veure més »

Motor de cerca

Un motor de cerca o de recerca o bé cercador és un programa informàtic dissenyat per ajudar a trobar informació emmagatzemada en un sistema informàtic com ara una xarxa, Internet, un servidor o un ordinador personal.

Nou!!: Aranya web і Motor de cerca · Veure més »

Nutch

Nutch és un programari de motor de cerca construït sota la filosofia de codi obert, altament extensible i escalable.

Nou!!: Aranya web і Nutch · Veure més »

Optimització per a motors de cerca

L'optimització per a motors de cerca o posicionament a cercadors (en anglès search engine optimization, SEO) http://moz.com/ugc/21offpage-seo-strategies-to-build-your-online-reputation és un procés que té per objectiu augmentar la visibilitat d'un lloc web als motors de cerca, incrementant-ne la posició a la pàgina de resultats.

Nou!!: Aranya web і Optimització per a motors de cerca · Veure més »

Optimització publicitària

En màrqueting per Internet, l'optimització publicitària és un mètode que consisteix en l'emplaçament d'anuncis en línia en pàgines web que mostren resultats a les consultes al motor de cerca.

Nou!!: Aranya web і Optimització publicitària · Veure més »

Protocol d'exclusió de robots

L'estàndard d'exclusió de robots, també conegut com a protocol d'exclusió de robots o simplement protocol robots.txt, és una convenció per a evitar que les aranyes web que el compleixin accedeixin a la totalitat o part d'un contingut, però que alhora és públic.

Nou!!: Aranya web і Protocol d'exclusió de robots · Veure més »

Robot de correu brossa

CAPTCHA contra la creació de comptes per part dels robots Un robot de correu brossa (en anglès: Spambot) és un programa informàtic dissenyat per facilitar l'enviament de correu brossa.

Nou!!: Aranya web і Robot de correu brossa · Veure més »

Schema.org

Schema.org és una iniciativa llançada el 2 de juny de 2011 per Bing, Google i Yahoo! (aleshores els operadors dels motors de cerca més grans del món) per "crear i donar suport a un conjunt comú d'esquemes per a dades estructurades de marcatge a les pàgines web".

Nou!!: Aranya web і Schema.org · Veure més »

Tecnologies web

Les tecnologies web són un conjunt de protocols i especificacions que són utilitzades per la World Wide Web (generalment abreujada com a Web o www) al mateix temps que la componen.

Nou!!: Aranya web і Tecnologies web · Veure més »

Test de CAPTCHA

Aquest és un típic test per a la seqüència «smwm» que dificulta el reconeixement de les màquines tot girant les lletres i afegint-hi un gradient de fons. Captcha és l'acrònim de «Completely Automated Public Turing test to tell Computers and Humans Apart» (en anglès, "test de Turing públic i automàtic per a diferenciar a màquines d'humans").

Nou!!: Aranya web і Test de CAPTCHA · Veure més »

Web archiving

Web archiving és el procés de recollir parts del World Wide Web per assegurar la preservació de la informació en un arxiu per a futurs investigadors, historiadors i públic general.

Nou!!: Aranya web і Web archiving · Veure més »

Web semàntic

El Web semàntic és un projecte que té com a objectiu crear un medi universal per a l'intercanvi d'informació significativa (semàntica), d'una forma comprensible per a les màquines, del contingut dels documents de la Web.

Nou!!: Aranya web і Web semàntic · Veure més »

12ft

12ft és un servei per accedir a webs que bloquegen la lectura pública, lliure i gratuïta de pàgines web amb eines com murs de pagament.

Nou!!: Aranya web і 12ft · Veure més »

Redirigeix aquí:

Rastreig web, Robot web, Web crawler.

SortintEntrant
Hey! Estem a Facebook ara! »