2. Ús avançat de cercadors convencionals per obtenir informació
2.1 Com cercar a Internet
Aquest material vol donar-te eines i capacitats per fer bones cerques a Internet. Cercar a Internet vol dir fer-ho en àmbits tan diversos com simples dades (que poden ser estructurades en bases de dades o no) o en informació contextualitzada i elaborada, sobretot si busques en webs o en xarxes. En qualsevol cas, convé que no et perdis en la recerca ni sucumbeixis a les crides d’atenció distractores que la xarxa et fa de manera intel·ligent sempre que t'hi emergeixes.
El miratge de la bombolla de filtres
Abans d'endinsar-nos en el mètode per cercar informació a Internet, cal que tinguis present una distorsió que t'afectarà. La major part dels grans serveis d’Internet d’ús massiu com els cercadors o les grans xarxes socials mostren la informació adaptada a les “necessitats” dels usuaris d’acord amb les dades que han recollit d’ells mateixos. És a dir, una cerca a Google o dins d'una xarxa social, a priori no donarà el mateix resultat si la fas tu o si la fa la persona que tens a la taula més propera, ja que hi influiran les cerques i les decisions que tu mateix o aquesta persona heu adoptat amb anterioritat. És el que Eli Pariser va batejar com a “bombolla de filtres” i que molts anomenen "sitges". La bombolla de filtres pot portar a l’autoengany amb molta facilitat.
Eli Pariser. El filtro burbuja. Taurus. 2017 (2011)
La bombolla de filtres no és necessàriament negativa. Per exemple, si sempre fas cerques semblants i acabes anant a parar a les mateixes pàgines i és això el que vols, t'ajudarà a ser eficient. Però si vols fer una cerca començant des de zero i sense condicionants previs, et pot arribar a enganyar i a fer perdre eficàcia.
Idealment, per sortir de la bombolla de filtres, hauries de ser un usuari verge, que entra a Internet per primera vegada. Això és impossible si estàs llegint aquest text, però sí que pots adoptar algunes mesures (valorant, prèviament, si et convé adoptar-les). Per exemple:
- combinar diverses eines de cerca
- instal·lar un navegador nou i usar-lo per a la cerca
- esborrar les galetes del teu navegador
- combinar diversos dispositius des dels quals fas la cerca
- vetllar per fer la cerca des de fora de l'usuari del cercador (cosa que no sempre tenim present, ja que en el cas de Google, sovint fem servir altres serveis que ens fan estar-hi contínuament connectats).
Michiko Katukani. La muerte de la verdad. Rústica Ensayo. 2019
Renée DiResta, "Social Network Algorithms Are Distorting Reality By Boosting Conspiracy Theories”, FastCompany 2016
Entendre bé les característiques de l’encàrrec
Anem a cercar. Com a pas previ, és molt important que qui et fa l’encàrrec de cerca et defineixi bé l’objectiu i caldrà que li facis totes les preguntes necessàries perquè quedin definits els límits d’allò que se t'encarrega (temporals, conceptuals, etc.). Hauràs de fer preguntes del tipus:
- Què és exactament el que se'm demana?
- Des de quina data fins a quina data he de cercar?
- Quin grau d’aprofundiment ha de tenir la informació?
- Només notícies? També el que diu la gent? Només el parer dels polítics? Només…? També…?
- Quin abast geogràfic ha de tenir la cerca? Només Barcelona? Només Catalunya? Només…? També…?
Ha de quedar clar si has de cercar només una informació molt concreta (per exemple, els estatuts d’una entitat) o el màxim d’informació rellevant sobre un tema (per exemple, tot el que se sàpiga sobre un determinat incendi en un pis per motius energètics), ja que la manera d’abordar la cerca serà totalment diferent.
Definició del tema i l'àmbit de cerca
La conversa d’aclariments previs t'ha de permetre definir ben clarament el tema, sobretot per aconseguir acotar la cerca. És bo que en coneguis els límits, tant conceptuals com temporals o geogràfics. Sense una descripció clara del tema, difícilment aconseguiràs fer una cerca precisa. Els límits, d’altra banda, et permetran explotar al màxim les possibilitats de filtratge que tenen els formularis de cerca avançada.
Si la conversa prèvia t'ha permès de delimitar clarament els objectius, estaràs en condicions de definir l’àmbit de cerca, és a dir, les fonts d’informació que et miraràs i les que no caldrà mirar. Trobaràs una classificació de fonts d’informació a Internet més endavant.
Si has de recollir informació que fa referència a una qüestió d’actualitat que s’ha escampat pels mitjans, hauràs de cenyir-la als mitjans i aquelles plataformes en què la gent comparteix les informacions. En canvi, si és una informació que té implicacions administratives, potser et caldrà recórrer a algun set de dades obertes de l'Administració. Si, a més, té un component sociològic o demogràfic, hauràs d’ampliar l’àmbit a les dades i els estudis dels grans organismes estadístics o, si escau, a bases de dades del món acadèmic. Més avall trobaras tipologies de fonts que et permetran reflexionar sobre quines són les que et convenen més.
Elecció de les paraules o expressions de cerca
Com que el nostre principal instrument de treball seran els cercadors (siguin els genèrics d’Internet, siguin de caràcter temàtic o especialitzat, siguin els que van associats a bases de dades) hauràs de tenir clar quines paraules clau o expressions de cerca utilitzaràs. Per exemple, si fas cerques al voltant de pluja hauràs de tenir clar si el que busques és un concepte únic com pluja de fang o el sumatori de pluja + fang i que de vegades t'interessarà excloure algun element, per exemple buscar pluja però no pluja àcida o bé casos de tries alternatives (una altra), per exemple pluja o pedregada (i tenir totes les cerques de pluja i totes les de pedregada).
Triar les paraules adequades t'ajudarà a obtenir una resposta òptima, però també t'estalviarà molt de temps perdut descartant innombrables enllaços o documents que per algun motiu la teva tria evoca i que no necessites per a res.
Caldrà que decideixis quina és la paraula més útil i més concreta en cada cas. Si fas servir paraules que tenen molts significats, però hi ha un sinònim més específic, potser et sortirà més a compte triar el sinònim. Tot i això, caldrà valorar-ho, ja que aquesta mateixa decisió et podria portar a confusió.
Elecció de les eines de cerca i la modalitat
Decideix les eines de cerca més útils segons l’àmbit (que hem descrit com les fonts on vols buscar) i les paraules de cerca escollides. Normalment aquestes eines són
- cercadors (com ara Google)
- directoris, que mostren la informació estructurada (com ara DMOZ)
- cercadors o directoris especialitzats (com ara Dialnet)
- sets de dades (com ara Dades obertes Gencat)
També en aquest punt hauràs de decidir, en el cas dels cercadors que tenen cerca ordinària i cerca avançada, quina és la que et convé més. Si en la definició has marcat una delimitació temporal, segurament et caldrà una cerca avançada en aquells cercadors que permeten definir dates. Si tens una combinació complexa de paraules (paraules que sí que vols que surtin o que surtin plegades, paraules que no han de sortir, etc.), segurament també et caldrà fer una cerca avançada o bé optar per operadors de cerca, que exposarem més endavant.
Has de tenir present, així mateix, que disposem també dels xatbots basats en intel·ligències artificials generatives, capaços de produir continguts elaborats a partir d'una determinada cerca, interrogant-los en llenguatge natural (és a dir, tal com parlem habitualment o escrivim). No són pròpiament cercadors, però sí que integren funcions de cerca i busquen informació a partir de la qual generen els textos. Per tant, són eines més avançades que els simples cercadors. En determinats casos, a més, els cercadors els integren a la seva interfície. L'exemple més desenvolupat en el moment de fer aquesta actualització és el de Bing, que integra ChatGPT a la seva interfície i el més semblant a un cercador per la claredat amb què mostra les fonts d'informació és Perplexity AI, que ens busca informació sobre un tema i la redacta assenyalant d'on treu cadascuna de les afirmacions que fa. Trobaràs aquests recursos explicats amb detall més avall.
Cerca
És el moment clau. Has de traslladar tota la reflexió que has fet a una o diverses accions concretes de cerca. Sovint serà una tasca repetitiva (dependrà del nombre de paraules o expressions de cerca diferents que hagis determinat). Ha de tenir present, així mateix, que cada eina de cerca t'oferirà els resultats de manera diferent. En aquest punt i tenint en compte el problema que suposa la bombolla de filtres, has de ser acurat de no caure en paranys com els següents:
- Mirar només la primera pàgina (pot ser que sigui la més afectada per la teva bombolla de filtres)
- Repetir una cerca que ja has fet moltes vegades abans sense netejar les galetes de l’ordinador (les cerques que has fet amb anterioritat i els enllaços seleccionats poden condicionar la cerca actual)
- Deixar-te emportar pel suggeriment automàtic de cerca o per les informacions publicitàries que t'oferiran junt amb els resultats. Has de tenir sempre al cap les definicions que has establert.
- Deixar-te emportar, en definitiva, per hàbits de comportament que has adquirit fent cerques poc compromeses i que et poden induir a error si fas cerques més complexes o més delicades professionalment.
Val la pena que valoris si, per estalviar que la bombolla de filtres t'afecti (és a dir, que tot allò que has cercat amb anterioritat condicioni la cerca actual) potser et convé netejar el navegador, esborrant-ne les galetes. Però si, justament, allò que has de cercar ja ho has trobat totalment o parcialment en cerques fetes els dies anteriors, potser el que et convé és aprofitar-te de l'aprenentatge sobre els teus hàbits que han fet els cercadors. Una cosa tan òbvia com l'historial del navegador (que inclou un cercador propi) et pot permetre recuperar cerques òptimes realitzades amb anterioritat.
En l'apartat "Posem-nos a cercar", que trobaràs més avall, trobaràs tota la informació que necessites per ser ben productiu en aquest moment clau i saber totes les possibilitats que tens.
Calibratge dels resultats
Has d’analitzar els resultats obtinguts i sotmetre’ls a una mirada crítica. No tots són iguals. Per fer-ho, has de valorar aspectes com els següents:
- Fiabilitat del resultat obtingut. Si el resultat obtingut et porta a una font oficial, cal entendre que oferirà la màxima fiabilitat des d’un punt de vista administratiu (que és el nostre).
- Impacte de la font.
Recopilació i homogeneïtzació del resultat
Si has obtingut resultats procedents de fonts diferents, caldrà que els recullis i els homogeneïtzis per facilitar-ne la consulta. De vegades n’hi haurà prou a enganxar els resultats en un processador de textos, però de vegades et caldrà usar eines digitals que facilitin la feina, per exemple quan treballes amb enllaços. Potser, simplement, hauràs de buscar eines que et facilitin la descàrrega massiva d’enllaços per no haver-te de passar hores copiant i enganxant.
En aquesta fase l’important és poder tenir la informació obtinguda en un format senzill, clar i homogeni, que sigui entenedor i pràctic tant per a tu com per a les persones a qui hagis de presentar els resultats.
En la fase de recollida de resultats, et poden resultar molt útils eines d’emmagatzematge i gestió d’enllaços, entre les quals en destaquem algunes:
Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços. Es pot generar un RSS amb els enllaços declarats públics, fet que els permet compartir fàcilment. Utilitzant programes d'automatització com IFTTT pots exportar-los massivament cap a fulls de càlcul en línia, etc.
Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços i mitjançant el servei d'automatizacions Zapier, es pot generar un RSS per si es volen compartir automàticament (però no és fàcil).
També et poden resultar útils eines que permeten descàrregues massives d’enllaços perquè els puguis exportar cap a llistes, documents, etc. A continuació te n'oferim alguns:
Establiment dels primers paràmetres de seguiment
Recollir els resultats avui no és igual que recollir-los demà en un món en canvi constant com és el digital. A la Unitat 4 del curs aprofundirem en tècniques i eines de seguiment i monitoratge, però és bo que en aquest punt comencis a tenir clar allò que, després, t'interessarà seguir o tenir vigilat per si canvia.
En aquest sentit, és bo distingir entre cerques que fas de manera habitual, que cal que conservis i sobre les quals podràs fer una estratègia de seguiment, d'aquelles cerques que saps que no tornaràs a fer mai més. Sembla una obvietat, però salvar una cerca que has plantejat acuradament és una bona pràctica de gestió de coneixement i et permetrà, després, automatitzar-ne el seguiment.
2.2 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials
Quan busques informació a Internet, has de tenir clara una distinció que et pot estalviar feina. És la distinció entre fonts primàries i secundàries: fonts primàries són aquelles que s’observen directament d’una realitat i no han estat processades de cap manera, mentre que les secundàries ja han estat objecte d’algun treball.
D’altra banda, et convé adoptar certes prevencions davant el tipus de font, ja que a Internet hi ha moltes veus i és recomanable anar, sempre, a les més fiables. Al mateix temps, mira de recórrer primer a aquelles que t'estalviaran temps, és a dir, les que ja saps que et seran més útils per la quantitat de recursos que contenen.
És bo, també, tenir clara la distinció entre font interna i font externa. Per exemple, el web d’una institució és una font interna d’aquesta institució. Les crítiques que en fan als webs de sindicats o usuaris són fonts externes per a aquesta institució.
A continuació trobaràs diversos tipus de fonts i la manera d’accedir-hi.
Fonts | Descripció | accés |
---|---|---|
Fonts oficials de l'Administració | Aquells llocs web o recursos propis de la Generalitat o de la institució on treballem. Les administracions disposen de moltíssimes dades i informacions publicades a Internet. Hi podem trobar des dels repositoris de dades obertes fins a publicacions oficials (DOGC, BOE, BOP, etc.), grans repositoris d’informació estadística (IDESCAT, CEO, INE, etc.), publicacions pròpies de les mateixes administracions (per exemple, les publicacions de la Generalitat), els webs de l’administració (gencat.cat, bcn.cat, etc.) i els canals de les administracions en xarxes socials. | Per la seva amplitud, les fonts oficials a Internet tenen mètodes d’accés ben diversos, però en la majoria de casos inclouen motors de cerca ben útils i amb nombroses prestacions. |
Fonts acadèmiques o científiques | En què la mateixa comunitat acadèmica i científica ens ofereix garanties de fiabilitat i en què hi ha repositoris riquíssims. Hi ha des de repositoris científics de les universitats (cadascuna sol tenir les seves) fins a recursos compartits com el web de tesis doctorals en línia, directoris amb producció científica o tècnica que respon a un determinat context o grans bases de dades de recerca acadèmica siguin pròpies del context universitari (com Dialnet, entre moltes d’altres), siguin amb format de xarxa social (academia.edu, researchgate.edu, etc.), siguin promogudes per institucions o per les grans empreses digitals globals (Google Scholar, Microsoft Academic). | La majoria de fonts científiques i acadèmiques inclouen potents motors de cerca amb nombroses prestacions, tant bàsiques com avançades. |
Fonts divulgatives | Obres de consulta que volen explicar la realitat, amb el benentès que poden tenir biaixos propis dels seus promotors empresarials (per exemple, les enciclopèdies privades en línia) o del mateix consens i discrepància dels elaboradors (per exemple, la Viquipèdia) | La major part de fonts divulgatives en línia inclouen cercadors. |
Fonts corporatives d’organitzacions i empreses | Tenen la garantia de ser l’òrgan “oficial” de la mateixa organització o empresa i, també, els biaixos propis d’aquestes organitzacions. Són, essencialment, webs d’empreses, entitats, fundacions, etc. | Són organitzacions que la major part de vegades ofereixen la informació en web i no sempre disposen de bons cercadors, de manera que, sovint, per accedir-hi, cal recórrer a cercadors d’abast general a Internet com Google. |
Fonts de mitjans de comunicació | Prioritzarem les que ofereixin una alta fiabilitat i professionalitat i en què el contrast i la verificació d’informació. La darrera part d’aquest curs ens donarà eines per ser acurats en abordar-los. | S’ha generalitzat l’estàndard d’incloure, dins de tots els mitjans, algun motor de cerca, que no sol tenir grans prestacions, però sí que permet fer cerques bàsiques per paraules. Tot i això, hi ha algun mitjà que no en té. |
Catàlegs i repertoris bibliogràfics en línia | Ens ofereixen les obres disponibles en biblioteques, centres o llibreries. En alguns casos, fins i tot amb accés directe a les obres (si estan digitalitzades i són d’accés lliure). | Els mateixos catàlegs solen incorporar sistemes de cerca. |
Fonts 2.0 | Sorgides dels grans formats participatius d’Internet: blogs, xarxes socials, etc. No parlem de les aportacions oficials que hi fan les administracions o les empreses (que considerarem fonts pròpies o corporatives) sinó de les dels mateixos usuaris. | Les xarxes socials, generalment, incorporen algun tipus de motor de cerca per accedir i trobar-hi informació. |
2.3 Eines de cerca: aproximació i ús avançat
A Internet hi ha eines de cerca molt diverses. La gran majoria es basen en la cerca a partir de paraules introduïdes en una determinada boca de cerca. Aquest és el paradigma dominant a Internet des que van aparèixer els primers cercadors com Altavista o Yahoo, tot i que va ser Google qui va revolucionar el panorama a partir del tombant de segle.
Actualment, ja hi ha cercadors que parteixen de principis diferents. Google mateix ofereix la possibilitat de carregar una imatge i a partir d’aquí cercar altres imatges relacionades.
Cercadors i tipus de cercador disponibles
Quan hem parlat de fonts d’informació disponibles a Internet hem vist que n’hi havia de molts tipus. Algunes d’aquestes fonts disposaven de cercadors propis, de caràcter específic. D’altres, en canvi, són només accessibles mitjançant cercadors generals. A continuació et presentem una llista de cercadors que et poden ser més útils, amb un breu comentari.
Cercadors d’abast general (cerquen en el conjunt d’Internet)
Els cercadors d'abast general són eines d'una gran capacitat i d'ús massiu en la modalitat de cerca simple. El més usat és Google. A efectes d'aquest curs és important que tinguis presents algunes qüestions:
Quan fem una cerca en un cercador d'abast general no podem mirar-nos només els resultats que ofereix la primera pàgina fent-hi una cerca simple, hem de ser capaços de fer cerca avançada (utilitzant operadors o formularis) i d'explotar les eines de postcerca. Això ens permetrà obtenir resultats acurats.
Vegeu alguns dels cercadors d'abast general i algunes idees claus sobre cadascun que et suggerim de retenir:
- http://www.google.cat: és el cercador més popular, molt útil en cerca simple, però més útil encara en cerca avançada i mitjançant operadors. Té un xatbot d'intel·ligència artificial relacionat, Bard, però en el moment d'actualitzar aquest curs encara no l'ha integrat a la interfície.
- http://www.bing.com: és el principal competidor de Google, propietat de Microsoft i en determinats aspectes molt competitiu. Un dels avantatges que té i que facilita molt el seguiment del canvi que abordarem a la Unitat 4 és que permet generar canals RSS de les cerques mitjançant l'addició de la cadena &format=rss a la URL del resultat. És el primer que ha integrat de manera senzilla una interfície de xatbot d'intel·ligència artificial amb el qual podem dialogar un cop tenim els primers resultats del que hem cercat.
- http://www.DuckDuckGo.com: tercer principal cercador de caràcter genèric, ofereix nombroses garanties en privacitat i té característiques que el fan força diferent dels altres. Durant uns mesos de l'any 2022 ha integrat en la versió anglesa DuckAssistant, un xatbot d'intel·ligència artificial basat en ChatGPT, però en el moment de tancar aquesta actualització del curs, ja no l'ofereix.
- http://yahoo.com: un dels cercadors més antics, ofereix bons resultats en determinats aspectes com les notícies.
- https://www.wolframalpha.com: té un plantejament diferent de tots els altres cercadors ja que no ofereix enllaços sinó informació elaborada.
Cercadors per a xarxes socials
Després d'uns anys en què hi havia força cercadors per a les xarxes socials, la majoria d'eines han anat quedant obsoletes a causa de la impossibilitat d'aconseguir un bon model de negoci. Queden els cercadors que proporcionen les mateixes xarxes, que en algun cas són excepcionalment útils (és el cas de X, abans Twitter) i alguna eina que actua com a metacercador, obtenint dades de xarxes socials filtrades dels cercadors clàssics. A continuació en comentem tres casos. Més endavant, en tractar cercadors com DuckDuckGo, veuràs que mitjançant l'eina Bang! pots cercar directament en algunes xarxes.
- http://search.twitter.com: és el cercador propi de X (abans Twitter) amb un bon sistema de cerca avançada. Cal vetllar en les opcions de filtre quan ofereix els resultats, ja que la primera pantalla prioritza la rellevància i no l’actualitat, però ofereix una pestanya “últims” per seleccionar les piulades més actuals.
- Cercador de Facebook. Cal accedir-hi des de la mateixa xarxa social. El principal interès no és tant en el resultat que ofereix quan fas la primera cerca com en les eines de filtratge que complementen el resultat i que t'ofereix tant en el menú superior com en el lateral esquerre. Aquí en tens l'aspecte:
- https://www.social-searcher.com/: mitjançant Google, fa una cerca bastant útil d’actualitzacions en les principals xarxes socials
Cercadors de caràcter acadèmic
El món acadèmic i científic genera informació rigorosa sobre multitud de temes. Si vols fer cerques d'informació acurades, sovint hi hauràs de recórrer, ja que, sigui quin sigui el teu àmbit de treball, ben segur que des del món acadèmic o de recerca hi ha persones que l'estudien i hi aprofundeixen. En termes generals, trobem tres models de cercadors de caràcter acadèmic:
- Els que es basen en el rastreig de la xarxa que ja fan habitualment per proveir els seus cercadors ordinaris. És el cas de Google i Microsoft.
- Els que es basen en grans repositoris acadèmics. És el cas de Dialnet o el cercador de tesis TDX.
- Els que funcionen com a xarxes socials en què els mateixos científics comparteixen els seus "papers".
Et presentem a continuació alguns exemples d'aquest tipus de cercadors:
- https://scholar.google.com/: una eina específica de Google sobre continguts acadèmics i científics
- http://academic.microsoft.com: l’eina científica i acadèmica de Microsoft, que competeix amb la de Google
- https://dialnet.unirioja.es/: directori i cercador acadèmic del món hispà amb gran quantitat de continguts
- http://tdx.cat: tesis doctorals catalanes en línia
- http://academia.edu: repositori elaborat pels mateixos científics i acadèmics que funciona com a xarxa social (t'hi hauràs de donar d'alta, però és fàcil)
- http://www.researchgate.com: similar a l’anterior (t'hi hauràs de donar d'alta, però és fàcil)
- https://www.semanticscholar.org/: basat en intel·ligència artificial, es considera un cercador acadèmic de nova generació
Eines de cerca en dades obertes
Mentre que la majoria de cercadors que hem vist treballen sobre informació ja elaborada, la tendència a publicar dades obertes per part de les administracions i altres organismes sovint permet accedir a gran quantitat de dades sense elaborar, però que mitjançant eines diverses es poden convertir en informació ben útil. Les eines que ofereixen per accedir-hi són cada vegada més pràctiques i amb gran quantitat de prestacions.
- https://datasetsearch.research.google.com/: cercador de google especialitzat en sets de dades obertes d'arreu del món
- http://governobert.gencat.cat/ca/dades_obertes/: repositori de dades obertes de la Generalitat de Catalunya, basat en l'aplicatiu Socrata, amb un cercador de sets i una eina per explotacions i cerques internes amb múltiples possibilitats.
- https://opendata-ajuntament.barcelona.cat/: respositori de dades obertes de l’Ajuntament de Barcelona
- https://datos.gob.es/: portal de dades obertes de l’administració de l’estat
Cercadors de notícies
Els principals cercadors de notícies són els següents:
- http://news.bing.com (indexa en català)
- https://news.google.com (indexa en català)
Finalment, cada mitjà disposa, generalment, d'un cercador propi. N'hi ha que ofereixen els resultats per un únic criteri de rellevància i no sempre són útils, però n'hi ha que permeten endreçar-los per data (posant la més recent davant). Aquests resulten especialment útils.
2.4 Posem-nos a cercar
Cerca simple
Si utilitzes la primera boca de cerca que t’ofereix el cercador, tingues present el que hem comentat en parlar de les paraules de cerca sobre la conveniència de triar-les bé. Tingues present que com menys paraules i més específiques, més fàcil serà trobar el resultat. D’altra banda, per evitar confusions, prescindeix de signes de puntuació o tipogràfics i no et refiïs de les distincions entre majúscules i minúscules o dels accents diacrítics, ja que la gran majoria de cercadors ignoren aquests detalls.
Google i Bing, que són els principals cercadors, han basat el seu èxit en el bon funcionament de la cerca simple.
Introducció a la cerca amb operadors i avançada
La majoria de cercadors ofereixen, a més de la cerca simple, eines per fer cerques més acurades. Ho fan mitjançant els formularis de cerca avançada, que proporcionen un entorn usable que simplifica la tasca, o mitjançant la introducció d'operadors. En un primer moment i en determinades circumstàncies, els formularis de cerca avançada et resultaran molt útils, però si aprens uns quants operadors hi acabaràs guanyant tant en velocitat com en precisió.
Bàsicament, la cerca avançada es basa en dos tipus de tasca:
- Controlar la manera com es relacionen els diversos elements de la cerca entre ells (si hi han d'aparèixer tots, si han de sortir en el mateix ordre, etc.) o bé si cal excloure'n algun. És el territori dels operadors booleans.
- Filtrar, és a dir, restringir els resultats a una determinada tipologia (un determinat tipus de fitxer, una determinada ubicació en la xarxa, una determinada datació), etc.
El formulari de cerca avançada de Google és paradigmàtic per la quantitat de possibilitats que ofereix i és bo que sigui el primer amb què et familiaritzis:
Aquí tens alguns exemples de formularis de cerca avançada:
Tipus de cerques amb operadors i avançada
Et presentem a continuació els tipus de cerques que podem obtenir amb operadors i amb cerca avançada. Els cercadors que s'hi consignen són només els més destacats o bé algun que és especialment interessant per com vehicula cadascuna de les cerques (més avall t'explicarem els operadors més útils de cadascun):
cerca | explicació | exemple | operadors | cercadors |
---|---|---|---|---|
expressions literals | Si volem cercar una frase literal, podem recórrer als cercadors de cerca avançada, però convencionalment, els principals cercadors admeten que es pot posar la frase a cercar entre cometes. Això és vàlid tant a Google com als seus principals competidors, Bing i DuckDuckGo | Si escrivim entre cometes "pluja de granotes", els cercadors ens oferiran literalment aquesta expressió i descartaran qualsevol altra combinació de paraules en què apareguin els mots pluja o granotes. | "" | Google, Bing, DuckDuckGo |
operador booleà AND | Present també en els tres principals cercadors, permet garantir que totes les paraules encadenades amb aquest operador seran presents en els resultats que es presentin. En el cas de Bing, també es pot usar l'operador &. | Si escrivim pluja AND granotes apareixeran totes les pàgines on surtin els dos termes, tant les que diuen, per exemple, pluja de granotes com les que diuen la pluja va provocar l'aparició de pèlags que es van omplir de granotes. | AND (Google); AND, & (Bing) | Google, Bing i la gran majoria |
operador booleà OR | Usem aquest operador, present també als tres principals cercadors, per demanar qualsevol dels termes que apareixen a costat i costat de l'operador, tant si hi surten tots dos com si només en surt un. En el cas de Bing, l'operador pot ser OR o bé la barra vertical. | Si escrivim pluja OR granotes apareixeran totes les pàgines on surt pluja i, també, totes les pàgines on surt granotes | OR i la barra vertical | Google, Bing i la gran majoria |
exclusió d’una paraula | De vegades ens interessa que en una determinada cerca no hi surti una paraula per evitar que ens entrin massa pàgines no relacionades. | Si volem que, quan busquem tempestat, NO hi surti cap referència a la pluja, la podem excloure fent aquesta cerca: tempesta -pluja | - | Google, Bing, DuckDuckGo |
inclusió d'una paraula buida | Hi ha paraules que els cercadors consideren buides perquè no aporten cap valor semàntic a efectes de la cerca com conjuncions, preposicions o articles. Només les solen cercar en literals entre cometes. De vegades, però, ens interessa buscar-les encara que no siguin en un literal. | El cercador Bing permet forçar l'aparició de paraules buides posant-hi l'operador +, per exemple pluja +que | + Cal anar amb compte amb aquest operador, ja que té significats diferents segons el cercador | Bing |
ús de comodins | Google ofereix el comodí *, que permet substituir qualsevol paraula o cadena de paraules dins d'una expressió literal, és a dir, buscada entre cometes. | Si busquem "pluja * granotes" obtindrem la cadena pluja de granotes però també documents on apareix pluja i, al cap d'algunes paraules més, granotes. | * | |
prioritzar una paraula | Bing ofereix l'operador prefer: que busca pàgines en què la paraula amb aquest operador hi té un lloc més destacat o important que les altres | Si busquem pluja prefer:neu, buscarà pàgines amb les dues paraules però prioritzarà neu. | prefer: | Bing |
cenyir a un lloc web | Permet reduir l'abast de la cerca a un únic lloc web o plataforma. | Si ens interessa buscar pluja només al portal de la Corporació Catalana de Mitjans Audiovisual, podrem restringir-hi mitjançant pluja site:ccma.cat | site: | Google, DuckDuckGo, Bing |
excloure un lloc web | Permet excloure de la cerca un determinat lloc web o plataforma. | Si ens interessa buscar pluja però descartar els resultats de la Corporació Catalana de Mitjans Audiovisuals, podrem filtrar-ho mitjançant -site:meteocat.cat | -site: | Google, DuckDuckGo, Bing |
cercar llocs similars | Cerca llocs amb coincidències de contingut amb un lloc determinat | Si escrivim pluja related:ccma.cat ens buscarà llocs amb continguts similars als de la Corporació Catalana de Mitjans Audiovisuals | related: | |
cenyir a un sol tipus de fitxer | Ens permet triar el tipus de fitxers que volem trobar, entre els moltíssims fitxers disponibles | Si només volem fitxers amb l'extensió PDF haurem de fer la cerca així: pluja filetype:PDF. | filetype: | Google i DuckDuckGo |
cercar dins els caràcters de la URL | De vegades, el nom del domini o els directoris que completen la URL aporten informació rellevant; amb això podem buscar-hi dins | Si busquem pluja inurl:previsio ens aportarà resultats que tinguin la paraula pluja dins de la pàgina i la cadena previsio dins del text de la URL. Per exemple:https://www.ccma.cat › el-temps › previsio › pluges | inurl: | Google, DuckDuckGo |
cercar en el camp TITLE | Cada pàgina web té un títol que és el que apareix a la pestanya del navegador i és un contingut clau per als cercadors. Podem fer que un text tingui una determinada paraula en aquest camp. | Si busquem pluja intitle:aiguat buscarà pàgines que a l'interior tinguin la paraula pluja i al camp TITLE tinguin aiguat. | intitle: | Google, Bing |
cercar pàgines que enllacin a una altra | De vegades ens interessa buscar en pàgines que estiguin enllaçades ab una determinada pàgina. | Podem buscar la paraula pluja en totes les pàgines enllaçades amb Gencat escrivint: pluja link:gencat.cat | link: | Google, Bing |
cercar números en un interval | Cerca, a més de la paraula que busquem, que en la mateixa pàgina hi hagi una xifra que es trobi dins de l'interval demanat. | Volem buscar pàgines on surti la paraula pluja però que facin referència només a les que van tenir lloc als anys 60, doncs podem fer una cerca del tipus pluja 1960..1969 | .. | |
filtrar per llengua | Podem restringir la cerca només a pàgines en una determinada llengua. | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per àmbit territorial | Podem restringir les cerques a pàgines d'un determinat territori en el món. | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per data d’actualització | Podem restringir la cerca a un determinat rang de dates per obtenir només pàgines creades o actualitzades en un període concret | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar contingut sexualment explícit | Podem excloure de la cerca la pornografia o altres continguts no adequats per a menors | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per drets d’ús | Podem cercar pàgines amb diversos tipus de cessions de drets d'ús per poder-ne reutilitzar els continguts garantint que no incorrem en anomalies jurídiques | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari |
Llista d'operadors vàlids als principals cercadors
Operadors de Google
operador | explicació i exemples |
---|---|
“” | El que posem entremig de cometes serà la cadena exacta de paraules que buscarà, per exemple “pluja de granotes” només oferirà documents on surt, exactament, “pluja de granotes”. |
OR | És un operador que ens mostrarà aquells resultats relacionats amb qualsevol de les dues paraules entre les quals l’introduïm. Per exemple: pluja or vent ens oferirà resultats tant de pluja com de vent. |
AND | (que també pot ser “+”. Ofereix aquells resultats on apareixen les dues paraules entre les quals el posem. Pere exemple, pluja and vent ens oferirà resultats que parlin de pluja, però que també parlin de vent. |
- | El símbol de restar davant d’una paraula farà que aquesta no aparegui. Per exemple, si posem pluja -vent sortiran aquells documents on surt pluja, però excloent-ne aquells on surt vent. |
* | Si el posem davant d’una cadena de lletres, ens donarà paraules que comencin amb aquesta cadena. Si posem *fisio ens sortirà fisioteràpia, fisiologia, etc. |
define: | ofereix la definició de la paraula que hi posem al darrere. Així, define:pluja ens definirà pluja. |
site: | cenyeix la cerca a la URL (URL és l’adreça que escrivim a la barra de navegació quan volem accedir a una pàgina) que hi posem darrere. Així pluja site:meteocat.cat ens oferirà la paraula pluja només a meteocat.cat. |
info: | mostra totes les entrades que Google té de la URL que hi posem darrere. Així, info:meteocat.cat ens ensenyarà tot allò que Google té de meteocat.cat. |
related: | busca llocs similars a la URL que s’hi posa al darrere. Així, si posem a Google related:google.com, el cercador es veu obligat a mostar-nos la seva competència, pobre |
link: | localitza pàgines que enllacen a la de la URL que hi posem darrere |
cache: | mostra la pàgina tal com era el darrer cop que Google la va visitar |
filetype: | cenyeix la cerca al tipus d’extensió de fitxer que s’hi posa al darrere (per exemple: filetype:pdf, txt, doc…), és a dir, pluja filetype:pdf si volem els pdf que parlen de pluja. |
inurl: | cerca la paraula que s’hi posa al darrere o les paraules que s’hi posen darrere dins de la URL de la pàgina |
allinurl: | és com l’anterior, però cerca que hi siguin totes les paraules (com si hi hagués ‘and’ entre elles) |
inanchor: | és com inurl, però cerca dins del text que identifica àncores (enllaços interiors de pàgina) |
allinanchor: | és com allinurl però amb àncores |
intitle: | és com inurl però cerca dins del camp títol que tenen totes les pàgines web |
allintitle: | és com allinurl però dins del camp títol |
@ | davant d’una paraula, cerca usuaris de Twitter |
# | davant d’una paraula, cerca l’etiqueta a Twitter |
$ | davant d’una xifra i darrere d’un producte, busca on s’ofereix aquest producte per aquest preu |
.. | permet fer cerques que responguin a l’interval. Per exemple, si busquem ‘televisor 200€..300€ ens buscarà televisors per aquest preu i si busquem ‘Montblanc 1400..1425” ens buscarà la paraula Montblanc en pàgines on també aparegui qualsevol xifra entre 1400 i 1425 |
Operadors de Bing:
operador | explicació i exemples |
---|---|
+ | permet trobar tots els termes que el porten davant incloent-hi termes buits, que normalment no es tenen en compte (preposicions, articles, etc.) |
“” | permet trobar cadenes exactes (com en Google) |
AND i & | busca totes les pàgines que contenen els termes encadenats amb aquests operadors |
NOT i - | exclou les paraules precedides per aquests operadors |
OR o barra vertical | inclou les paraules que contenen una o altra paraula separades per aquest operador |
contains: | cerca pàgines que incloguin fitxers amb el tipus de contingut que s'hi especifica. Per exemple, si posem pluja contains:gif ens buscarà pàgines amb la paraula pluja on hi hagi algun fitxer GIF enllaçat |
ext: / filetype: | cerca pàgines amb l'extensió que busquem, per exemple PDF |
inanchor:, inbody:, intitle: | cerca la cadena dins del l'àncora, el cos del text o el camp títol de la pàgina |
ip: | cerca pàgines allotjades a la IP que s'indica (la IP són 4 números separats per punts) |
language: | cerca pàgines escrites en la llengua indicada (amb codis del tipus: FR, ES, CA, etc.) |
loc:, location: | restringeixa una determinada zona o regió |
prefer: | de les diverses paraules que formen la cerca, quina és la que és més important que surti. Per exemple pluja prefer:neu. Sortiran documents amb les dues paraules, però prioritzarà les que inclouen neu |
site: | restringeix a una determinada URL |
feed: | restringeix la cerca a canals RSS d'una determinada temàtica. |
hasfeed: | cerca pàgines de les quals penja un feed del tema indicat |
url: | comprova sil a URL que aportem està indexada a Bing |
Operadors de DuckDuckGo
operador | explicació i exemples |
---|---|
“” | retorna la cadena exacta situada entre cometes |
- | exclou la paraula precedida d’aquest signe |
+ | busca els documents on la paraula precedida d’aquest signe surt més |
filetype: | busca els documents que tenen l’extensió especificada |
site: | busca dins d’un lloc determinat |
-site: | exclou els d’un lloc determinat |
intitle: | busca que dins del camp títol tingui la paraula que busquem |
inurl: | busca que dins la URL tingui la paraula que busquem |
\: | ens fa saltar directament al primer resultat sense mostrar-nos el llistat de cerca |
! | És un operador Bang! Permet cercar directament a determinats llocs |
Vegeu alguns dels principals operadors Bang! de DuckDuckgo:
operador | lloc on fa la cerca directa |
---|---|
!w | wikipedia |
!a | amazon |
!x | X (antic Twitter) |
!ig | |
!fb |
Trobareu tots els operadors Bang!, en aquesta pàgina.
Amb aquestes eines podeu realitzar cerques acurades en els principals cercadors. Els conceptes que aprendreu, us serviran, a més per millorar les cerques quan utilitzeu altres cercadors que tinguin prestacions avançades, encara que tinguin un abast més restringit.
Ús del sistema d'expressions regulars REGEX
El sistema d'expressions regulars REGEX és un sistema de codificació de cerques basades en patrons de paraules. En trobaràs més informació a Viquipèdia i podràs experimentar i fer proves en aquestsimulador.
Google admet l'ús d'expressions regulars molt simples, però que poden ser molt útils per trobar determinades cadenes literals de mots en combinació.
Postcerca: filtratge addicional i ordenació dels resultats
Un cop obtinguts els resultats, sigui per cerca ordinària, amb operadors o avançada, la major part de cercadors permeten filtrar o ordenar els resultats mitjançant un menú que es troba al capdamunt de la llista de resultats obtinguts.
- En el cas de DuckDuckGo, el filtre postcerca permet filtrar per tipologies de contingut (web, imatges, vídeos, notícies, mapes), per territori, per seguretat de la cerca i per temps.
- En el cas de Bing, el filtre postcerca permet filtrar per imatges, vídeos, mapes, notícies, elements desats (pel mateix usuari, procedents d'anteriors cerques), per data, per llengua i per regió.
- En el cas de Google, el filtre postcerca permet filtrar per imatges mapes, vídeos, productes, llibres, vols, finances (de fet, ho adapta a la cerca que ha fet la persona). Mitjançant l'apartat eines, permet encara altres filtratges addicionals: idioma, moment, etc. Quan apliquem un filtre addicional com el d'imatges, encara obtenim una segona capa de filtres: mida, color predominant, drets d'utilització, tipus d'imatge, hora. L'eina de postcerca de Google és excepcionalment rica.
Cercar en un set de dades obertes
En un primer moment, els repertoris de dades obertes oferien l’accés directe als fitxers, que es decarregaven i es gestionaven des de l’ordinador dels usuaris amb eines com processadors de textos, fulls de càlcul, etc.. Mica en mica, el creixement del nombre de sets de dades disponibles i de la mida i quantitat de dades contingudes en aquests sets va fer que aquest sistema resultés poc útil i les administracions es van procurar eines especialitzades per gestionar i oferir dades obertes com Socrata, que és la que utilitza ara mateix la Generalitat. Altres administracions han optat pel mateix sistema o per sistemes que ofereixen prestacions similars. L’explicació que trobaràs a continuació et servirà, doncs, per a qualsevol repertori de dades obertes.
Imaginem que busquem un contracte menor de l’any passat entre l’empresa X i la direcció general Y del departament Z de la Generalitat.
En primer lloc, obrirem el repertori de dades obertes de Gencat i ens situarem al formulari de cerca per cercar el set que ens interessa. En aquest cas, la paraula de cerca serà “contractes”. Ens sortiran diversos sets de contractes i triarem el de contractes menors.
En aquest punt, accedirem al visualitzador de dades obertes, que ens mostrarà la relació de contractes menors en forma de taula de manera ben senzilla. Si, a més, ho consultem amb un ordinador disposarem de moltes visualitzacions possibles (gràfiques, estadístiques, etc.):
- Obtenir un RSS amb les novetats del set (cada vegada que hi hagi un assentament nou).
- Compartir el set.
- Accedir-hi des de diverses modalitats de vista i amb diverses ordenacions.
- Filtrar-lo per algun criteri (a partir d'operadors lògics accessibles des de menús i altres opcions).
- Generar visualitzacions gràfiques (amb gràfics estadístics, etc.).
- Exportar les dades a tota mena de formats (CSV, JSON, XML…).
- Encastar-ho.
Com que el que ens interessa és una dada concreta, el que farem és buscar la icona de la lupa que ens donarà accés al formulari del cercador. Allí podrem buscar pel criteri que ens convingui (el nom de l’empresa, el nom del departament o de la direcció general, l’import, la data…). Amb això obtindrem la dada exacta que ens interessa.
Encara hi ha alguns sets de dades que no són disponibles amb aquest visualitzador, però es poden descarregar i hi podem treballar i cercar informació des de programes de full de càlcul, etc.
El sistema d’altres sets de dades institucionals, tot i no ser igual és molt similar al de Gencat i les prestacions que ofereix i la manera de cercar-hi informació és la mateixa.
Vegeu alguns llocs de dades obertes que tenim a disposició:
Llocs per cercar dades estadístiques
Hi ha diversos llocs que ofereixen dades estadístiques. L'IDESCAT és l'organisme que, pel que fa a Catalunya, n'ofereix més. El mateix web mostra els sistemes per accedir a la informació, que és molt nombrosa i que pot resultar molt útil. Normalment cal triar el contingut i després el tipus d'estadística concreta que en volem consultar, però el web ofereix moltes maneres d'accedir-hi. A banda de l'IDESCAT també podem trobar molta informació estadística relacionada amb Catalunya al CEO, l'INE i en altres llocs d'estadística de l'administració: