Unitat 1: La cerca avançada d'informació en un món de dades
1.1 Què faràs amb aquests continguts?
Treballes a l’administració en un entorn totalment assistit per ordinador. Davant dels ulls hi tens una pantalla de l'ordinador del lloc de treball. A la butxaca, segurament, hi tens un mòbil que tant pot ser de treball com de feina. Fins i tot pot ser que en tinguis dos. A casa teva, és possible que tinguis unes quantes pantalles més: la del televisor, la de la tauleta, les dels ordinadors personals, etc.
En aquest mar de pantalles i símbols hi veus de tot: sòrdids documents administratius que són el teu pa de cada dia, però també multitud d’informacions i dades que, ordenadament o desordenadament, hi tenen relació. I a casa, és clar, també veus i escoltes, contínuament, tota mena de continguts digitals.
Avui t’ha sorprès una piulada que parla de l’atenció al públic en el servei on treballes. Sembla que un usuari s’ha enfadat. Un munt de persones l’han repiulada i ara t’arriba que un diari digital n’ha fet una notícia. El teu cap et demana informació sobre tot el que s’ha publicat i sobre el que hi ha al darrere. Com ho fas? Evidentment, el mateix canal pel qual ha arribat la primera informació, Internet, t’hauria de servir per portar a terme aquesta tasca.
Obres Twitter i hi veus de tot: vídeos de gatets, ocurrències, diatribes polítiques i informació sobre el cas que t’ocupa. Però, te’n pots refiar? Et sents com si estiguessis a la selva: lletres, números, vídeos, imatges… Algunes són reals, però d’altres són falses. A més, com a empleat públic, sents la necessitat de prestigiar l’entorn professional que aquesta notícia, com tantes altres, contribueix a embrutar.
Necessites una guia per no perdre’t ni sucumbir en aquest safari de símbols i signes.
Si segueixes el curs, evidentment no esdevindràs un documentalista ni un expert en elaboració de dossiers de premsa ni tampoc un professional de la verificació d'informacions periodístiques, però sí que hauràs fet unes reflexions que et faran veure Internet d'una altra manera i disposaràs d'eines i coneixements que t'ajudaran a filar prim quan t'encaris amb una pantalla amb informació.
1.2 El bosc s’ha tornat una selva
que deixen anar, de vegades, paraules confuses;
l’home hi camina per un bosc de símbols
que l’observen amb una mirada familiar."
Charles Baudelaire. Les flors del mal. Trad. Jordi Llovet. Ed. 62. 2007
És una quarteta del sonet “Correspondències” de Charles Baudelaire. En un primer moment, Internet era efectivament un bosc de signes plaent. Ara ja no és cap bosc. És una selva i de grat o per força t’hi trobes dintre. Com totes les selves és plena de llocs paradisíacs, però també perills i paranys.
Anys enrere, un curs dedicat al web social i orientat a empleats públics tenia com a introducció un relat optimista sobre les possibilitats d'Internet i molt especialment del web 2.0. En aquell moment, la possibilitat que tothom pogués publicar fàcilment els seus plantejaments i opinions i compartir-los amb tota la societat es veia com una contribució a fer un món millor. L'èxit d'eines tan útils com la Viquipèdia ho feien preveure així. Però en pocs anys les coses han canviat molt.
El que anys enrere, als primers 2000, era una obertura marcada per l’aparició dels blogs i, més tardanament, de Facebook, ha canviat justament amb el triomf de les xarxes socials. Buscar-hi informació ha esdevingut complex tant per la gran quantitat i diversitat de dades que hi trobem com pel fet que canvien contínuament. Relacionar-nos-hi, a més, té implicacions en matèria d’identitat i protecció de dades personals i també psicològiques i conductuals, fins al punt que podem arribar a tenir dificultats per mantenir l'atenció. Per postres, costa distingir allò que és cert d'allò que és fals, problema que s'ha accentuat amb la socialització de les intel·ligències artificials generatives, popularitzades mitjançant xatbots (del tipus ChatGPT o Bard). Tot i això, ens en podem sortir perfectament si hi reflexionem i adoptem certes tècniques i actituds. Això és el que mirarem de fer a continuació.
Byung-Chul Han. La sociedad de la transparencia. Herder. 2013
La millor actitud i les millors eines
Per a un empleat públic que vol treballar amb rigor, la qualitat de la informació és un requisit indispensable. Però els que aporten informació a Internet sovint es troben darrere de màscares. Cada vegada costa més de saber si allò que llegim és veritat o és, ras i curt, una enredada, i el problema no se cenyeix només a les xarxes socials. En més d'una ocasió afecta mitjans que, en altre temps, havien estat ben prestigiosos. Alguns d'aquests han caigut en el parany de les imatges o els textos falsos generats mitjançant intel·ligències artificials o altres sistemes.
D'altra banda, la cerca d'informació pot semblar la cerca d'una agulla en un paller. Hi ha molta informació disponible perquè cada vegada hi ha més veus que en generen atretes pels avantatges en relacions socials o expressió personal d'eines com els blogs, les xarxes, etc.
Com explica Jaron Lanier en un llibre que us recomanem (Contra el rebaño digital. Debate. 2011), darrere d'aquests productes que provoquen la creació de tants i tants continguts s'hi amaga la necessitat de fer rendibles el que ell denomina "servidors sirena", ordinadors de gran capacitat que necessiten grans recursos per al seu funcionament. Els gestors d'aquestes infraestructures ofereixen grans gratificacions perquè la gent comparteixi contingut a la xarxa (i no tan sols en l'àmbit expressiu, també comercialment: Ebay, Amazon, etc.). Aquest contingut, que transformat en dades, és una eina de màrqueting de primer ordre, també és la clau del seu negoci i ha comportat la transformació de molts aspectes de la nostra societat, amb clares implicacions sociològiques. També respon a aquesta lògica la primera onada de xatbots basats en intel·ligència artificial popularitzats de manera molt ràpida l'any 2022.
Si tothom esdevé proveïdor d'informació, els volums esdevenen inabastables. A efectes de negoci, que part d'aquesta informació pugui ser irrellevant o de baixa qualitat, no és problemàtic. Sí que ho és quan, per la nostra tasca professional diària, ens veiem en la necessitat de relacionar-nos-hi. Ens calen instruments teòrics i pràctics per cercar aquesta informació amb precisió, per seguir-la (ja que està subjecta a canvis) i també per escatir-ne la precisió i la veracitat. En aquest sentit, cal advertir de l'ambivalència que en aquesta tasca poden tenir les eines d'intel·ligència artificials (que només es poden fer servir en l'àmbit professional si hi ha orientacions corporatives i respectant-les escrupolosament i en cap cas introduint-hi informació organitzacional).
Tingues present també que "les eines són eines i el programari és programari". Aquí t'explicarem a fer servir determinades eines, determinats programes, però ben segur que sortiran programes millors que els substituiran. Convé doncs que t'habituïs a entendre'n sobretot la utilitat i les prestacions amb una òptica d'intercanviabilitat. No dubtis a canviar de programes si en trobes de millors. Tot el que hagis après aquí et servirà, en essència, per a tots.
Una selva amb perills, sobretot emocionals
Tot i l’estratègia que les institucions públiques han portat a terme a les xarxes socials, com a empleats públics hem de ser conscients que en aquestes xarxes hi ha moments de gran hostilitat i enfrontament que, en determinades ocasions, pot impactar sobre les organitzacions en què treballem.
Christian Rudder. Dataclismo. Aguilar. 2016
Si hem de buscar informació en aquest entorn hostil, ben segur que serà una operació que, com a empleats públics, ens pot suposar una erosió emocional i cal que ens cuirassem i sapiguem separar adequadament les emocions, que és el terreny psicològic en què sovint es vehiculen les crisis a les xarxes socials, de la tasca racional de trobar un desllorigador tècnic als problemes que es plantegen. Això no sempre és fàcil.
Alguna vegada el teu servei públic ha estat objecte de crítica o polèmica a les xarxes socials o a la premsa? Com ho has viscut?
1.3 Abundància d’informació, importància de les dades
En el moment d’elaborar aquest curs la quantitat i diversitat d’informació i dades que hi ha a Internet impressiona. Segons Internet Live Stats, hi ha:
- 1.710.635.383 webs accessibles a la xarxa
- 2.299.670.036 perfils de persones a Facebook
I en les primeres hores del dia en què s’ha elaborat aquest text:
- S’han enviat 143.921.698.650 missatges de correu electrònic
- S’han fet 3.755.075.796 de cerques a Google
- S’han actualitzat 3.574.976 de blogs
- S’han fet 421.872.631 piulades a Twitter
- S’han visualitzat 3.924.300.384 vídeos a Youtube
- S’han publicat 45.774.867 fotos a Instagram
- Han circulat 3.817.840.333 gigabites d'informació
Es calcula que tota la informació continguda a Internet i els ordinadors que en formen part és de 9 zetabytes de dades. Per fer-vos-en una idea:
- 9 zetabytes = 9.000 exabytes
- 9 exabytes = 9.000 petabytes
- 9 petabytes = 9.000 therabytes
- 9 therabytes = 9.000 gigabytes
- 9 gigabytes = 9.000 megabytes
- 9 megabytes = 9.000 kilobytes
- 9 kilobytes = 9.000 bytes
Per tant, 9 zetabytes serien 9 x 10 elevat a 21 bytes. Per entendre què suposa, et proposem un exemple expressat en temps i un exemple expressat en espai:
Michiko Katukani. La muerte de la verdad. Rústica Ensayo. 2019
Dades, informació, coneixement, saviesa
Marina Garcés. Nova il·lustració radical. Anagrama. 2017
Internet conté doncs una quantitat ingent de dades i, també, d’informació i coneixement. Aquests tres conceptes normalment es representen en forma de piràmide, l’anomenada "Piràmide de la jerarquia del coneixement", que és la següent:
Fixem-nos en les franges d'aquesta piràmide:
- Capa base (dades): Les dades són unitats bàsiques d'informació, que poden ser estructurades (una base de dades) o no estructurades (un fitxer de text amb una llista, per exemple).
- Segon nivell (informació): La informació són dades organitzades i processades per a ser enteses. La manera com s'organitzen ja té una intencionalitat.
- Tercer nivell (coneixement): El coneixement és l'assimilació i la integració personal o col·lectiva de la informació, fet que en suposa una transformació i adaptació.
- Pic de la piràmide (saviesa): La saviesa és la consciència del mateix coneixement que dona plenes capacitats per adoptar decisions, ja que si tenim saviesa sabem els límits d'allò que coneixem.
Un exemple per a empleats públics:
- La llista caòtica de totes les atencions al públic d’una oficina fetes d'anotacions en fulls de paper, assentaments en ordinadors i llistes de sol·licituds presentades serien dades.
- Una relació ordenada i classificada de totes les atencions al públic que s'han fet, tractades estadísticament i presentades de manera entenedora, serien informació.
- Un informe sobre l'evolució de l'atenció al públic amb una valoració de les tipologies d'usuaris i les implicacions socials i institucionals que comporta seria coneixement.
- Saviesa la demostrarien aquells gestors que convertissin aquest coneixement en grans millores en l’atenció que es dona als ciutadans.
Alguns autors han presentat aquest triangle a la inversa. Representaria la situació pròpia d’una societat amb un baix accés al coneixement, per exemple la societat europea del segle XIX i la primera meitat del XX. La piràmide anterior s’uniria a aquesta per sobre formant un rombe. Llegiu-la de baix cap a dalt:
Actualment, ens trobem que la satuació de dades i informativa ens pot portar al punt zero, és a dir la ignorància, però per excés de dades i d’informació:
Marina Garcés. Nova il·lustració radical. Anagrama. 2017
Tot plegat ens porta a una conclusió que expressa molt bé el pedagog australià Neil Fleming i que té molta relació amb el que intentarem fer aquest curs:
Flemming, N. Coping with a Revolution: Will the Internet change learning. 2006
Aquesta darrera afirmació s'accentua amb la popularització de la intel·ligència artificial i singularment de les intel·ligències artificials generatives, amb serveis populars com ChatGPT o Bard. Si fins ara les màquines, autònomament, eren capaces de generar dades i fins i tot oferir-les estructurades com a informació, ara mateix ja generen textos amb pretensió de ser coneixement.
L’objectiu d’aquests continguts no és que us convertiu en mers recopiladors de dades, ni tan sols en mers recopiladors d’informació. Tampoc, a l’altre extrem, que esdevingueu savis o els únics coneixedors de la veritat. L’objectiu és que sigueu capaços de trobar informació amb precisió perquè la vostra organització la pugui convertir en coneixement i que tingueu recursos per afrontar tant l’excés d’informació com les confusions entorn de la certesa i la falsedat que l’acompanyen.
Dades obertes
Dades obertes són dades que s’ofereixen sense restriccions, per ser utilitzades en qualsevol àmbit. Qualsevol usuari pot utilitzar-les, modificar-les combinar-les i compartir-les fins i tot per a usos comercials. Són d’ús lliure i generalment, també, d’accés lliure, tot i que poden tenir costos. A efectes d’aquest curs són un tipus de dades que ens poden ser molt útils en la recerca d’informació, tant aquelles que ofereixen grans empreses com Twitter (mitjançant la seva API) com les que ofereixen les administracions. D'aquestes, més endavant t'explicarem com fer-hi cerques.
Dades massives o “big data”
Les dades massives o "big data" són conjunts de dades que se solen caracteritzar per la seva voluminositat, per la velocitat a l’hora d’accedir-hi i per la varietat (les anomenades tres “v” del big data). No se solen fer servir per trobar-hi informació de detall, cosa que en determinades circumstàncies es pot fer, sinó perquè amb programes d’intel·ligència artificial permeten descobrir correlacions entre les mateixes dades que poden resoldre un determinat problema. L’exemple clàssic és quan l’observació de les cerques sobre medicaments per a la grip a Google permetia dibuixar, perfectament, el mapa de l’expansió d’aquesta epidèmia anual als EUA.
Mayer-Schömberger & Cukier. La revolución de los datos masivos. Turner Nogma. 2013
La intel·ligència artificial que opera amb les dades massives no és la denominada simbòlica, que es basa en l’aprenentatge d’algunes regles per imitar el comportament humà, sinó la que aprèn directament de les dades, buscant-hi regularitats mitjançant algoritmes de mineria de dades, descobrint i aprenent directament les regles que les regulen (aprenentatge automàtic o “machine learning”) o contrastant i ponderant diverses anàlisis seguint el model de les connexions neuronals (aprenentatge profund o “deep learning”).
A efectes d’aquest curs, les dades massives combinades amb la intel·ligència artificial t'interessen perquè són part principal de la complexitat que ha anat imperant a Internet i que et fa difícil d’accedir a la informació que et convé: sovint, quan cerques alguna cosa, la intel·ligència artificial ja sap qui ets, gràcies a l'anàlisi d'aquestes dades massives, i canvia allò que les pantalles t'ensenyen. Ho trobaràs explicat a l'apartat sobre la "bombolla de filtres", en aquesta mateixa unitat.
Christian Rudder. Dataclismo. Aguilar. 2016
Pedro Domingos, The master algorithm. Penguin. 2017
1.4 Com cercar a Internet
Aquest material vol donar-te eines i capacitats per fer bones cerques a Internet. Cercar a Internet vol dir fer-ho en àmbits tan diversos com simples dades (que poden ser estructurades en bases de dades o no) o en informació contextualitzada i elaborada, sobretot si busques en webs o en xarxes. En qualsevol cas, convé que no et perdis en la recerca ni sucumbeixis a les crides d’atenció distractores que la xarxa et fa de manera intel·ligent sempre que t'hi emergeixes.
El miratge de la bombolla de filtres
Abans d'endinsar-nos en el mètode per cercar informació a Internet, cal que tinguis present una distorsió que t'afectarà. La major part dels grans serveis d’Internet d’ús massiu com els cercadors o les grans xarxes socials mostren la informació adaptada a les “necessitats” dels usuaris d’acord amb les dades que han recollit d’ells mateixos. És a dir, una cerca a Google o dins d'una xarxa social, a priori no donarà el mateix resultat si la fas tu o si la fa la persona que tens a la taula més propera, ja que hi influiran les cerques i les decisions que tu mateix o aquesta persona heu adoptat amb anterioritat. És el que Eli Pariser va batejar com a “bombolla de filtres” i que molts anomenen "sitges". La bombolla de filtres pot portar a l’autoengany amb molta facilitat.
Eli Pariser. El filtro burbuja. Taurus. 2017 (2011)
La bombolla de filtres no és necessàriament negativa. Per exemple, si sempre fas cerques semblants i acabes anant a parar a les mateixes pàgines i és això el que vols, t'ajudarà a ser eficient. Però si vols fer una cerca començant des de zero i sense condicionants previs, et pot arribar a enganyar i a fer perdre eficàcia.
Idealment, per sortir de la bombolla de filtres, hauries de ser un usuari verge, que entra a Internet per primera vegada. Això és impossible si estàs llegint aquest text, però sí que pots adoptar algunes mesures (valorant, prèviament, si et convé adoptar-les). Per exemple:
- combinar diverses eines de cerca
- instal·lar un navegador nou i usar-lo per a la cerca
- esborrar les galetes del teu navegador
- combinar diversos dispositius des dels quals fas la cerca
- vetllar per fer la cerca des de fora de l'usuari del cercador (cosa que no sempre tenim present, ja que en el cas de Google, sovint fem servir altres serveis que ens fan estar-hi contínuament connectats).
Michiko Katukani. La muerte de la verdad. Rústica Ensayo. 2019
Renée DiResta, "Social Network Algorithms Are Distorting Reality By Boosting Conspiracy Theories”, FastCompany 2016
Entendre bé les característiques de l’encàrrec
Anem a cercar. Com a pas previ, és molt important que qui et fa l’encàrrec de cerca et defineixi bé l’objectiu i caldrà que li facis totes les preguntes necessàries perquè quedin definits els límits d’allò que se t'encarrega (temporals, conceptuals, etc.). Hauràs de fer preguntes del tipus:
- Què és exactament el que se'm demana?
- Des de quina data fins a quina data he de cercar?
- Quin grau d’aprofundiment ha de tenir la informació?
- Només notícies? També el que diu la gent? Només el parer dels polítics? Només…? També…?
- Quin abast geogràfic ha de tenir la cerca? Només Barcelona? Només Catalunya? Només…? També…?
Ha de quedar clar si has de cercar només una informació molt concreta (per exemple, els estatuts d’una entitat) o el màxim d’informació rellevant sobre un tema (per exemple, tot el que se sàpiga sobre un determinat incendi en un pis per motius energètics), ja que la manera d’abordar la cerca serà totalment diferent.
Definició del tema i l'àmbit de cerca
La conversa d’aclariments previs t'ha de permetre definir ben clarament el tema, sobretot per aconseguir acotar la cerca. És bo que en coneguis els límits, tant conceptuals com temporals o geogràfics. Sense una descripció clara del tema, difícilment aconseguiràs fer una cerca precisa. Els límits, d’altra banda, et permetran explotar al màxim les possibilitats de filtratge que tenen els formularis de cerca avançada.
Si la conversa prèvia t'ha permès de delimitar clarament els objectius, estaràs en condicions de definir l’àmbit de cerca, és a dir, les fonts d’informació que et miraràs i les que no caldrà mirar. Trobaràs una classificació de fonts d’informació a Internet més endavant.
Si has de recollir informació que fa referència a una qüestió d’actualitat que s’ha escampat pels mitjans, hauràs de cenyir-la als mitjans i aquelles plataformes en què la gent comparteix les informacions. En canvi, si és una informació que té implicacions administratives, potser et caldrà recórrer a algun set de dades obertes de l'Administració. Si, a més, té un component sociològic o demogràfic, hauràs d’ampliar l’àmbit a les dades i els estudis dels grans organismes estadístics o, si escau, a bases de dades del món acadèmic. Més avall trobaras tipologies de fonts que et permetran reflexionar sobre quines són les que et convenen més.
Elecció de les paraules o expressions de cerca
Com que el nostre principal instrument de treball seran els cercadors (siguin els genèrics d’Internet, siguin de caràcter temàtic o especialitzat, siguin els que van associats a bases de dades) hauràs de tenir clar quines paraules clau o expressions de cerca utilitzaràs i com és *(que pot ser un concepte únic pluja de fang o el sumatori de pluja + fang, però de vegades t'interessarà excloure algun element, per exemple pluja però no pluja àcida o bé casos de tries alternatives (una altra), per exemple pluja o pedregada (i tenir totes les cerques de pluja i totes les de pedregada).
Triar les paraules adequades t'ajudarà a obtenir una resposta òptima, però també t'estalviarà molt de temps perdut descartant innombrables enllaços o documents que per algun motiu la teva tria evoca i que no necessites per a res.
Caldrà que decideixis quina és la paraula més útil i més concreta en cada cas. Si fas servir paraules que tenen molts significats, però hi ha un sinònim més específic, potser et sortirà més a compte triar el sinònim. Tot i això, caldrà valorar-ho, ja que aquesta mateixa decisió et podria portar a confusió.
Elecció de les eines de cerca i la modalitat
Decideix les eines de cerca més útils segons l’àmbit (que hem descrit com les fonts on vols buscar) i les paraules de cerca escollides. Normalment aquestes eines són
- cercadors (com ara Google)
- directoris, que mostren la informació estructurada (com ara DMOZ)
- cercadors o directoris especialitzats (com ara Dialnet)
- sets de dades (com ara Dades obertes Gencat)
També en aquest punt hauràs de decidir, en el cas dels cercadors que tenen cerca ordinària i cerca avançada, quina és la que et convé més. Si en la definició has marcat una delimitació temporal, segurament et caldrà una cerca avançada en aquells cercadors que permeten definir dates. Si tens una combinació complexa de paraules (paraules que sí que vols que surtin o que surtin plegades, paraules que no han de sortir, etc.), segurament també et caldrà fer una cerca avançada o bé optar per operadors de cerca, que exposarem més endavant.
Has de tenir present, així mateix, que disposem també dels xatbots basats en intel·ligències artificials generatives, capaços de produir continguts elaborats a partir d'una determinada cerca, interrogant-los en llenguatge natural (és a dir, tal com parlem habitualment o escrivim). No són pròpiament cercadors, però sí que integren funcions de cerca i poen informació a partir de la qual generen els textos. Per tant, són eines més avançades que els simples cercadors. En determinats casos, a més, els cercadors els integren a la seva interfície. L'exemple més desenvolupat en el moment de fer aquesta actualització és el de Bing, que integra ChatGPT a la seva interfície i el més semblant a un cercador per la claredat amb què mostra les fonts d'informació és Perplexity AI, que ens busca informació sobre un tema i la redacta assenyalant d'on treu cadascuna de les afirmacions que fa. Trobaràs aquests recursos explicats amb detall més avall.
Cerca
És el moment clau. Has de traslladar tota la reflexió que has fet a una o diverses accions concretes de cerca. Sovint serà una tasca repetitiva (dependrà del nombre de paraules o expressions de cerca diferents que hagis determinat). Ha de tenir present, així mateix, que cada eina de cerca t'oferirà els resultats de manera diferent. En aquest punt i tenint en compte el problema que suposa la bombolla de filtres, has de ser acurat de no caure en paranys com els següents:
- Mirar només la primera pàgina (pot ser que sigui la més afectada per la teva bombolla de filtres)
- Repetir una cerca que ja has fet moltes vegades abans sense netejar les galetes de l’ordinador (les cerques que has fet amb anterioritat i els enllaços seleccionats poden condicionar la cerca actual)
- Deixar-te emportar pel suggeriment automàtic de cerca o per les informacions publicitàries que t'oferiran junt amb els resultats. Has de tenir sempre al cap les definicions que has establert.
- Deixar-te emportar, en definitiva, per hàbits de comportament que has adquirit fent cerques poc compromeses i que et poden induir a error si fas cerques més complexes o més delicades professionalment.
Val la pena que valoris si, per estalviar que la bombolla de filtres t'afecti (és a dir, que tot allò que has cercat amb anterioritat condicioni la cerca actual) potser et convé netejar el navegador, esborrant-ne les galetes. Però si, justament, allò que has de cercar ja ho has trobat totalment o parcialment en cerques fetes els dies anteriors, potser el que et convé és aprofitar-te de l'aprenentatge sobre els teus hàbits que han fet els cercadors. Una cosa tan òbvia com l'historial del navegador (que inclou un cercador propi) et pot permetre recuperar cerques òptimes realitzades amb anterioritat.
En l'apartat "Posem-nos a cercar", que trobaràs més avall, trobaràs tota la informació que necessites per ser ben productiu en aquest moment clau i saber totes les possibilitats que tens.
Calibratge dels resultats
Has d’analitzar els resultats obtinguts i sotmetre’ls a una mirada crítica. No tots són iguals. Per fer-ho, has de valorar aspectes com els següents:
- Fiabilitat del resultat obtingut. Si els resultats obtingut et porta a una font oficial, cal entendre que oferirà la màxima fiabilitat des d’un punt de vista administratiu (que és el nostre).
- Impacte de la font.
Recopilació i homogeneïtzació del resultat
Si has obtingut resultats procedents de fonts diferents, caldrà que els recullis i els homogeneïtzis per facilitar-ne la consulta. De vegades n’hi haurà prou a enganxar els resultats en un processador de textos, però de vegades et caldrà usar eines digitals que facilitin la feina, per exemple quan treballes amb enllaços. Potser, simplement, hauràs de buscar eines que et facilitin la descàrrega massiva d’enllaços per no haver-te de passar hores copiant i enganxant.
En aquesta fase l’important és poder tenir la informació obtinguda en un format senzill, clar i homogeni, que sigui entenedor i pràctic tant per a tu com per a les persones a qui hagis de presentar els resultats.
En la fase de recollida de resultats, et poden resultar molt útils eines d’emmagatzematge i gestió d’enllaços, entre les quals en destaquem algunes:
Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços. Es pot generar un RSS amb els enllaços declarats públics, fet que els permet compartir fàcilment. Utilitzant programes d'automatització com IFTTT pots exportar-los massivament cap a fulls de càlcul en línia, etc.
Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços i mitjançant el servei d'automatizacions Zapier, es pot generar un RSS per si es volen compartir automàticament (però no és fàcil)
Característiques: és l'eina de gestió d'enllaços de Google. Té connectors no oficials per a Chrome i Mozilla
També et poden resultar útils eines que permeten descàrregues massives d’enllaços perquè els puguis exportar cap a llistes, documents, etc. A continuació te n'oferim alguns:
Establiment dels primers paràmetres de seguiment
Recollir els resultats avui no és igual que recollir-los demà en un món en canvi constant com és el digital. A la Unitat 2 del curs aprofundirem en tècniques i eines de seguiment i monitoratge, però és bo que en aquest punt comencis a tenir clar allò que, després, t'interessarà seguir o tenir vigilat per si canvia.
En aquest sentit, és bo distingir entre cerques que fas de manera habitual, que cal que conservis i sobre les quals podràs fer una estratègia de seguiment, d'aquelles cerques que saps que no tornaràs a fer mai més. Sembla una obvietat, però salvar una cerca que has plantejat acuradament és una bona pràctica de gestió de coneixement i et permetrà, després, automatitzar-ne el seguiment.
1.5 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials
Quan busques informació a Internet, has de tenir clara una distinció que et pot estalviar feina. És la distinció entre fonts primàries i secundàries: fonts primàries són aquelles que s’observen directament d’una realitat i no han estat processades de cap manera, mentre que les secundàries ja han estat objecte d’algun treball.
D’altra banda, et convé adoptar certes prevencions davant el tipus de font, ja que a Internet hi ha moltes veus i és recomanable anar, sempre, a les més fiables. Al mateix temps, mira de recórrer primer a aquelles que t'estalviaran temps, és a dir, les que ja saps que et seran més útils per la quantitat de recursos que contenen.
És bo, també, tenir clara la distinció entre font interna i font externa. Per exemple, el web d’una institució és una font interna d’aquesta institució. Les crítiques que en fan als webs de sindicats o usuaris són fonts externes per a aquesta institució.
A continuació trobaràs diversos tipus de fonts i la manera d’accedir-hi.
Fonts | Descripció | accés |
---|---|---|
Fonts oficials de l'Administració | Aquells llocs web o recursos propis de la Generalitat o de la institució on treballem. Les administracions disposen de moltíssimes dades i informacions publicades a Internet. Hi podem trobar des dels repositoris de dades obertes fins a publicacions oficials (DOGC, BOE, BOP, etc.), grans repositoris d’informació estadística (IDESCAT, CEO, INE, etc.), publicacions pròpies de les mateixes administracions (per exemple, les publicacions de la Generalitat), els webs de l’administració (gencat.cat, bcn.cat, etc.) i els canals de les administracions en xarxes socials. | Per la seva amplitud, les fonts oficials a Internet tenen mètodes d’accés ben diversos, però en la majoria de casos inclouen motors de cerca ben útils i amb nombroses prestacions. |
Fonts acadèmiques o científiques | En què la mateixa comunitat acadèmica i científica ens ofereix garanties de fiabilitat i en què hi ha repositoris riquíssims. Hi ha des de repositoris científics de les universitats (cadascuna sol tenir les seves) fins a recursos compartits com el web de tesis doctorals en línia, directoris amb producció científica o tècnica que respon a un determinat context o grans bases de dades de recerca acadèmica siguin pròpies del context universitari (com Dialnet, entre moltes d’altres), siguin amb format de xarxa social (academia.edu, researchgate.edu, etc.), siguin promogudes per institucions o per les grans empreses digitals globals (Google Scholar, Microsoft Academic). | La majoria de fonts científiques i acadèmiques inclouen potents motors de cerca amb nombroses prestacions, tant bàsiques com avançades. |
Fonts divulgatives | Obres de consulta que volen explicar la realitat, amb el benentès que poden tenir biaixos propis dels seus promotors empresarials (per exemple, les enciclopèdies privades en línia) o del mateix consens i discrepància dels elaboradors (per exemple, la Viquipèdia) | La major part de fonts divulgatives en línia inclouen cercadors. |
Fonts corporatives d’organitzacions i empreses | Tenen la garantia de ser l’òrgan “oficial” de la mateixa organització o empresa i, també, els biaixos propis d’aquestes organitzacions. Són, essencialment, webs d’empreses, entitats, fundacions, etc. | Són organitzacions que la major part de vegades ofereixen la informació en web i no sempre disposen de bons cercadors, de manera que, sovint, per accedir-hi, cal recórrer a cercadors d’abast general a Internet com Google. |
Fonts de mitjans de comunicació | Prioritzarem les que ofereixin una alta fiabilitat i professionalitat i en què el contrast i la verificació d’informació. La darrera part d’aquest curs ens donarà eines per ser acurats en abordar-los. | S’ha generalitzat l’estàndard d’incloure, dins de tots els mitjans, algun motor de cerca, que no sol tenir grans prestacions, però sí que permet fer cerques bàsiques per paraules. Tot i això, hi ha algun mitjà que no en té. |
Catàlegs i repertoris bibliogràfics en línia | Ens ofereixen les obres disponibles en biblioteques, centres o llibreries. En alguns casos, fins i tot amb accés directe a les obres (si estan digitalitzades i són d’accés lliure). | Els mateixos catàlegs solen incorporar sistemes de cerca. |
Fonts 2.0 | Sorgides dels grans formats participatius d’Internet: blogs, xarxes socials, etc. No parlem de les aportacions oficials que hi fan les administracions o les empreses (que considerarem fonts pròpies o corporatives) sinó de les dels mateixos usuaris. | Les xarxes socials, generalment, incorporen algun tipus de motor de cerca per accedir i trobar-hi informació. |
1.6 Eines de cerca: aproximació i ús avançat
A Internet hi ha eines de cerca molt diverses. La gran majoria es basen en la cerca a partir de paraules introduïdes en una determinada boca de cerca. Aquest és el paradigma dominant a Internet des que van aparèixer els primers cercadors com Altavista o Yahoo, tot i que va ser Google qui va revolucionar el panorama a partir del tombant de segle.
Actualment, ja hi ha cercadors que parteixen de principis diferents. Google mateix ofereix la possibilitat de carregar una imatge i a partir d’aquí cercar altres imatges relacionades.
Cercadors i tipus de cercador disponibles
Quan hem parlat de fonts d’informació disponibles a Internet hem vist que n’hi havia de molts tipus. Algunes d’aquestes fonts disposaven de cercadors propis, de caràcter específic. D’altres, en canvi, són només accessibles mitjançant cercadors generals. A continuació et presentem una llista de cercadors que et poden ser més útils, amb un breu comentari.
Cercadors d’abast general (cerquen en el conjunt d’Internet)
Els cercadors d'abast general són eines d'una gran capacitat i d'ús massiu en la modalitat de cerca simple. El més usat és Google. A efectes d'aquest curs és important que tinguis presents algunes qüestions:
Quan fem una cerca en un cercador d'abast general no podem mirar-nos només els resultats que ofereix la primera pàgina fent-hi una cerca simple, hem de ser capaços de fer cerca avançada (utilitzant operadors o formularis) i d'explotar les eines de postcerca. Això ens permetrà obtenir resultats acurats.
Vegeu alguns dels cercadors d'abast general i algunes idees claus sobre cadascun que et suggerim de retenir:
- http://www.google.cat: és el cercador més popular, molt útil en cerca simple, però més útil encara en cerca avançada i mitjançant operadors. Té un xatbot d'intel·ligència artificial relacionat, Bard, però en el moment d'actualitzar aquest curs encara no l'ha integrat a la interfície.
- http://www.bing.com: és el principal competidor de Google, propietat de Microsoft i en determinats aspectes molt competitiu. Un dels avantatges que té i que facilita molt el seguiment del canvi que abordarem a la Unitat 2 és que permet generar canals RSS de les cerques mitjançant l'addició de la cadena &format=rss a la URL del resultat. És el primer que ha integrat de manera senzilla una interfície de xatbot d'intel·ligència artificial amb el qual podem dialogar un cop tenim els primers resultats del que hem cercat.
- http://www.DuckDuckGo.com: tercer principal cercador de caràcter genèric, ofereix nombroses garanties en privacitat i té característiques que el fan força diferent dels altres. Durant uns mesos de l'any 2022 ha integrat en la versió anglesa DuckAssistant, un xatbot d'intel·ligència artificial basat en ChatGPT, però en el moment de tancar aquesta actualització del curs, ja no l'ofereix.
- http://yahoo.com: un dels cercadors més antics, ofereix bons resultats en determinats aspectes com les notícies.
- https://www.wolframalpha.com: té un plantejament diferent de tots els altres cercadors ja que no ofereix enllaços sinó informació elaborada.
Cercadors per a xarxes socials
Després d'uns anys en què hi havia força cercadors per a les xarxes socials, la majoria d'eines han anat quedant obsoletes a causa de la impossibilitat d'aconseguir un bon model de negoci. Queden els cercadors que proporcionen les mateixes xarxes, que en algun cas són excepcionalment útils (és el cas de Twitter) i alguna eina que actua com a metacercador, obtenint dades de xarxes socials filtrades dels cercadors clàssics. A continuació en comentem tres casos. Més endavant, en tractar cercadors com DuckDuckGo, veuràs que mitjançant l'eina Bang! pots cercar directament en algunes xarxes.
- http://search.twitter.com: és el cercador propi de Twitter amb un bon sistema de cerca avançada. Cal vetllar en les opcions de filtre quan ofereix els resultats, ja que la primera pantalla prioritza la rellevància i no l’actualitat, però ofereix una pestanya “últims” per seleccionar les piulades més actuals.
- Cercador de Facebook. Cal accedir-hi des de la mateixa xarxa social. El principal interès no és tant en el resultat que ofereix quan fas la primera cerca com en les eines de filtratge que complementen el resultat i que t'ofereix tant en el menú superior com en el lateral esquerre. Aquí en tens l'aspecte:
- https://www.social-searcher.com/: mitjançant Google, fa una cerca bastant útil d’actualitzacions en les principals xarxes socials
Cercadors de caràcter acadèmic
El món acadèmic i científic genera informació rigorosa sobre multitud de temes. Si vols fer cerques d'informació acurades, sovint hi hauràs de recórrer, ja que, sigui quin sigui el teu àmbit de treball, ben segur que des del món acadèmic o de recerca hi ha persones que l'estudien i hi aprofundeixen. En termes generals, trobem tres models de cercadors de caràcter acadèmic:
- Els que es basen en el rastreig de la xarxa que ja fan habitualment per proveir els seus cercadors ordinaris. És el cas de Google i Microsoft.
- Els que es basen en grans repositoris acadèmics. És el cas de Dialnet o el cercador de tesis TDX.
- Els que funcionen com a xarxes socials en què els mateixos científics comparteixen els seus "papers".
Et presentem a continuació alguns exemples d'aquest tipus de cercadors:
- https://scholar.google.com/: una eina específica de Google sobre continguts acadèmics i científics
- http://academic.microsoft.com: l’eina científica i acadèmica de Microsoft, que competeix amb la de Google
- https://dialnet.unirioja.es/: directori i cercador acadèmic del món hispà amb gran quantitat de continguts
- http://tdx.cat: tesis doctorals catalanes en línia
- http://academia.edu: repositori elaborat pels mateixos científics i acadèmics que funciona com a xarxa social (t'hi hauràs de donar d'alta, però és fàcil)
- http://www.researchgate.com: similar a l’anterior (t'hi hauràs de donar d'alta, però és fàcil)
- https://www.semanticscholar.org/: basat en intel·ligència artificial, es considera un cercador acadèmic de nova generació
Eines de cerca en dades obertes
Mentre que la majoria de cercadors que hem vist treballen sobre informació ja elaborada, la tendència a publicar dades obertes per part de les administracions i altres organismes sovint permet accedir a gran quantitat de dades sense elaborar, però que mitjançant eines diverses es poden convertir en informació ben útil. Les eines que ofereixen per accedir-hi són cada vegada més pràctiques i amb gran quantitat de prestacions.
- https://datasetsearch.research.google.com/: cercador de google especialitzat en sets de dades obertes d'arreu del món
- http://governobert.gencat.cat/ca/dades_obertes/: repositori de dades obertes de la Generalitat de Catalunya, basat en l'aplicatiu Socrata, amb un cercador de sets i una eina per explotacions i cerques internes amb múltiples possibilitats.
- https://opendata-ajuntament.barcelona.cat/: respositori de dades obertes de l’Ajuntament de Barcelona
- https://datos.gob.es/: portal de dades obertes de l’administració de l’estat
Cercadors de notícies
Els principals cercadors de notícies són els següents:
- http://news.bing.com (indexa en català)
- https://news.google.com (indexa en català)
Finalment, cada mitjà disposa, generalment, d'un cercador propi. N'hi ha que ofereixen els resultats per un únic criteri de rellevància i no sempre són útils, però n'hi ha que permeten endreçar-los per data (posant la més recent davant). Aquests resulten especialment útils.
Cerques millorades amb l'ús de serveis de xatbot d'intel·ligències artificials generatives
Entre la tardor de 2022 i l'estiu de 2023 va tenir lloc una gran popularització de serveis de xatbot basats en intel·ligències artificials de caràcter generatiu. Es tracta d'instruments "entrenats" amb dades que generen text a partir dels textos que han processat prèviament i, doncs, poden ser una eina útil per millorar les cerques. En alguns casos, fins i tot, es troben integrades al cercador. El resultat que ofereixen es troba entre la simple informació i el coneixement, ja que treballen amb models de llenguatge que els permeten atendre les consultes, però també donar respostes, en llenguatge natural. Els més populars, a més, funcionen en català amb força normalitat. Són els següents:
- ChatGPT (https://chat.openai.com/) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural. Desenvolupada per l’empresa OpenAI mitjançant models de llenguatge natural GTP-3 i GTP-4, pot generar tota mena de textos (incloent-hi, doncs, notícies i similars). Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua. Es troba integrat directament a la interfície del cercador Bing, per millorar-ne les respostes, i durant un temps, una variant va estar integrada al cercador DuckDuckGo.
- Bard (http://bard.google.com) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural, desenvolupat per Google. Basat inicialment en la família LaMDA de grans models de llenguatge (LLM) i més tard en PALM, pot generar tota mena de textos (incloent-hi, doncs, notícies i similars). Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua. Pertany a Google, que previsiblement l'anirà integrant en el seu cercador.
- Perplexity (http://perplexity.ai) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural. Té un funcionament similar a un cercador i està especialment orientat a documentar-se sobre un tema. El principal avantatge és que amb una nota ens remet a la font de cada afirmació que fa. És doncs el servei més transparent quant a l’origen de la informació, però no està exempt d’introduir falsedats. Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua, encara que alguna vegada salta a l’anglès.
A l'apartat següent et facilitarem consells per redactar indicacions ("prompts") útils i productives en un àmbit de cerca amb aquest tipus d'eines.
1.7 Posem-nos a cercar
Cerca simple
Si utilitzes la primera boca de cerca que t’ofereix el cercador, tingues present el que hem comentat en parlar de les paraules de cerca sobre la conveniència de triar-les bé. Tingues present que com menys paraules i més específiques, més fàcil serà trobar el resultat. D’altra banda, per evitar confusions, prescindeix de signes de puntuació o tipogràfics i no et refiïs de les distincions entre majúscules i minúscules o dels accents diacrítics, ja que la gran majoria de cercadors ignoren aquests detalls.
Google i Bing, que són els principals cercadors, han basat el seu èxit en el bon funcionament de la cerca simple.
Introducció a la cerca amb operadors i avançada
La majoria de cercadors ofereixen, a més de la cerca simple, eines per fer cerques més acurades. Ho fan mitjançant els formularis de cerca avançada, que proporcionen un entorn usable que simplifica la tasca, o mitjançant la introducció d'operadors. En un primer moment i en determinades circumstàncies, els formularis de cerca avançada et resultaran molt útils, però si aprens uns quants operadors hi acabaràs guanyant tant en velocitat com en precisió.
Bàsicament, la cerca avançada es basa en dos tipus de tasca:
- Controlar la manera com es relacionen els diversos elements de la cerca entre ells (si hi han d'aparèixer tots, si han de sortir en el mateix ordre, etc.) o bé si cal excloure'n algun. És el territori dels operadors booleans.
- Filtrar, és a dir, restringir els resultats a una determinada tipologia (un determinat tipus de fitxer, una determinada ubicació en la xarxa, una determinada datació), etc.
El formulari de cerca avançada de Google és paradigmàtic per la quantitat de possibilitats que ofereix i és bo que sigui el primer amb què et familiaritzis:
Aquí tens alguns exemples de formularis de cerca avançada:
Tipus de cerques amb operadors i avançada
Et presentem a continuació els tipus de cerques que podem obtenir amb operadors i amb cerca avançada. Els cercadors que s'hi consignen són només els més destacats o bé algun que és especialment interessant per com vehicula cadascuna de les cerques (més avall t'explicarem els operadors més útils de cadascun):
cerca | explicació | exemple | operadors | cercadors |
---|---|---|---|---|
expressions literals | Si volem cercar una frase literal, podem recórrer als cercadors de cerca avançada, però convencionalment, els principals cercadors admeten que es pot posar la frase a cercar entre cometes. Això és vàlid tant a Google com als seus principals competidors, Bing i DuckDuckGo | Si escrivim entre cometes "pluja de granotes", els cercadors ens oferiran literalment aquesta expressió i descartaran qualsevol altra combinació de paraules en què apareguin els mots pluja o granotes. | "" | Google, Bing, DuckDuckGo |
operador booleà AND | Present també en els tres principals cercadors, permet garantir que totes les paraules encadenades amb aquest operador seran presents en els resultats que es presentin. En el cas de Bing, també es pot usar l'operador &. | Si escrivim pluja AND granotes apareixeran totes les pàgines on surtin els dos termes, tant les que diuen, per exemple, pluja de granotes com les que diuen la pluja va provocar l'aparició de pèlags que es van omplir de granotes. | AND (Google); AND, & (Bing) | Google, Bing i la gran majoria |
operador booleà OR | Usem aquest operador, present també als tres principals cercadors, per demanar qualsevol dels termes que apareixen a costat i costat de l'operador, tant si hi surten tots dos com si només en surt un. En el cas de Bing, l'operador pot ser OR o bé la barra vertical. | Si escrivim pluja OR granotes apareixeran totes les pàgines on surt pluja i, també, totes les pàgines on surt granotes | OR i la barra vertical | Google, Bing i la gran majoria |
exclusió d’una paraula | De vegades ens interessa que en una determinada cerca no hi surti una paraula per evitar que ens entrin massa pàgines no relacionades. | Si volem que, quan busquem tempestat, NO hi surti cap referència a la pluja, la podem excloure fent aquesta cerca: tempesta -pluja | - | Google, Bing, DuckDuckGo |
inclusió d'una paraula buida | Hi ha paraules que els cercadors consideren buides perquè no aporten cap valor semàntic a efectes de la cerca com conjuncions, preposicions o articles. Només les solen cercar en literals entre cometes. De vegades, però, ens interessa buscar-les encara que no siguin en un literal. | El cercador Bing permet forçar l'aparició de paraules buides posant-hi l'operador +, per exemple pluja +que | + Cal anar amb compte amb aquest operador, ja que té significats diferents segons el cercador | Bing |
ús de comodins | Google ofereix el comodí *, que permet substituir qualsevol paraula o cadena de paraules dins d'una expressió literal, és a dir, buscada entre cometes. | Si busquem "pluja * granotes" obtindrem la cadena pluja de granotes però també documents on apareix pluja i, al cap d'algunes paraules més, granotes. | * | |
prioritzar una paraula | Bing ofereix l'operador prefer: que busca pàgines en què la paraula amb aquest operador hi té un lloc més destacat o important que les altres | Si busquem pluja prefer:neu, buscarà pàgines amb les dues paraules però prioritzarà neu. | prefer: | Bing |
cenyir a un lloc web | Permet reduir l'abast de la cerca a un únic lloc web o plataforma. | Si ens interessa buscar pluja només al portal de la Corporació Catalana de Mitjans Audiovisual, podrem restringir-hi mitjançant pluja site:ccma.cat | site: | Google, DuckDuckGo, Bing |
excloure un lloc web | Permet excloure de la cerca un determinat lloc web o plataforma. | Si ens interessa buscar pluja però descartar els resultats de la Corporació Catalana de Mitjans Audiovisuals, podrem filtrar-ho mitjançant -site:meteocat.cat | -site: | Google, DuckDuckGo, Bing |
cercar llocs similars | Cerca llocs amb coincidències de contingut amb un lloc determinat | Si escrivim pluja related:ccma.cat ens buscarà llocs amb continguts similars als de la Corporació Catalana de Mitjans Audiovisuals | related: | |
cenyir a un sol tipus de fitxer | Ens permet triar el tipus de fitxers que volem trobar, entre els moltíssims fitxers disponibles | Si només volem fitxers amb l'extensió PDF haurem de fer la cerca així: pluja filetype:PDF. | filetype: | Google i DuckDuckGo |
cercar dins els caràcters de la URL | De vegades, el nom del domini o els directoris que completen la URL aporten informació rellevant; amb això podem buscar-hi dins | Si busquem pluja inurl:previsio ens aportarà resultats que tinguin la paraula pluja dins de la pàgina i la cadena previsio dins del text de la URL. Per exemple:https://www.ccma.cat › el-temps › previsio › pluges | inurl: | Google, DuckDuckGo |
cercar en el camp TITLE | Cada pàgina web té un títol que és el que apareix a la pestanya del navegador i és un contingut clau per als cercadors. Podem fer que un text tingui una determinada paraula en aquest camp. | Si busquem pluja intitle:aiguat buscarà pàgines que a l'interior tinguin la paraula pluja i al camp TITLE tinguin aiguat. | intitle: | Google, Bing |
cercar pàgines que enllacin a una altra | De vegades ens interessa buscar en pàgines que estiguin enllaçades ab una determinada pàgina. | Podem buscar la paraula pluja en totes les pàgines enllaçades amb Gencat escrivint: pluja link:gencat.cat | link: | Google, Bing |
cercar números en un interval | Cerca, a més de la paraula que busquem, que en la mateixa pàgina hi hagi una xifra que es trobi dins de l'interval demanat. | Volem buscar pàgines on surti la paraula pluja però que facin referència només a les que van tenir lloc als anys 60, doncs podem fer una cerca del tipus pluja 1960..1969 | .. | |
filtrar per llengua | Podem restringir la cerca només a pàgines en una determinada llengua. | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per àmbit territorial | Podem restringir les cerques a pàgines d'un determinat territori en el món. | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per data d’actualització | Podem restringir la cerca a un determinat rang de dates per obtenir només pàgines creades o actualitzades en un període concret | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar contingut sexualment explícit | Podem excloure de la cerca la pornografia o altres continguts no adequats per a menors | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari | |
filtrar per drets d’ús | Podem cercar pàgines amb diversos tipus de cessions de drets d'ús per poder-ne reutilitzar els continguts garantint que no incorrem en anomalies jurídiques | En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable | accés per formulari |
Llista d'operadors vàlids als principals cercadors
Operadors de Google
operador | explicació i exemples |
---|---|
“” | El que posem entremig de cometes serà la cadena exacta de paraules que buscarà, per exemple “pluja de granotes” només oferirà documents on surt, exactament, “pluja de granotes”. |
OR | És un operador que ens mostrarà aquells resultats relacionats amb qualsevol de les dues paraules entre les quals l’introduïm. Per exemple: pluja or vent ens oferirà resultats tant de pluja com de vent. |
AND | (que també pot ser “+”. Ofereix aquells resultats on apareixen les dues paraules entre les quals el posem. Pere exemple, pluja and vent ens oferirà resultats que parlin de pluja, però que també parlin de vent. |
- | El símbol de restar davant d’una paraula farà que aquesta no aparegui. Per exemple, si posem pluja -vent sortiran aquells documents on surt pluja, però excloent-ne aquells on surt vent. |
* | Si el posem davant d’una cadena de lletres, ens donarà paraules que comencin amb aquesta cadena. Si posem *fisio ens sortirà fisioteràpia, fisiologia, etc. |
define: | ofereix la definició de la paraula que hi posem al darrere. Així, define:pluja ens definirà pluja. |
site: | cenyeix la cerca a la URL (URL és l’adreça que escrivim a la barra de navegació quan volem accedir a una pàgina) que hi posem darrere. Així pluja site:meteocat.cat ens oferirà la paraula pluja només a meteocat.cat. |
info: | mostra totes les entrades que Google té de la URL que hi posem darrere. Així, info:meteocat.cat ens ensenyarà tot allò que Google té de meteocat.cat. |
related: | busca llocs similars a la URL que s’hi posa al darrere. Així, si posem a Google related:google.com, el cercador es veu obligat a mostar-nos la seva competència, pobre |
link: | localitza pàgines que enllacen a la de la URL que hi posem darrere |
cache: | mostra la pàgina tal com era el darrer cop que Google la va visitar |
filetype: | cenyeix la cerca al tipus d’extensió de fitxer que s’hi posa al darrere (per exemple: filetype:pdf, txt, doc…), és a dir, pluja filetype:pdf si volem els pdf que parlen de pluja. |
inurl: | cerca la paraula que s’hi posa al darrere o les paraules que s’hi posen darrere dins de la URL de la pàgina |
allinurl: | és com l’anterior, però cerca que hi siguin totes les paraules (com si hi hagués ‘and’ entre elles) |
inanchor: | és com inurl, però cerca dins del text que identifica àncores (enllaços interiors de pàgina) |
allinanchor: | és com allinurl però amb àncores |
intitle: | és com inurl però cerca dins del camp títol que tenen totes les pàgines web |
allintitle: | és com allinurl però dins del camp títol |
@ | davant d’una paraula, cerca usuaris de Twitter |
# | davant d’una paraula, cerca l’etiqueta a Twitter |
$ | davant d’una xifra i darrere d’un producte, busca on s’ofereix aquest producte per aquest preu |
.. | permet fer cerques que responguin a l’interval. Per exemple, si busquem ‘televisor 200€..300€ ens buscarà televisors per aquest preu i si busquem ‘Montblanc 1400..1425” ens buscarà la paraula Montblanc en pàgines on també aparegui qualsevol xifra entre 1400 i 1425 |
Operadors de Bing:
operador | explicació i exemples |
---|---|
+ | permet trobar tots els termes que el porten davant incloent-hi termes buits, que normalment no es tenen en compte (preposicions, articles, etc.) |
“” | permet trobar cadenes exactes (com en Google) |
AND i & | busca totes les pàgines que contenen els termes encadenats amb aquests operadors |
NOT i - | exclou les paraules precedides per aquests operadors |
OR o barra vertical | inclou les paraules que contenen una o altra paraula separades per aquest operador |
contains: | cerca pàgines que incloguin fitxers amb el tipus de contingut que s'hi especifica. Per exemple, si posem pluja contains:gif ens buscarà pàgines amb la paraula pluja on hi hagi algun fitxer GIF enllaçat |
ext: / filetype: | cerca pàgines amb l'extensió que busquem, per exemple PDF |
inanchor:, inbody:, intitle: | cerca la cadena dins del l'àncora, el cos del text o el camp títol de la pàgina |
ip: | cerca pàgines allotjades a la IP que s'indica (la IP són 4 números separats per punts) |
language: | cerca pàgines escrites en la llengua indicada (amb codis del tipus: FR, ES, CA, etc.) |
loc:, location: | restringeixa una determinada zona o regió |
prefer: | de les diverses paraules que formen la cerca, quina és la que és més important que surti. Per exemple pluja prefer:neu. Sortiran documents amb les dues paraules, però prioritzarà les que inclouen neu |
site: | restringeix a una determinada URL |
feed: | restringeix la cerca a canals RSS d'una determinada temàtica. |
hasfeed: | cerca pàgines de les quals penja un feed del tema indicat |
url: | comprova sil a URL que aportem està indexada a Bing |
Operadors de DuckDuckGo
operador | explicació i exemples |
---|---|
“” | retorna la cadena exacta situada entre cometes |
- | exclou la paraula precedida d’aquest signe |
+ | busca els documents on la paraula precedida d’aquest signe surt més |
filetype: | busca els documents que tenen l’extensió especificada |
site: | busca dins d’un lloc determinat |
-site: | exclou els d’un lloc determinat |
intitle: | busca que dins del camp títol tingui la paraula que busquem |
inurl: | busca que dins la URL tingui la paraula que busquem |
\: | ens fa saltar directament al primer resultat sense mostrar-nos el llistat de cerca |
! | És un operador Bang! Permet cercar directament a determinats llocs |
Vegeu alguns dels principals operadors Bang! de DuckDuckgo:
operador | lloc on fa la cerca directa |
---|---|
!w | wikipedia |
!a | amazon |
!tw | |
!ig | |
!fb |
Trobareu tots els operadors Bang!, en aquesta pàgina.
Amb aquestes eines podeu realitzar cerques acurades en els principals cercadors. Els conceptes que aprendreu, us serviran, a més per millorar les cerques quan utilitzeu altres cercadors que tinguin prestacions avançades, encara que tinguin un abast més restringit.
Ús del sistema d'expressions regulars REGEX
El sistema d'expressions regulars REGEX és un sistema de codificació de cerques basades en patrons de paraules. En trobaràs més informació a Viquipèdia i podràs experimentar i fer proves en aquest
Google admet l'ús d'expressions regulars molt simples, però que poden ser molt útils per trobar determinades cadenes literals de mots en combinació.
Postcerca: filtratge addicional i ordenació dels resultats
Un cop obtinguts els resultats, sigui per cerca ordinària, amb operadors o avançada, la major part de cercadors permeten filtrar o ordenar els resultats mitjançant un menú que es troba al capdamunt de la llista de resultats obtinguts.
- En el cas de DuckDuckGo, el filtre postcerca permet filtrar per tipologies de contingut (web, imatges, vídeos, notícies, mapes), per territori, per seguretat de la cerca i per temps.
- En el cas de Bing, el filtre postcerca permet filtrar per imatges, vídeos, mapes, notícies, elements desats (pel mateix usuari, procedents d'anteriors cerques), per data, per llengua i per regió.
- En el cas de Google, el filtre postcerca permet filtrar per imatges mapes, vídeos, productes, llibres, vols, finances (de fet, ho adapta a la cerca que ha fet la persona). Mitjançant l'apartat eines, permet encara altres filtratges addicionals: idioma, moment, etc. Quan apliquem un filtre addicional com el d'imatges, encara obtenim una segona capa de filtres: mida, color predominant, drets d'utilització, tipus d'imatge, hora. L'eina de postcerca de Google és excepcionalment rica.
Cercar en un set de dades obertes
En un primer moment, els repertoris de dades obertes oferien l’accés directe als fitxers, que es decarregaven i es gestionaven des de l’ordinador dels usuaris amb eines com processadors de textos, fulls de càlcul, etc.. Mica en mica, el creixement del nombre de sets de dades disponibles i de la mida i quantitat de dades contingudes en aquests sets va fer que aquest sistema resultés poc útil i les administracions es van procurar eines especialitzades per gestionar i oferir dades obertes com Socrata, que és la que utilitza ara mateix la Generalitat. Altres administracions han optat pel mateix sistema o per sistemes que ofereixen prestacions similars. L’explicació que trobaràs a continuació et servirà, doncs, per a qualsevol repertori de dades obertes.
Imaginem que busquem un contracte menor de l’any passat entre l’empresa X i la direcció general Y del departament Z de la Generalitat.
En primer lloc, obrirem el repertori de dades obertes de Gencat i ens situarem al formulari de cerca per cercar el set que ens interessa. En aquest cas, la paraula de cerca serà “contractes”. Ens sortiran diversos sets de contractes i triarem el de contractes menors.
En aquest punt, accedirem al visualitzador de dades obertes, que ens mostrarà la relació de contractes menors en forma de taula de manera ben senzilla. Si, a més, ho consultem amb un ordinador disposarem de moltes visualitzacions possibles (gràfiques, estadístiques, etc.):
- Obtenir un RSS amb les novetats del set (cada vegada que hi hagi un assentament nou)
- Compartir el set
- Accedir-hi des de diverses modalitats de vista i amb diverses ordenacions
- Filtrar-lo per algun criteri (a partir d'operadors lògics accessibles des de menús i altres opcions)
- Generar visualitzacions gràfiques (amb gràfics estadístics, etc.)
- Exportar les dades a tota mena de formats (CSV, JSON, XML…)
- Encastar-ho
Com que el que ens interessa és una dada concreta, el que farem és buscar la icona de la lupa que ens donarà accés al formulari del cercador. Allí podrem buscar pel criteri que ens convingui (el nom de l’empresa, el nom del departament o de la direcció general, l’import, la data…). Amb això obtindrem la dada exacta que ens interessa.
Encara hi ha alguns sets de dades que no són disponibles amb aquest visualitzador, però es poden descarregar i hi podem treballar i cercar informació des de programes de full de càlcul, etc.
El sistema d’altres sets de dades institucionals, tot i no ser igual és molt similar al de Gencat i les prestacions que ofereix i la manera de cercar-hi informació és la mateixa.
Vegeu alguns llocs de dades obertes que tenim a disposició:
Llocs per cercar dades estadístiques
Hi ha diversos llocs que ofereixen dades estadístiques. L'IDESCAT és l'organisme que, pel que fa a Catalunya, n'ofereix més. El mateix web mostra els sistemes per accedir a la informació, que és molt nombrosa i que pot resultar molt útil. Normalment cal triar el contingut i després el tipus d'estadística concreta que en volem consultar, però el web ofereix moltes maneres d'accedir-hi. A banda de l'IDESCAT també podem trobar molta informació estadística relacionada amb Catalunya al CEO, l'INE i en altres llocs d'estadística de l'administració:
Redacció d’indicacions per a xatbots basats en intel·ligències artificials generatives
Per comunicar-nos amb els xatbots basats en intel·ligències artificials generatives com els que hem presentat més amunt (ChatGPT, Bard, Perplexity), utilitzem indicacions o apunts (en anglès, "prompts"). A continuació, aportarem alguns consells per redactar indicacions amb finalitat de cerca d’informació, és a dir, no orientades a altres possibilitats com podria ser generar textos de ficció, etc.
Les indicacions són l’entrada d’informació que el sistema utilitzarà per desencadenar un determinat resultat. Si és una intel·ligència generativa basada en el text, el resultat serà un text desencadenat per la nostra indicació.
Els elements que aporta la indicació solen ser els següents:
Component | Descripció | Exemple |
---|---|---|
Dades d’entrada o pregunta | És la qüestió per a la qual necessitem una resposta | “Necessito informació sobre el rector de Vallfogona” |
Instruccions | Tasques específiques que volem que el xatbot porti a terme mentre processa la resposta | “Inclou tota la informació que puguis sobre la relació del rector amb el barroc i amb els bandolers” |
Elements de context | Ajudaran a afinar la resposta i evitaran que perdem el temps amb respostes que se’n vagin del tema o en completaran els aspectes que més ens preocupin | “No t'oblidis de parlar de la majordoma i de l'escolà, però no entris en debats sobre el lloc de naixement.” |
Qüestions de format relatives a la sortida | Requisits de forma que ens aniran bé per treballar | “La resposta hauria de tenir un màxim de 300 paraules, que s’han de mostrar en vers, no en prosa.” |
A continuació et facilitem consells per redactar indicacions útils en un procés de cerca d’informació i elaboració de coneixement:
- Comença amb indicacions simples. Centra't doncs en la pregunta a la qual vols obtenir resposta. A partir de la primera resposta que obtinguis, afegeix els elements que t'ajudin a perfeccionar-la.
- Si necessites un text amb moltes parts, t'anirà bé de trossejar la indicació i fer-ne de parcials.
- Com més específica sigui la indicació, assoliràs més precisió. No obstant això, no descartis un tempteig previ d'abast més ampli per veure com respon.
- No dubtis a demanar el format que més et convingui; per exemple: "Diga'm 50 noms de plantes verinoses en català. Utilitza aquest esquema per a cadascuna: -Nom de la planta en català: / Nom de la planta en llatí / símptomes que provoca el seu consum / gravetat".
- Busca la màxima precisió en el tipus de resultat que vols; per exemple: "Explica'm en 3 frases qui era el rector de Vallfogona" i no "Explica'm, resumidament, qui era el rector de Vallfogona".
- Sigues clar i concís, però tingues present que és més important la claredat que la concisió, ja que t’interessa que les respostes siguin precises.
- Aporta el context adequat que sigui rellevant per a la pregunta. T’evitarà confusions i ajudarà a millorar la precisió de la resposta.
- No dubtis a ser específic. Dona detalls. Evita que la resposta es perdi en generalitzacions.
- Proporciona instruccions detallades si és necessari. Especifica el tipus de resposta que esperes (explicació, resum, pros i contres, etc.).
- Especifica la tonalitat o l'estil de resposta desitjats; per exemple: "respon amb un to hostil" o "fes-ho de manera seriosa" o "fes-ho amb un to amigable".
- Demana exemples concrets; per exemple: "Vull el nom de 50 obres d'art contemporani exposades en museus de Barcelona".
- Limita l'extensió i determina la forma; per exemple: "respon en un màxim de 200 paraules", "respon en 300 frases successives", etc.
- No tinguis por de revisar i ajustar el teu indicador si no obtens la resposta desitjada. Experimenta fins a obtenir els resultats que necessites.
- Utilitza el xatbot de manera ètica i evita formular preguntes que puguin promoure contingut ofensiu o inapropiat.
- No l'utilitzis en un entorn professional si no saps quin és el posicionament de la teva organització respecte d'aquesta eina.
Tingues sempre al cap que el nucli de la indicació pot ser, si vols, un comandament imperatiu. Aprèn a jugar amb un repertori d'instruccions del tipus "escriu, classifica, ordena, tradueix, resumeix, programa…", però, sobretot, no posis límits a la curiositat. A continuació t'oferim alguns exemples d'indicacions que et poden ajudar a veure les possibilitats de l'eina:
- "Resumeix en una frase l'aportació del rector de Vallfogona al barroc català."
- "Extreu tots els topònims que surten a l'obra de Cervantes."
- "Classifica les comarques catalanes per prosperitat econòmica i justifica en cada cas la classificació."
- "Contesta aquesta pregunta d'acord amb el to amb què la formulo: Ei, col·lega, què m'expliques de Nietzsche i el cavall?"
- "Programa el codi Javascript necessari perquè un web et pregunti la data de naixement i respongui el signe del zodíac corresponent."
- "Busca la relació entre la seqüència de Fibonacci i els balanços econòmics del sector urbanístic entre 1990 i 2007"
I recorda, sempre, les preguntes clàssiques, com aquesta:
- "On, quan, com i per què va morir Juli Cèsar?"