Nombre de lectures: 0

Unitat 1: La cerca avançada d'informació en un món de dades

1.1 Què faràs amb aquests continguts?
1.2 El bosc s’ha tornat una selva
1.3 Abundància d’informació, importància de les dades
1.4 Com cercar a Internet
1.5 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials
1.6 Eines de cerca: aproximació i ús avançat
1.7 Posem-nos a cercar

1.1 Què faràs amb aquests continguts?

Treballes a l’administració en un entorn totalment assistit per ordinador. Davant dels ulls hi tens una pantalla de l'ordinador del lloc de treball. A la butxaca, segurament, hi tens un mòbil que tant pot ser de treball com de feina. Fins i tot pot ser que en tinguis dos. A casa teva, és possible que tinguis unes quantes pantalles més: la del televisor, la de la tauleta, les dels ordinadors personals, etc.

En aquest mar de pantalles i símbols hi veus de tot: sòrdids documents administratius que són el teu pa de cada dia, però també multitud d’informacions i dades que, ordenadament o desordenadament, hi tenen relació. I a casa, és clar, també veus i escoltes, contínuament, tota mena de continguts digitals.

Avui t’ha sorprès una piulada que parla de l’atenció al públic en el servei on treballes. Sembla que un usuari s’ha enfadat. Un munt de persones l’han repiulada i ara t’arriba que un diari digital n’ha fet una notícia. El teu cap et demana informació sobre tot el que s’ha publicat i sobre el que hi ha al darrere. Com ho fas? Evidentment, el mateix canal pel qual ha arribat la primera informació, Internet, t’hauria de servir per portar a terme aquesta tasca.

Obres Twitter i hi veus de tot: vídeos de gatets, ocurrències, diatribes polítiques i informació sobre el cas que t’ocupa. Però, te’n pots refiar? Et sents com si estiguessis a la selva: lletres, números, vídeos, imatges… Algunes són reals, però d’altres són falses. A més, com a empleat públic, sents la necessitat de prestigiar l’entorn professional que aquesta notícia, com tantes altres, contribueix a embrutar.

Necessites una guia per no perdre’t ni sucumbir en aquest safari de símbols i signes.

La primera unitat d'aquests materials et permetrà passar el llindar de la simple cerca al Google i perfeccionar les teves capacitats per obtenir resultats de qualitat quan et demanin informació sobre un tema. Per aconseguir-ho hi trobaràs continguts teòrics, de context, mètodes i eines pràctiques. En la segona unitat, obtindràs informació sobre el canvi continu que hi ha a Internet i instruments per gestionar-lo i tenir sempre actualitzades les cerques que has après a fer a la primera part. A la tercera unitat, t'explicarem la confusió entre veracitat i falsedat que protagonitza la Internet dels nostres dies i et donarem instruments per defensar-te'n.

Si segueixes el curs, evidentment no esdevindràs un documentalista ni un expert en elaboració de dossiers de premsa ni tampoc un professional de la verificació d'informacions periodístiques, però sí que hauràs fet unes reflexions que et faran veure Internet d'una altra manera i disposaràs d'eines i coneixements que t'ajudaran a filar prim quan t'encaris amb una pantalla amb informació.

↑ Índex de la unitat

1.2 El bosc s’ha tornat una selva

"La Natura és un temple de columnes vivents
que deixen anar, de vegades, paraules confuses;
l’home hi camina per un bosc de símbols
que l’observen amb una mirada familiar."

Charles Baudelaire. Les flors del mal. Trad. Jordi Llovet. Ed. 62. 2007

És una quarteta del sonet “Correspondències” de Charles Baudelaire. En un primer moment, Internet era efectivament un bosc de signes plaent. Ara ja no és cap bosc. És una selva i de grat o per força t’hi trobes dintre. Com totes les selves és plena de llocs paradisíacs, però també perills i paranys.

Anys enrere, un curs dedicat al web social i orientat a empleats públics tenia com a introducció un relat optimista sobre les possibilitats d'Internet i molt especialment del web 2.0. En aquell moment, la possibilitat que tothom pogués publicar fàcilment els seus plantejaments i opinions i compartir-los amb tota la societat es veia com una contribució a fer un món millor. L'èxit d'eines tan útils com la Viquipèdia ho feien preveure així. Però en pocs anys les coses han canviat molt.

Internet, avui dia, ja no és un entorn sempre amigable que ens ve de cara i ens resol tots els problemes. No ens hi podem llançar alegrement si en volem fer ús en el nostre context professional. Necessitem noves eines per treballar-hi o noves tècniques que ens hi ajudin.

El que anys enrere, als primers 2000, era una obertura marcada per l’aparició dels blogs i, més tardanament, de Facebook, ha canviat justament amb el triomf de les xarxes socials. Buscar-hi informació ha esdevingut complex tant per la gran quantitat i diversitat de dades que hi trobem com pel fet que canvien contínuament. Relacionar-nos-hi, a més, té implicacions en matèria d’identitat i protecció de dades personals i també psicològiques i conductuals, fins al punt que podem arribar a tenir dificultats per mantenir l'atenció. Per postres, costa distingir allò que és cert d'allò que és fals, problema que s'ha accentuat amb la socialització de les intel·ligències artificials generatives, popularitzades mitjançant xatbots (del tipus ChatGPT o Bard). Tot i això, ens en podem sortir perfectament si hi reflexionem i adoptem certes tècniques i actituds. Això és el que mirarem de fer a continuació.

“Ni la veritat ni l’aparença són transparents. Només és completament transparent el buit. Per desterrar aquest buit es posa en circulació una massa d’informació. La massa d’informació i d’imatges és una plenitud en la qual encara es deixa notar el buit. Un augment d’informació i comunicació no aclareix per si sol el món. La transparència tampoc fa clarivident. La massa d’informació no engendra cap veritat”.

Byung-Chul Han. La sociedad de la transparencia. Herder. 2013

La millor actitud i les millors eines

Per a un empleat públic que vol treballar amb rigor, la qualitat de la informació és un requisit indispensable. Però els que aporten informació a Internet sovint es troben darrere de màscares. Cada vegada costa més de saber si allò que llegim és veritat o és, ras i curt, una enredada, i el problema no se cenyeix només a les xarxes socials. En més d'una ocasió afecta mitjans que, en altre temps, havien estat ben prestigiosos. Alguns d'aquests han caigut en el parany de les imatges o els textos falsos generats mitjançant intel·ligències artificials o altres sistemes.

Els empleats públics no podem fer una recollida d'informació innocent i ingènua a Internet. Hem de prendre mesures per obtenir sempre la millor informació i més fiable i poder escatir aquelles informacions falses o conflictives que s'immisceixen en el dia a dia al servei dels ciutadans.

D'altra banda, la cerca d'informació pot semblar la cerca d'una agulla en un paller. Hi ha molta informació disponible perquè cada vegada hi ha més veus que en generen atretes pels avantatges en relacions socials o expressió personal d'eines com els blogs, les xarxes, etc.

Com explica Jaron Lanier en un llibre que us recomanem (Contra el rebaño digital. Debate. 2011), darrere d'aquests productes que provoquen la creació de tants i tants continguts s'hi amaga la necessitat de fer rendibles el que ell denomina "servidors sirena", ordinadors de gran capacitat que necessiten grans recursos per al seu funcionament. Els gestors d'aquestes infraestructures ofereixen grans gratificacions perquè la gent comparteixi contingut a la xarxa (i no tan sols en l'àmbit expressiu, també comercialment: Ebay, Amazon, etc.). Aquest contingut, que transformat en dades, és una eina de màrqueting de primer ordre, també és la clau del seu negoci i ha comportat la transformació de molts aspectes de la nostra societat, amb clares implicacions sociològiques. També respon a aquesta lògica la primera onada de xatbots basats en intel·ligència artificial popularitzats de manera molt ràpida l'any 2022.

Si tothom esdevé proveïdor d'informació, els volums esdevenen inabastables. A efectes de negoci, que part d'aquesta informació pugui ser irrellevant o de baixa qualitat, no és problemàtic. Sí que ho és quan, per la nostra tasca professional diària, ens veiem en la necessitat de relacionar-nos-hi. Ens calen instruments teòrics i pràctics per cercar aquesta informació amb precisió, per seguir-la (ja que està subjecta a canvis) i també per escatir-ne la precisió i la veracitat. En aquest sentit, cal advertir de l'ambivalència que en aquesta tasca poden tenir les eines d'intel·ligència artificials (que només es poden fer servir en l'àmbit professional si hi ha orientacions corporatives i respectant-les escrupolosament i en cap cas introduint-hi informació organitzacional).

Abans de començar a parlar d’eines, cal que tinguis present que les explicarem perquè en coneguis l’existència i les possibilitats. Segurament la majoria les podràs fer servir sense problema a la feina, però en qualsevol cas, tingues presents les regulacions TIC del teu lloc de treball.

També has de tenir present que la majoria d'eines que es proposen són gratuïtes. El seu model de negoci sovint es basa de la captura de dades privades dels usuaris (les que es faciliten en donar-se d'alta). És el model de negoci, per exemple, del cercador Google, de Facebook, de Twitter, etc.

Tingues present també que "les eines són eines i el programari és programari". Aquí t'explicarem a fer servir determinades eines, determinats programes, però ben segur que sortiran programes millors que els substituiran. Convé doncs que t'habituïs a entendre'n sobretot la utilitat i les prestacions amb una òptica d'intercanviabilitat. No dubtis a canviar de programes si en trobes de millors. Tot el que hagis après aquí et servirà, en essència, per a tots.

Una selva amb perills, sobretot emocionals

Tot i l’estratègia que les institucions públiques han portat a terme a les xarxes socials, com a empleats públics hem de ser conscients que en aquestes xarxes hi ha moments de gran hostilitat i enfrontament que, en determinades ocasions, pot impactar sobre les organitzacions en què treballem.

"Twitter permet que la gent estigui connectada minut a minut, però també pot separar-nos amb idèntica rapidesa. La indignació col·lectiva que possibilita aporta un a nova nota de violència a la més antiga modalitat de reunió humana: la multitud. Veurem si servirà, també, perquè arribem a una nova entesa."

Christian Rudder. Dataclismo. Aguilar. 2016

Si hem de buscar informació en aquest entorn hostil, ben segur que serà una operació que, com a empleats públics, ens pot suposar una erosió emocional i cal que ens cuirassem i sapiguem separar adequadament les emocions, que és el terreny psicològic en què sovint es vehiculen les crisis a les xarxes socials, de la tasca racional de trobar un desllorigador tècnic als problemes que es plantegen. Això no sempre és fàcil.

Alguna vegada el teu servei públic ha estat objecte de crítica o polèmica a les xarxes socials o a la premsa? Com ho has viscut?

↑ Índex de la unitat

1.3 Abundància d’informació, importància de les dades

En el moment d’elaborar aquest curs la quantitat i diversitat d’informació i dades que hi ha a Internet impressiona. Segons Internet Live Stats, hi ha:

1.710.635.383 webs accessibles a la xarxa
2.299.670.036 perfils de persones a Facebook

I en les primeres hores del dia en què s’ha elaborat aquest text:

S’han enviat 143.921.698.650 missatges de correu electrònic
S’han fet 3.755.075.796 de cerques a Google
S’han actualitzat 3.574.976 de blogs
S’han fet 421.872.631 piulades a Twitter
S’han visualitzat 3.924.300.384 vídeos a Youtube
S’han publicat 45.774.867 fotos a Instagram
Han circulat 3.817.840.333 gigabites d'informació

Es calcula que tota la informació continguda a Internet i els ordinadors que en formen part és de 9 zetabytes de dades. Per fer-vos-en una idea:

9 zetabytes = 9.000 exabytes
9 exabytes = 9.000 petabytes
9 petabytes = 9.000 therabytes
9 therabytes = 9.000 gigabytes
9 gigabytes = 9.000 megabytes
9 megabytes = 9.000 kilobytes
9 kilobytes = 9.000 bytes

Per tant, 9 zetabytes serien 9 x 10 elevat a 21 bytes. Per entendre què suposa, et proposem un exemple expressat en temps i un exemple expressat en espai:

La pel·lícula "Allò que el vent s'endugué" dura 222 minuts i ocupa 1 GB. Per tant, si Internet només contingués còpies d'aquesta pel·lícula i algú se les mirés una darrere l'altra, la podria veure 9.000.000.000 de vegades, que en minuts són 2x10 elevat a 15. Si ho passem a anys, aquest cinèfil hauria vist la pel·lícula en sessió contínua des que a ve arribar la vida a la terra, fa 3.805.175.038 anys.

Fotograma de la pel·lícula "Allò que el vent s’endugué"

Capa bacterial a Yellowstone. Jim Peaco. National Park Service. Domini Públic

El diccionari Fabra té, aproximadament, 6.406.400 de caràcters i cada caràcter és un byte. Si dividim els 9 zetabytes per aquests bytes, tenim 1.404.845.154.845.155 diccionaris, cadascun dels quals fa 7,5 cm de llom. Posats un al costat de l’altre, fan uns 1,0536 x 10 elevat a 11 km o el que és el mateix, 111 vegades l’òrbita que la terra fa al voltant del sol.

"El desmesurat volum de dades que circula per la xarxa permet a la gent anar escollint fets, mitges veritats o, directament, mentides que permetin consolidar el seu punt de vista, de manera que tant els experts com els aficionats s'animen a buscar materials que avalin les seves teories en lloc d'estudiar l'evidència empírica"

Michiko Katukani. La muerte de la verdad. Rústica Ensayo. 2019

Com canvia el volum d'informació disponible en una casa quan hi entra una pantalla connectada a Internet? Imagina't un pagès en una masia abans d'Internet i compara-ho amb la teva situació actual.

Dades, informació, coneixement, saviesa

⁣ "La nostra impotència actual té un nom: analfabetisme il·lustrat. Ho sabem tot, però no podem fer res. Amb tots els coneixements de la humanitat a l'abast, només podem frenar o accelerar la nostra caiguda a l'abisme"

Marina Garcés. Nova il·lustració radical. Anagrama. 2017

Internet conté doncs una quantitat ingent de dades i, també, d’informació i coneixement. Aquests tres conceptes normalment es representen en forma de piràmide, l’anomenada "Piràmide de la jerarquia del coneixement", que és la següent:

Adaptació de la Piràmide de la jerarquia del coneixement a partir de la representació que figura a l’entrada DIKW de Wikipedia

Fixem-nos en les franges d'aquesta piràmide:

Capa base (dades): Les dades són unitats bàsiques d'informació, que poden ser estructurades (una base de dades) o no estructurades (un fitxer de text amb una llista, per exemple).
Segon nivell (informació): La informació són dades organitzades i processades per a ser enteses. La manera com s'organitzen ja té una intencionalitat.
Tercer nivell (coneixement): El coneixement és l'assimilació i la integració personal o col·lectiva de la informació, fet que en suposa una transformació i adaptació.
Pic de la piràmide (saviesa): La saviesa és la consciència del mateix coneixement que dona plenes capacitats per adoptar decisions, ja que si tenim saviesa sabem els límits d'allò que coneixem.

Un exemple per a empleats públics:

La llista caòtica de totes les atencions al públic d’una oficina fetes d'anotacions en fulls de paper, assentaments en ordinadors i llistes de sol·licituds presentades serien dades.
Una relació ordenada i classificada de totes les atencions al públic que s'han fet, tractades estadísticament i presentades de manera entenedora, serien informació.
Un informe sobre l'evolució de l'atenció al públic amb una valoració de les tipologies d'usuaris i les implicacions socials i institucionals que comporta seria coneixement.
Saviesa la demostrarien aquells gestors que convertissin aquest coneixement en grans millores en l’atenció que es dona als ciutadans.

Alguns autors han presentat aquest triangle a la inversa. Representaria la situació pròpia d’una societat amb un baix accés al coneixement, per exemple la societat europea del segle XIX i la primera meitat del XX. La piràmide anterior s’uniria a aquesta per sobre formant un rombe. Llegiu-la de baix cap a dalt:

Adaptació de la Piràmide de la jerarquia del coneixement a partir de la representació que figura a l’entrada DIKW de Wikipedia

Piràmide invertida: Absència de dades, desinformació, desconeixement, ignorància. Adaptació modificada de la proposta de Cervantes Trejo 2015

Actualment, ens trobem que la satuació de dades i informativa ens pot portar al punt zero, és a dir la ignorància, però per excés de dades i d’informació:

Piràmide de creació pròpia a partir de les figures anteriors: Ignorància, confusió, desatenció, saturació.

"No n'hi ha prou de tenir accés al coneixement disponible del nostre temps, sinó que el que és important és poder relacionar-nos-hi de manera que contribueixi a transformar-nos a nosaltres i el nostre món cap a bé. Si ho sabem potencialment tot, però no podem assolir res, de què serveix aquest coneixement? Caiem en la mateixa inutilitat, redundància i desorientació que denunciava la Il·lustració. Credulitat sobre informada. Cal anar més enllà, per tant, de la lluita pel lliure accés al coneixement, que és condició necessària però no suficient per a l'emancipació."

Marina Garcés. Nova il·lustració radical. Anagrama. 2017

Tot plegat ens porta a una conclusió que expressa molt bé el pedagog australià Neil Fleming i que té molta relació amb el que intentarem fer aquest curs:

⁣“Una col·lecció de dades no és informació; una col·lecció d'informació no és coneixement; una col·lecció de coneixement no és saviesa; una col·lecció de saviesa no és la veritat."

Flemming, N. Coping with a Revolution: Will the Internet change learning. 2006

Aquesta darrera afirmació s'accentua amb la popularització de la intel·ligència artificial i singularment de les intel·ligències artificials generatives, amb serveis populars com ChatGPT o Bard. Si fins ara les màquines, autònomament, eren capaces de generar dades i fins i tot oferir-les estructurades com a informació, ara mateix ja generen textos amb pretensió de ser coneixement.

L’objectiu d’aquests continguts no és que us convertiu en mers recopiladors de dades, ni tan sols en mers recopiladors d’informació. Tampoc, a l’altre extrem, que esdevingueu savis o els únics coneixedors de la veritat. L’objectiu és que sigueu capaços de trobar informació amb precisió perquè la vostra organització la pugui convertir en coneixement i que tingueu recursos per afrontar tant l’excés d’informació com les confusions entorn de la certesa i la falsedat que l’acompanyen.

La informació es caracteritza per ser rellevant (ha d'augmentar el coneixement), exacta (no ha de distorsionar res), completa (hi ha d'haver tota la que es necessita), fiable (no pot tenir febles quant a veracitat), prou detallada i comprensible.

Quan siguis al lloc de treball, mira al voltant teu: papers, pantalles, etc. Què hi tens? Dades, informació, coneixement…?

Dades obertes

Dades obertes són dades que s’ofereixen sense restriccions, per ser utilitzades en qualsevol àmbit. Qualsevol usuari pot utilitzar-les, modificar-les combinar-les i compartir-les fins i tot per a usos comercials. Són d’ús lliure i generalment, també, d’accés lliure, tot i que poden tenir costos. A efectes d’aquest curs són un tipus de dades que ens poden ser molt útils en la recerca d’informació, tant aquelles que ofereixen grans empreses com Twitter (mitjançant la seva API) com les que ofereixen les administracions. D'aquestes, més endavant t'explicarem com fer-hi cerques.

Trobaràs les dades obertes molt ben explicades aquí: Què són les dades obertes? (Generalitat de Catalunya)

Mira't aquest vídeo sobre el dret d'accés a la informació pública.

Dades massives o “big data”

Les dades massives o "big data" són conjunts de dades que se solen caracteritzar per la seva voluminositat, per la velocitat a l’hora d’accedir-hi i per la varietat (les anomenades tres “v” del big data). No se solen fer servir per trobar-hi informació de detall, cosa que en determinades circumstàncies es pot fer, sinó perquè amb programes d’intel·ligència artificial permeten descobrir correlacions entre les mateixes dades que poden resoldre un determinat problema. L’exemple clàssic és quan l’observació de les cerques sobre medicaments per a la grip a Google permetia dibuixar, perfectament, el mapa de l’expansió d’aquesta epidèmia anual als EUA.

"Els beneficis per a la societat resultaran molt nombrosos a mesura que les dades massives es converteixin en part de la solució, permetin erradicar malalties i fomentar el bon govern i el desenvolupament econòmic. Però l'era de les dades massives també ens invita a preparar-nos millor per a les formes en què l'aprofitament de les tecnologies canviarà les nostres institucions i ens canviarà a nosaltres

Mayer-Schömberger & Cukier. La revolución de los datos masivos. Turner Nogma. 2013

La intel·ligència artificial que opera amb les dades massives no és la denominada simbòlica, que es basa en l’aprenentatge d’algunes regles per imitar el comportament humà, sinó la que aprèn directament de les dades, buscant-hi regularitats mitjançant algoritmes de mineria de dades, descobrint i aprenent directament les regles que les regulen (aprenentatge automàtic o “machine learning”) o contrastant i ponderant diverses anàlisis seguint el model de les connexions neuronals (aprenentatge profund o “deep learning”).

Marcos Gasparutti. Flickr. CC BY-SA 2.0

A efectes d’aquest curs, les dades massives combinades amb la intel·ligència artificial t'interessen perquè són part principal de la complexitat que ha anat imperant a Internet i que et fa difícil d’accedir a la informació que et convé: sovint, quan cerques alguna cosa, la intel·ligència artificial ja sap qui ets, gràcies a l'anàlisi d'aquestes dades massives, i canvia allò que les pantalles t'ensenyen. Ho trobaràs explicat a l'apartat sobre la "bombolla de filtres", en aquesta mateixa unitat.

"Pot ser que Facebook sàpiga que ets un dels molts fans de les xocolates M & M i, per tant, et mostri ofertes relacionades amb aquest producte. També sap quan has trencat amb el teu nòvio, te n'has anat a viure a Texas o has començat a aparèixer en multitud de fotos. Les dades digitals, d'una manera gairebé accidental, tenen ara la facultat de mostrar-nos com lluitem, com estimem, com envellim i com canviem. No hem de fer res més que observar-les: només que ens les mirem un xic de lluny descobrim com es comporta la gent."

Christian Rudder. Dataclismo. Aguilar. 2016

"L’aprenentatge automàtic ("machine learning") és el capítol més recent d’aquesta saga de milions d’anys: el món intueix allò que vols i canvia en conseqüència, sense que hagis d’aixecar el dit. Com un bosc màgic, el teu entorn —avui virtual, demà físic— es reordena a mesura que t'hi bellugues. El camí que vas escollir entre els arbres i els matolls creix cap a una carretera. On et perds, broten rètols que t'indiquen com orientar-te."

Pedro Domingos, The master algorithm. Penguin. 2017

Les dades massives ja són presents a la teva vida amb tota seguretat. Fixa't en els llocs on vas durant el dia, el que dius o el que cerques a Internet. L'endemà, fixa't en el fet que t'ofereixen els anuncis que veus a la xarxa. Hi ha relació?

1.4 Com cercar a Internet

Aquest material vol donar-te eines i capacitats per fer bones cerques a Internet. Cercar a Internet vol dir fer-ho en àmbits tan diversos com simples dades (que poden ser estructurades en bases de dades o no) o en informació contextualitzada i elaborada, sobretot si busques en webs o en xarxes. En qualsevol cas, convé que no et perdis en la recerca ni sucumbeixis a les crides d’atenció distractores que la xarxa et fa de manera intel·ligent sempre que t'hi emergeixes.

Bundesarchiv, B 145 Bild-P014590. Frankl, A.CC-BY-SA 3.0

El miratge de la bombolla de filtres

Abans d'endinsar-nos en el mètode per cercar informació a Internet, cal que tinguis present una distorsió que t'afectarà. La major part dels grans serveis d’Internet d’ús massiu com els cercadors o les grans xarxes socials mostren la informació adaptada a les “necessitats” dels usuaris d’acord amb les dades que han recollit d’ells mateixos. És a dir, una cerca a Google o dins d'una xarxa social, a priori no donarà el mateix resultat si la fas tu o si la fa la persona que tens a la taula més propera, ja que hi influiran les cerques i les decisions que tu mateix o aquesta persona heu adoptat amb anterioritat. És el que Eli Pariser va batejar com a “bombolla de filtres” i que molts anomenen "sitges". La bombolla de filtres pot portar a l’autoengany amb molta facilitat.

"El monitor del vostre ordinador és un tipus de mirall unidireccional que reflecteix els vostres interessos mentre els observadors algorítmics miren el que feu (…) Un món construït a partir del que ja t'és familiar és un món en què no hi ha res a aprendre."

Eli Pariser. El filtro burbuja. Taurus. 2017 (2011)

La bombolla de filtres no és necessàriament negativa. Per exemple, si sempre fas cerques semblants i acabes anant a parar a les mateixes pàgines i és això el que vols, t'ajudarà a ser eficient. Però si vols fer una cerca començant des de zero i sense condicionants previs, et pot arribar a enganyar i a fer perdre eficàcia.

Idealment, per sortir de la bombolla de filtres, hauries de ser un usuari verge, que entra a Internet per primera vegada. Això és impossible si estàs llegint aquest text, però sí que pots adoptar algunes mesures (valorant, prèviament, si et convé adoptar-les). Per exemple:

combinar diverses eines de cerca
instal·lar un navegador nou i usar-lo per a la cerca
esborrar les galetes del teu navegador
combinar diversos dispositius des dels quals fas la cerca
vetllar per fer la cerca des de fora de l'usuari del cercador (cosa que no sempre tenim present, ja que en el cas de Google, sovint fem servir altres serveis que ens fan estar-hi contínuament connectats).

"Nacionalisme, tribalisme, deslocalització, por a el canvi social i odi a què ve de fora són factors que van en augment a mesura que la gent, atrinxerada en les seves sitges i en les seves bombolles filtrades, va perdent el sentit de la realitat compartida i la capacitat de comunicar-se transcendint les línies socials i sectàries. "

Michiko Katukani. La muerte de la verdad. Rústica Ensayo. 2019

"En comptes de treure l'usuari del forat del conill, el motor de recomanació l'empeny més endins. Hem passat de bombolles de filtre partidistes a comunitats en sitges tancades que experimenten la seva pròpia realitat i operen amb els seus propis fets".

Renée DiResta, "Social Network Algorithms Are Distorting Reality By Boosting Conspiracy Theories”, FastCompany 2016

Entendre bé les característiques de l’encàrrec

Anem a cercar. Com a pas previ, és molt important que qui et fa l’encàrrec de cerca et defineixi bé l’objectiu i caldrà que li facis totes les preguntes necessàries perquè quedin definits els límits d’allò que se t'encarrega (temporals, conceptuals, etc.). Hauràs de fer preguntes del tipus:

Què és exactament el que se'm demana?
Des de quina data fins a quina data he de cercar?
Quin grau d’aprofundiment ha de tenir la informació?
Només notícies? També el que diu la gent? Només el parer dels polítics? Només…? També…?
Quin abast geogràfic ha de tenir la cerca? Només Barcelona? Només Catalunya? Només…? També…?

Ha de quedar clar si has de cercar només una informació molt concreta (per exemple, els estatuts d’una entitat) o el màxim d’informació rellevant sobre un tema (per exemple, tot el que se sàpiga sobre un determinat incendi en un pis per motius energètics), ja que la manera d’abordar la cerca serà totalment diferent.

Amtec Fotos. Flickr. CC BY-SA 2.0

Definició del tema i l'àmbit de cerca

La conversa d’aclariments previs t'ha de permetre definir ben clarament el tema, sobretot per aconseguir acotar la cerca. És bo que en coneguis els límits, tant conceptuals com temporals o geogràfics. Sense una descripció clara del tema, difícilment aconseguiràs fer una cerca precisa. Els límits, d’altra banda, et permetran explotar al màxim les possibilitats de filtratge que tenen els formularis de cerca avançada.

Si la conversa prèvia t'ha permès de delimitar clarament els objectius, estaràs en condicions de definir l’àmbit de cerca, és a dir, les fonts d’informació que et miraràs i les que no caldrà mirar. Trobaràs una classificació de fonts d’informació a Internet més endavant.

Si has de recollir informació que fa referència a una qüestió d’actualitat que s’ha escampat pels mitjans, hauràs de cenyir-la als mitjans i aquelles plataformes en què la gent comparteix les informacions. En canvi, si és una informació que té implicacions administratives, potser et caldrà recórrer a algun set de dades obertes de l'Administració. Si, a més, té un component sociològic o demogràfic, hauràs d’ampliar l’àmbit a les dades i els estudis dels grans organismes estadístics o, si escau, a bases de dades del món acadèmic. Més avall trobaras tipologies de fonts que et permetran reflexionar sobre quines són les que et convenen més.

Llicència Pixabay

Elecció de les paraules o expressions de cerca

Com que el nostre principal instrument de treball seran els cercadors (siguin els genèrics d’Internet, siguin de caràcter temàtic o especialitzat, siguin els que van associats a bases de dades) hauràs de tenir clar quines paraules clau o expressions de cerca utilitzaràs i com és *(que pot ser un concepte únic pluja de fang o el sumatori de pluja + fang, però de vegades t'interessarà excloure algun element, per exemple pluja però no pluja àcida o bé casos de tries alternatives (una altra), per exemple pluja o pedregada (i tenir totes les cerques de pluja i totes les de pedregada).

Triar les paraules adequades t'ajudarà a obtenir una resposta òptima, però també t'estalviarà molt de temps perdut descartant innombrables enllaços o documents que per algun motiu la teva tria evoca i que no necessites per a res.

Un bon mètode per triar les paraules de cerca és agafar la formulació bàsica de l’encàrrec de cerca que t'han fet i esporgar-lo fi a reduir-lo als conceptes bàsics. Per exemple, “Busca informació sobre les espècies protegides que es troben al parc natural del Garraf”. En tindràs prou amb les paraules "espècies" "protegides" "parc" "Garraf".

Caldrà que decideixis quina és la paraula més útil i més concreta en cada cas. Si fas servir paraules que tenen molts significats, però hi ha un sinònim més específic, potser et sortirà més a compte triar el sinònim. Tot i això, caldrà valorar-ho, ja que aquesta mateixa decisió et podria portar a confusió.

Homo Anchurus. Wikipedia. CC BY-SA 4.0

Elecció de les eines de cerca i la modalitat

Decideix les eines de cerca més útils segons l’àmbit (que hem descrit com les fonts on vols buscar) i les paraules de cerca escollides. Normalment aquestes eines són

cercadors (com ara Google)
directoris, que mostren la informació estructurada (com ara DMOZ)
cercadors o directoris especialitzats (com ara Dialnet)
sets de dades (com ara Dades obertes Gencat)

Per exemple, si et cal informació sobre la prevenció d’incendis, pots optar pels cercadors de Youtube (per trobar vídeos de prevenció i sensibilització), cercadors relacionats amb l’actualitat (per trobar notícies), cercadors webs genèrics (per accedir als resultats que trobarà la majoria de gent si s’interessa pel tema), cercadors de dades obertes (per trobar els imports dels contractes associats a aquest tipus d’accions), etc.

També en aquest punt hauràs de decidir, en el cas dels cercadors que tenen cerca ordinària i cerca avançada, quina és la que et convé més. Si en la definició has marcat una delimitació temporal, segurament et caldrà una cerca avançada en aquells cercadors que permeten definir dates. Si tens una combinació complexa de paraules (paraules que sí que vols que surtin o que surtin plegades, paraules que no han de sortir, etc.), segurament també et caldrà fer una cerca avançada o bé optar per operadors de cerca, que exposarem més endavant.

És important no tancar-te en una única eina, ja que a part que pot ser que no sigui la que t'ofereixi el millor resultat, seràs més vulnerable a tots els paranys generats per la bombolla de filtres (que t'hem explicat abans). Opta, doncs, sempre que puguis i sigui raonable, per més d’una eina.

Has de tenir present, així mateix, que disposem també dels xatbots basats en intel·ligències artificials generatives, capaços de produir continguts elaborats a partir d'una determinada cerca, interrogant-los en llenguatge natural (és a dir, tal com parlem habitualment o escrivim). No són pròpiament cercadors, però sí que integren funcions de cerca i poen informació a partir de la qual generen els textos. Per tant, són eines més avançades que els simples cercadors. En determinats casos, a més, els cercadors els integren a la seva interfície. L'exemple més desenvolupat en el moment de fer aquesta actualització és el de Bing, que integra ChatGPT a la seva interfície i el més semblant a un cercador per la claredat amb què mostra les fonts d'informació és Perplexity AI, que ens busca informació sobre un tema i la redacta assenyalant d'on treu cadascuna de les afirmacions que fa. Trobaràs aquests recursos explicats amb detall més avall.

Cerca

És el moment clau. Has de traslladar tota la reflexió que has fet a una o diverses accions concretes de cerca. Sovint serà una tasca repetitiva (dependrà del nombre de paraules o expressions de cerca diferents que hagis determinat). Ha de tenir present, així mateix, que cada eina de cerca t'oferirà els resultats de manera diferent. En aquest punt i tenint en compte el problema que suposa la bombolla de filtres, has de ser acurat de no caure en paranys com els següents:

Has d'evitar:

Mirar només la primera pàgina (pot ser que sigui la més afectada per la teva bombolla de filtres)

Repetir una cerca que ja has fet moltes vegades abans sense netejar les galetes de l’ordinador (les cerques que has fet amb anterioritat i els enllaços seleccionats poden condicionar la cerca actual)

Deixar-te emportar pel suggeriment automàtic de cerca o per les informacions publicitàries que t'oferiran junt amb els resultats. Has de tenir sempre al cap les definicions que has establert.

Deixar-te emportar, en definitiva, per hàbits de comportament que has adquirit fent cerques poc compromeses i que et poden induir a error si fas cerques més complexes o més delicades professionalment.

Val la pena que valoris si, per estalviar que la bombolla de filtres t'afecti (és a dir, que tot allò que has cercat amb anterioritat condicioni la cerca actual) potser et convé netejar el navegador, esborrant-ne les galetes. Però si, justament, allò que has de cercar ja ho has trobat totalment o parcialment en cerques fetes els dies anteriors, potser el que et convé és aprofitar-te de l'aprenentatge sobre els teus hàbits que han fet els cercadors. Una cosa tan òbvia com l'historial del navegador (que inclou un cercador propi) et pot permetre recuperar cerques òptimes realitzades amb anterioritat.

La bombolla de filtres, en el moment de la cerca, pot ser una distorsió o un aliat.

En fer la cerca, sigui el cercador que sigui, hem de tenir en compte el concepte de dret a l'oblit, que pot comportar que alguns resultats hagin estat esborrats per preservar les dades d'alguna persona que ha considerat que ja no són rellevants per ser accessibles públicament a Internet i ha sol·licitat aquest procediment.

En l'apartat "Posem-nos a cercar", que trobaràs més avall, trobaràs tota la informació que necessites per ser ben productiu en aquest moment clau i saber totes les possibilitats que tens.

Calibratge dels resultats

Has d’analitzar els resultats obtinguts i sotmetre’ls a una mirada crítica. No tots són iguals. Per fer-ho, has de valorar aspectes com els següents:

Fiabilitat del resultat obtingut. Si els resultats obtingut et porta a una font oficial, cal entendre que oferirà la màxima fiabilitat des d’un punt de vista administratiu (que és el nostre).

Tingues present que la perspectiva del ciutadà pot ser diferent i que ell doni més crèdit, justament, a una font que no és oficial perquè té qualsevol motiu per desconfiar-hi.

Impacte de la font.

Si busques notícies sobre un tema que afecta la teva unitat, no has de donar el mateix valor a una piulada feta des d'un compte de Twitter amb 20 seguidors que una feta per un compte que en té 200.000. Tampoc és igual una notícia publicada en un digital de màxima influència amb milions de lectors que un mitjà local. Però alhora has de tenir ben clar que per circumstàncies incontrolables, una piulada feta per algú molt petit o una notícia publicada en un mitjà local poden fer fortuna i acabar tenint una notorietat planetària.

Recopilació i homogeneïtzació del resultat

Si has obtingut resultats procedents de fonts diferents, caldrà que els recullis i els homogeneïtzis per facilitar-ne la consulta. De vegades n’hi haurà prou a enganxar els resultats en un processador de textos, però de vegades et caldrà usar eines digitals que facilitin la feina, per exemple quan treballes amb enllaços. Potser, simplement, hauràs de buscar eines que et facilitin la descàrrega massiva d’enllaços per no haver-te de passar hores copiant i enganxant.

En aquesta fase l’important és poder tenir la informació obtinguda en un format senzill, clar i homogeni, que sigui entenedor i pràctic tant per a tu com per a les persones a qui hagis de presentar els resultats.

Si ets sistemàtic i endreçat en la recollida de resultats, t'estalviaràs de repetir tasques que ja has fet, perquè te n'has oblidat o perquè l’allau d’informació t'ha abocat a cometre aquest tipus d’errors.

En la fase de recollida de resultats, et poden resultar molt útils eines d’emmagatzematge i gestió d’enllaços, entre les quals en destaquem algunes:

Diigo

Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços. Es pot generar un RSS amb els enllaços declarats públics, fet que els permet compartir fàcilment. Utilitzant programes d'automatització com IFTTT pots exportar-los massivament cap a fulls de càlcul en línia, etc.

Tagpacker

Característiques: té connectors per a Chrome i per a Mozilla. Permet distingir entre públics i privats. Permet etiquetar els enllaços i mitjançant el servei d'automatizacions Zapier, es pot generar un RSS per si es volen compartir automàticament (però no és fàcil)

Google Bookmarks

Característiques: és l'eina de gestió d'enllaços de Google. Té connectors no oficials per a Chrome i Mozilla

També et poden resultar útils eines que permeten descàrregues massives d’enllaços perquè els puguis exportar cap a llistes, documents, etc. A continuació te n'oferim alguns:

Batch link downloader (només Chrome)

Simple Masss Downloader Chrome Mozilla

Establiment dels primers paràmetres de seguiment

Recollir els resultats avui no és igual que recollir-los demà en un món en canvi constant com és el digital. A la Unitat 2 del curs aprofundirem en tècniques i eines de seguiment i monitoratge, però és bo que en aquest punt comencis a tenir clar allò que, després, t'interessarà seguir o tenir vigilat per si canvia.

En aquest sentit, és bo distingir entre cerques que fas de manera habitual, que cal que conservis i sobre les quals podràs fer una estratègia de seguiment, d'aquelles cerques que saps que no tornaràs a fer mai més. Sembla una obvietat, però salvar una cerca que has plantejat acuradament és una bona pràctica de gestió de coneixement i et permetrà, després, automatitzar-ne el seguiment.

↑ Índex de la unitat

1.5 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials

Quan busques informació a Internet, has de tenir clara una distinció que et pot estalviar feina. És la distinció entre fonts primàries i secundàries: fonts primàries són aquelles que s’observen directament d’una realitat i no han estat processades de cap manera, mentre que les secundàries ja han estat objecte d’algun treball.

Si vols saber quantes empreses de l’IBEX 35 tenen seu a Barcelona, pots comprovar-ho mirant el web de cadascuna (informacions primàries) o buscar una notícia o informe on s’ofereixi aquesta dada (informació secundària)

D’altra banda, et convé adoptar certes prevencions davant el tipus de font, ja que a Internet hi ha moltes veus i és recomanable anar, sempre, a les més fiables. Al mateix temps, mira de recórrer primer a aquelles que t'estalviaran temps, és a dir, les que ja saps que et seran més útils per la quantitat de recursos que contenen.

Si vols buscar informació sobre l’Institut Català del Sòl, pots començar per la Viquipèdia, però, segurament, on en trobaràs més és al web del mateix organisme.

És bo, també, tenir clara la distinció entre font interna i font externa. Per exemple, el web d’una institució és una font interna d’aquesta institució. Les crítiques que en fan als webs de sindicats o usuaris són fonts externes per a aquesta institució.

En un context de conflicte entre dues institucions, quan una institució parla de l’altra és una font externa respecte d'aquesta institució.

A continuació trobaràs diversos tipus de fonts i la manera d’accedir-hi.

Fonts	Descripció	accés
Fonts oficials de l'Administració	Aquells llocs web o recursos propis de la Generalitat o de la institució on treballem. Les administracions disposen de moltíssimes dades i informacions publicades a Internet. Hi podem trobar des dels repositoris de dades obertes fins a publicacions oficials (DOGC, BOE, BOP, etc.), grans repositoris d’informació estadística (IDESCAT, CEO, INE, etc.), publicacions pròpies de les mateixes administracions (per exemple, les publicacions de la Generalitat), els webs de l’administració (gencat.cat, bcn.cat, etc.) i els canals de les administracions en xarxes socials.	Per la seva amplitud, les fonts oficials a Internet tenen mètodes d’accés ben diversos, però en la majoria de casos inclouen motors de cerca ben útils i amb nombroses prestacions.
Fonts acadèmiques o científiques	En què la mateixa comunitat acadèmica i científica ens ofereix garanties de fiabilitat i en què hi ha repositoris riquíssims. Hi ha des de repositoris científics de les universitats (cadascuna sol tenir les seves) fins a recursos compartits com el web de tesis doctorals en línia, directoris amb producció científica o tècnica que respon a un determinat context o grans bases de dades de recerca acadèmica siguin pròpies del context universitari (com Dialnet, entre moltes d’altres), siguin amb format de xarxa social (academia.edu, researchgate.edu, etc.), siguin promogudes per institucions o per les grans empreses digitals globals (Google Scholar, Microsoft Academic).	La majoria de fonts científiques i acadèmiques inclouen potents motors de cerca amb nombroses prestacions, tant bàsiques com avançades.
Fonts divulgatives	Obres de consulta que volen explicar la realitat, amb el benentès que poden tenir biaixos propis dels seus promotors empresarials (per exemple, les enciclopèdies privades en línia) o del mateix consens i discrepància dels elaboradors (per exemple, la Viquipèdia)	La major part de fonts divulgatives en línia inclouen cercadors.
Fonts corporatives d’organitzacions i empreses	Tenen la garantia de ser l’òrgan “oficial” de la mateixa organització o empresa i, també, els biaixos propis d’aquestes organitzacions. Són, essencialment, webs d’empreses, entitats, fundacions, etc.	Són organitzacions que la major part de vegades ofereixen la informació en web i no sempre disposen de bons cercadors, de manera que, sovint, per accedir-hi, cal recórrer a cercadors d’abast general a Internet com Google.
Fonts de mitjans de comunicació	Prioritzarem les que ofereixin una alta fiabilitat i professionalitat i en què el contrast i la verificació d’informació. La darrera part d’aquest curs ens donarà eines per ser acurats en abordar-los.	S’ha generalitzat l’estàndard d’incloure, dins de tots els mitjans, algun motor de cerca, que no sol tenir grans prestacions, però sí que permet fer cerques bàsiques per paraules. Tot i això, hi ha algun mitjà que no en té.
Catàlegs i repertoris bibliogràfics en línia	Ens ofereixen les obres disponibles en biblioteques, centres o llibreries. En alguns casos, fins i tot amb accés directe a les obres (si estan digitalitzades i són d’accés lliure).	Els mateixos catàlegs solen incorporar sistemes de cerca.
Fonts 2.0	Sorgides dels grans formats participatius d’Internet: blogs, xarxes socials, etc. No parlem de les aportacions oficials que hi fan les administracions o les empreses (que considerarem fonts pròpies o corporatives) sinó de les dels mateixos usuaris.	Les xarxes socials, generalment, incorporen algun tipus de motor de cerca per accedir i trobar-hi informació.

↑ Índex de la unitat

1.6 Eines de cerca: aproximació i ús avançat

A Internet hi ha eines de cerca molt diverses. La gran majoria es basen en la cerca a partir de paraules introduïdes en una determinada boca de cerca. Aquest és el paradigma dominant a Internet des que van aparèixer els primers cercadors com Altavista o Yahoo, tot i que va ser Google qui va revolucionar el panorama a partir del tombant de segle.

Actualment, ja hi ha cercadors que parteixen de principis diferents. Google mateix ofereix la possibilitat de carregar una imatge i a partir d’aquí cercar altres imatges relacionades.

Cercadors i tipus de cercador disponibles

Quan hem parlat de fonts d’informació disponibles a Internet hem vist que n’hi havia de molts tipus. Algunes d’aquestes fonts disposaven de cercadors propis, de caràcter específic. D’altres, en canvi, són només accessibles mitjançant cercadors generals. A continuació et presentem una llista de cercadors que et poden ser més útils, amb un breu comentari.

A banda dels que t'expliquem aquí, trobaràs aquesta llista de cercadors en actualització permanent a la Viquipèdia (si a més del català navegues per altres llengües, en aquesta mateixa llista, encara en trobaràs més).

Cercadors d’abast general (cerquen en el conjunt d’Internet)

Els cercadors d'abast general són eines d'una gran capacitat i d'ús massiu en la modalitat de cerca simple. El més usat és Google. A efectes d'aquest curs és important que tinguis presents algunes qüestions:

No hi ha un sol cercador, Google. N'hi ha molts més i alguns tenen capacitats importants que Google no té o no té tan desenvolupades

Quan fem una cerca en un cercador d'abast general no podem mirar-nos només els resultats que ofereix la primera pàgina fent-hi una cerca simple, hem de ser capaços de fer cerca avançada (utilitzant operadors o formularis) i d'explotar les eines de postcerca. Això ens permetrà obtenir resultats acurats.

En la nostra cultura, en abordar aquests cercadors no tenim en compte que quan els usem, paguem. No paguem monetàriament, però sí que paguem generant unes dades que en alguns casos el cercador aprofitarà i que provocarà que quan visitem altres pàgines ens aparegui determinada publicitat, per exemple. DuckDuckGo i altres cercadors són molt més garantistes per a la privacitat dels usuaris que Google o Bing i per això tenen un gran creixement en països que valoren molt més la privacitat.

Vegeu alguns dels cercadors d'abast general i algunes idees claus sobre cadascun que et suggerim de retenir:

http://www.google.cat: és el cercador més popular, molt útil en cerca simple, però més útil encara en cerca avançada i mitjançant operadors. Té un xatbot d'intel·ligència artificial relacionat, Bard, però en el moment d'actualitzar aquest curs encara no l'ha integrat a la interfície.

http://www.bing.com: és el principal competidor de Google, propietat de Microsoft i en determinats aspectes molt competitiu. Un dels avantatges que té i que facilita molt el seguiment del canvi que abordarem a la Unitat 2 és que permet generar canals RSS de les cerques mitjançant l'addició de la cadena &format=rss a la URL del resultat. És el primer que ha integrat de manera senzilla una interfície de xatbot d'intel·ligència artificial amb el qual podem dialogar un cop tenim els primers resultats del que hem cercat.

http://www.DuckDuckGo.com: tercer principal cercador de caràcter genèric, ofereix nombroses garanties en privacitat i té característiques que el fan força diferent dels altres. Durant uns mesos de l'any 2022 ha integrat en la versió anglesa DuckAssistant, un xatbot d'intel·ligència artificial basat en ChatGPT, però en el moment de tancar aquesta actualització del curs, ja no l'ofereix.

http://yahoo.com: un dels cercadors més antics, ofereix bons resultats en determinats aspectes com les notícies.

https://www.wolframalpha.com: té un plantejament diferent de tots els altres cercadors ja que no ofereix enllaços sinó informació elaborada.

Cercadors per a xarxes socials

Després d'uns anys en què hi havia força cercadors per a les xarxes socials, la majoria d'eines han anat quedant obsoletes a causa de la impossibilitat d'aconseguir un bon model de negoci. Queden els cercadors que proporcionen les mateixes xarxes, que en algun cas són excepcionalment útils (és el cas de Twitter) i alguna eina que actua com a metacercador, obtenint dades de xarxes socials filtrades dels cercadors clàssics. A continuació en comentem tres casos. Més endavant, en tractar cercadors com DuckDuckGo, veuràs que mitjançant l'eina Bang! pots cercar directament en algunes xarxes.

http://search.twitter.com: és el cercador propi de Twitter amb un bon sistema de cerca avançada. Cal vetllar en les opcions de filtre quan ofereix els resultats, ja que la primera pantalla prioritza la rellevància i no l’actualitat, però ofereix una pestanya “últims” per seleccionar les piulades més actuals.

Cercador de Facebook. Cal accedir-hi des de la mateixa xarxa social. El principal interès no és tant en el resultat que ofereix quan fas la primera cerca com en les eines de filtratge que complementen el resultat i que t'ofereix tant en el menú superior com en el lateral esquerre. Aquí en tens l'aspecte:

https://www.social-searcher.com/: mitjançant Google, fa una cerca bastant útil d’actualitzacions en les principals xarxes socials

Cercadors de caràcter acadèmic

El món acadèmic i científic genera informació rigorosa sobre multitud de temes. Si vols fer cerques d'informació acurades, sovint hi hauràs de recórrer, ja que, sigui quin sigui el teu àmbit de treball, ben segur que des del món acadèmic o de recerca hi ha persones que l'estudien i hi aprofundeixen. En termes generals, trobem tres models de cercadors de caràcter acadèmic:

Els que es basen en el rastreig de la xarxa que ja fan habitualment per proveir els seus cercadors ordinaris. És el cas de Google i Microsoft.
Els que es basen en grans repositoris acadèmics. És el cas de Dialnet o el cercador de tesis TDX.
Els que funcionen com a xarxes socials en què els mateixos científics comparteixen els seus "papers".

Et presentem a continuació alguns exemples d'aquest tipus de cercadors:

https://scholar.google.com/: una eina específica de Google sobre continguts acadèmics i científics
http://academic.microsoft.com: l’eina científica i acadèmica de Microsoft, que competeix amb la de Google
https://dialnet.unirioja.es/: directori i cercador acadèmic del món hispà amb gran quantitat de continguts
http://tdx.cat: tesis doctorals catalanes en línia
http://academia.edu: repositori elaborat pels mateixos científics i acadèmics que funciona com a xarxa social (t'hi hauràs de donar d'alta, però és fàcil)
http://www.researchgate.com: similar a l’anterior (t'hi hauràs de donar d'alta, però és fàcil)
https://www.semanticscholar.org/: basat en intel·ligència artificial, es considera un cercador acadèmic de nova generació

Eines de cerca en dades obertes

Mentre que la majoria de cercadors que hem vist treballen sobre informació ja elaborada, la tendència a publicar dades obertes per part de les administracions i altres organismes sovint permet accedir a gran quantitat de dades sense elaborar, però que mitjançant eines diverses es poden convertir en informació ben útil. Les eines que ofereixen per accedir-hi són cada vegada més pràctiques i amb gran quantitat de prestacions.

https://datasetsearch.research.google.com/: cercador de google especialitzat en sets de dades obertes d'arreu del món
http://governobert.gencat.cat/ca/dades_obertes/: repositori de dades obertes de la Generalitat de Catalunya, basat en l'aplicatiu Socrata, amb un cercador de sets i una eina per explotacions i cerques internes amb múltiples possibilitats.
https://opendata-ajuntament.barcelona.cat/: respositori de dades obertes de l’Ajuntament de Barcelona
https://datos.gob.es/: portal de dades obertes de l’administració de l’estat

Cercadors de notícies

Els principals cercadors de notícies són els següents:

http://news.bing.com (indexa en català)
http://www.yahoo.com
https://news.google.com (indexa en català)

Finalment, cada mitjà disposa, generalment, d'un cercador propi. N'hi ha que ofereixen els resultats per un únic criteri de rellevància i no sempre són útils, però n'hi ha que permeten endreçar-los per data (posant la més recent davant). Aquests resulten especialment útils.

Cerques millorades amb l'ús de serveis de xatbot d'intel·ligències artificials generatives

Entre la tardor de 2022 i l'estiu de 2023 va tenir lloc una gran popularització de serveis de xatbot basats en intel·ligències artificials de caràcter generatiu. Es tracta d'instruments "entrenats" amb dades que generen text a partir dels textos que han processat prèviament i, doncs, poden ser una eina útil per millorar les cerques. En alguns casos, fins i tot, es troben integrades al cercador. El resultat que ofereixen es troba entre la simple informació i el coneixement, ja que treballen amb models de llenguatge que els permeten atendre les consultes, però també donar respostes, en llenguatge natural. Els més populars, a més, funcionen en català amb força normalitat. Són els següents:

ChatGPT (https://chat.openai.com/) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural. Desenvolupada per l’empresa OpenAI mitjançant models de llenguatge natural GTP-3 i GTP-4, pot generar tota mena de textos (incloent-hi, doncs, notícies i similars). Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua. Es troba integrat directament a la interfície del cercador Bing, per millorar-ne les respostes, i durant un temps, una variant va estar integrada al cercador DuckDuckGo.

Bard (http://bard.google.com) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural, desenvolupat per Google. Basat inicialment en la família LaMDA de grans models de llenguatge (LLM) i més tard en PALM, pot generar tota mena de textos (incloent-hi, doncs, notícies i similars). Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua. Pertany a Google, que previsiblement l'anirà integrant en el seu cercador.

Perplexity (http://perplexity.ai) és un servei de xatbot d’intel·ligència artificial generativa orientada a text a partir d’indicacions ("prompts") en llenguatge natural. Té un funcionament similar a un cercador i està especialment orientat a documentar-se sobre un tema. El principal avantatge és que amb una nota ens remet a la font de cada afirmació que fa. És doncs el servei més transparent quant a l’origen de la informació, però no està exempt d’introduir falsedats. Es pot interrogar en català i ofereix resultats plausibles en aquesta llengua, encara que alguna vegada salta a l’anglès.

Tingues present que la finalitat d'aquestes eines és generar text a partir de models entrenats. Per tant, el resultat pot ser excel·lent des d'un punt de vista de redacció i estructura i, en canvi, constituir una falsedat absoluta o incloure elements falsos però que textualment funcionen. Per tant la verificació és important i, en aquest sentit, Perplexity facilita la font d'on ha tret cada afirmació i, doncs, tot és més fàcil de validar.

A l'apartat següent et facilitarem consells per redactar indicacions ("prompts") útils i productives en un àmbit de cerca amb aquest tipus d'eines.

Sigueu extremament acurats en l'ús d'aquestes eines en l'entorn personal. Tingueu present que aprenen, entre d'altres fonts, a partir de la informació que els aporteu en les indicacions ("prompts"). No les utilitzeu en l'entorn professional si no és d'acord amb les normes que en regulin l'ús i sense introduir cap informació sensible.

↑ Índex de la unitat

1.7 Posem-nos a cercar

Cerca simple

Si utilitzes la primera boca de cerca que t’ofereix el cercador, tingues present el que hem comentat en parlar de les paraules de cerca sobre la conveniència de triar-les bé. Tingues present que com menys paraules i més específiques, més fàcil serà trobar el resultat. D’altra banda, per evitar confusions, prescindeix de signes de puntuació o tipogràfics i no et refiïs de les distincions entre majúscules i minúscules o dels accents diacrítics, ja que la gran majoria de cercadors ignoren aquests detalls.

Google i Bing, que són els principals cercadors, han basat el seu èxit en el bon funcionament de la cerca simple.

En una cerca simple, si escrivim pluja granotes, ens sortiran tant pàgines on surten les dues paraules (que sortiran primer) com pàgines en què surt cadascuna de les dues (amb l'advertiment que un dels dos termes no hi surt).

Introducció a la cerca amb operadors i avançada

La majoria de cercadors ofereixen, a més de la cerca simple, eines per fer cerques més acurades. Ho fan mitjançant els formularis de cerca avançada, que proporcionen un entorn usable que simplifica la tasca, o mitjançant la introducció d'operadors. En un primer moment i en determinades circumstàncies, els formularis de cerca avançada et resultaran molt útils, però si aprens uns quants operadors hi acabaràs guanyant tant en velocitat com en precisió.

Bàsicament, la cerca avançada es basa en dos tipus de tasca:

Controlar la manera com es relacionen els diversos elements de la cerca entre ells (si hi han d'aparèixer tots, si han de sortir en el mateix ordre, etc.) o bé si cal excloure'n algun. És el territori dels operadors booleans.
Filtrar, és a dir, restringir els resultats a una determinada tipologia (un determinat tipus de fitxer, una determinada ubicació en la xarxa, una determinada datació), etc.

Els principals operadors boleans són AND (és a dir, la conjunció "i") i OR (és a dir, la conjunció "o"). El primer marca la necessària presència dels dos elements que té a costat i costat, sense que en pugui faltar cap. El segon estableix que la simple presència d'un dels dos és suficient per seleccionar el document.

El formulari de cerca avançada de Google és paradigmàtic per la quantitat de possibilitats que ofereix i és bo que sigui el primer amb què et familiaritzis:

-Imatge formulari cerca avançada de Google

Aquí tens alguns exemples de formularis de cerca avançada:

Tipus de cerques amb operadors i avançada

Et presentem a continuació els tipus de cerques que podem obtenir amb operadors i amb cerca avançada. Els cercadors que s'hi consignen són només els més destacats o bé algun que és especialment interessant per com vehicula cadascuna de les cerques (més avall t'explicarem els operadors més útils de cadascun):

cerca	explicació	exemple	operadors	cercadors
expressions literals	Si volem cercar una frase literal, podem recórrer als cercadors de cerca avançada, però convencionalment, els principals cercadors admeten que es pot posar la frase a cercar entre cometes. Això és vàlid tant a Google com als seus principals competidors, Bing i DuckDuckGo	Si escrivim entre cometes "pluja de granotes", els cercadors ens oferiran literalment aquesta expressió i descartaran qualsevol altra combinació de paraules en què apareguin els mots pluja o granotes.	""	Google, Bing, DuckDuckGo
operador booleà AND	Present també en els tres principals cercadors, permet garantir que totes les paraules encadenades amb aquest operador seran presents en els resultats que es presentin. En el cas de Bing, també es pot usar l'operador &.	Si escrivim pluja AND granotes apareixeran totes les pàgines on surtin els dos termes, tant les que diuen, per exemple, pluja de granotes com les que diuen la pluja va provocar l'aparició de pèlags que es van omplir de granotes.	AND (Google); AND, & (Bing)	Google, Bing i la gran majoria
operador booleà OR	Usem aquest operador, present també als tres principals cercadors, per demanar qualsevol dels termes que apareixen a costat i costat de l'operador, tant si hi surten tots dos com si només en surt un. En el cas de Bing, l'operador pot ser OR o bé la barra vertical.	Si escrivim pluja OR granotes apareixeran totes les pàgines on surt pluja i, també, totes les pàgines on surt granotes	OR i la barra vertical	Google, Bing i la gran majoria
exclusió d’una paraula	De vegades ens interessa que en una determinada cerca no hi surti una paraula per evitar que ens entrin massa pàgines no relacionades.	Si volem que, quan busquem tempestat, NO hi surti cap referència a la pluja, la podem excloure fent aquesta cerca: tempesta -pluja	-	Google, Bing, DuckDuckGo
inclusió d'una paraula buida	Hi ha paraules que els cercadors consideren buides perquè no aporten cap valor semàntic a efectes de la cerca com conjuncions, preposicions o articles. Només les solen cercar en literals entre cometes. De vegades, però, ens interessa buscar-les encara que no siguin en un literal.	El cercador Bing permet forçar l'aparició de paraules buides posant-hi l'operador +, per exemple pluja +que	+ Cal anar amb compte amb aquest operador, ja que té significats diferents segons el cercador	Bing
ús de comodins	Google ofereix el comodí *, que permet substituir qualsevol paraula o cadena de paraules dins d'una expressió literal, és a dir, buscada entre cometes.	Si busquem *"pluja granotes" obtindrem la cadena pluja de granotes però també documents on apareix pluja i, al cap d'algunes paraules més, granotes**.	*	Google
prioritzar una paraula	Bing ofereix l'operador prefer: que busca pàgines en què la paraula amb aquest operador hi té un lloc més destacat o important que les altres	Si busquem pluja prefer:neu, buscarà pàgines amb les dues paraules però prioritzarà neu.	prefer:	Bing
cenyir a un lloc web	Permet reduir l'abast de la cerca a un únic lloc web o plataforma.	Si ens interessa buscar pluja només al portal de la Corporació Catalana de Mitjans Audiovisual, podrem restringir-hi mitjançant pluja site:ccma.cat	site:	Google, DuckDuckGo, Bing
excloure un lloc web	Permet excloure de la cerca un determinat lloc web o plataforma.	Si ens interessa buscar pluja però descartar els resultats de la Corporació Catalana de Mitjans Audiovisuals, podrem filtrar-ho mitjançant -site:meteocat.cat	-site:	Google, DuckDuckGo, Bing
cercar llocs similars	Cerca llocs amb coincidències de contingut amb un lloc determinat	Si escrivim pluja related:ccma.cat ens buscarà llocs amb continguts similars als de la Corporació Catalana de Mitjans Audiovisuals	related:	Google
cenyir a un sol tipus de fitxer	Ens permet triar el tipus de fitxers que volem trobar, entre els moltíssims fitxers disponibles	Si només volem fitxers amb l'extensió PDF haurem de fer la cerca així: pluja filetype:PDF.	filetype:	Google i DuckDuckGo
cercar dins els caràcters de la URL	De vegades, el nom del domini o els directoris que completen la URL aporten informació rellevant; amb això podem buscar-hi dins	Si busquem pluja inurl:previsio ens aportarà resultats que tinguin la paraula pluja dins de la pàgina i la cadena previsio dins del text de la URL. Per exemple:https://www.ccma.cat › el-temps › previsio › pluges	inurl:	Google, DuckDuckGo
cercar en el camp TITLE	Cada pàgina web té un títol que és el que apareix a la pestanya del navegador i és un contingut clau per als cercadors. Podem fer que un text tingui una determinada paraula en aquest camp.	Si busquem pluja intitle:aiguat buscarà pàgines que a l'interior tinguin la paraula pluja i al camp TITLE tinguin aiguat.	intitle:	Google, Bing
cercar pàgines que enllacin a una altra	De vegades ens interessa buscar en pàgines que estiguin enllaçades ab una determinada pàgina.	Podem buscar la paraula pluja en totes les pàgines enllaçades amb Gencat escrivint: pluja link:gencat.cat	link:	Google, Bing
cercar números en un interval	Cerca, a més de la paraula que busquem, que en la mateixa pàgina hi hagi una xifra que es trobi dins de l'interval demanat.	Volem buscar pàgines on surti la paraula pluja però que facin referència només a les que van tenir lloc als anys 60, doncs podem fer una cerca del tipus pluja 1960..1969	..	Google
filtrar per llengua	Podem restringir la cerca només a pàgines en una determinada llengua.	En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable	accés per formulari	Google
filtrar per àmbit territorial	Podem restringir les cerques a pàgines d'un determinat territori en el món.	En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable	accés per formulari	Google
filtrar per data d’actualització	Podem restringir la cerca a un determinat rang de dates per obtenir només pàgines creades o actualitzades en un període concret	En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable	accés per formulari	Google
filtrar contingut sexualment explícit	Podem excloure de la cerca la pornografia o altres continguts no adequats per a menors	En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable	accés per formulari	Google
filtrar per drets d’ús	Podem cercar pàgines amb diversos tipus de cessions de drets d'ús per poder-ne reutilitzar els continguts garantint que no incorrem en anomalies jurídiques	En aquest cas hem de recórrer als formularis de cerca avançada i demanar-ho en el filtre, que s'ofereix mitjançant un desplegable	accés per formulari	Google

Llista d'operadors vàlids als principals cercadors

Operadors de Google

operador	explicació i exemples
“”	El que posem entremig de cometes serà la cadena exacta de paraules que buscarà, per exemple “pluja de granotes” només oferirà documents on surt, exactament, “pluja de granotes”.
OR	És un operador que ens mostrarà aquells resultats relacionats amb qualsevol de les dues paraules entre les quals l’introduïm. Per exemple: pluja or vent ens oferirà resultats tant de pluja com de vent.
AND	(que també pot ser “+”. Ofereix aquells resultats on apareixen les dues paraules entre les quals el posem. Pere exemple, pluja and vent ens oferirà resultats que parlin de pluja, però que també parlin de vent.
-	El símbol de restar davant d’una paraula farà que aquesta no aparegui. Per exemple, si posem pluja -vent sortiran aquells documents on surt pluja, però excloent-ne aquells on surt vent.
*	Si el posem davant d’una cadena de lletres, ens donarà paraules que comencin amb aquesta cadena. Si posem *fisio ens sortirà fisioteràpia, fisiologia, etc.
define:	ofereix la definició de la paraula que hi posem al darrere. Així, define:pluja ens definirà pluja.
site:	cenyeix la cerca a la URL (URL és l’adreça que escrivim a la barra de navegació quan volem accedir a una pàgina) que hi posem darrere. Així pluja site:meteocat.cat ens oferirà la paraula pluja només a meteocat.cat.
info:	mostra totes les entrades que Google té de la URL que hi posem darrere. Així, info:meteocat.cat ens ensenyarà tot allò que Google té de meteocat.cat.
related:	busca llocs similars a la URL que s’hi posa al darrere. Així, si posem a Google related:google.com, el cercador es veu obligat a mostar-nos la seva competència, pobre
link:	localitza pàgines que enllacen a la de la URL que hi posem darrere
cache:	mostra la pàgina tal com era el darrer cop que Google la va visitar
filetype:	cenyeix la cerca al tipus d’extensió de fitxer que s’hi posa al darrere (per exemple: filetype:pdf, txt, doc…), és a dir, pluja filetype:pdf si volem els pdf que parlen de pluja.
inurl:	cerca la paraula que s’hi posa al darrere o les paraules que s’hi posen darrere dins de la URL de la pàgina
allinurl:	és com l’anterior, però cerca que hi siguin totes les paraules (com si hi hagués ‘and’ entre elles)
inanchor:	és com inurl, però cerca dins del text que identifica àncores (enllaços interiors de pàgina)
allinanchor:	és com allinurl però amb àncores
intitle:	és com inurl però cerca dins del camp títol que tenen totes les pàgines web
allintitle:	és com allinurl però dins del camp títol
@	davant d’una paraula, cerca usuaris de Twitter
#	davant d’una paraula, cerca l’etiqueta a Twitter
$	davant d’una xifra i darrere d’un producte, busca on s’ofereix aquest producte per aquest preu
..	permet fer cerques que responguin a l’interval. Per exemple, si busquem ‘televisor 200€..300€ ens buscarà televisors per aquest preu i si busquem ‘Montblanc 1400..1425” ens buscarà la paraula Montblanc en pàgines on també aparegui qualsevol xifra entre 1400 i 1425

Operadors de Bing:

operador	explicació i exemples
+	permet trobar tots els termes que el porten davant incloent-hi termes buits, que normalment no es tenen en compte (preposicions, articles, etc.)
“”	permet trobar cadenes exactes (com en Google)
AND i &	busca totes les pàgines que contenen els termes encadenats amb aquests operadors
NOT i -	exclou les paraules precedides per aquests operadors
OR o barra vertical	inclou les paraules que contenen una o altra paraula separades per aquest operador
contains:	cerca pàgines que incloguin fitxers amb el tipus de contingut que s'hi especifica. Per exemple, si posem pluja contains:gif ens buscarà pàgines amb la paraula pluja on hi hagi algun fitxer GIF enllaçat
ext: / filetype:	cerca pàgines amb l'extensió que busquem, per exemple PDF
inanchor:, inbody:, intitle:	cerca la cadena dins del l'àncora, el cos del text o el camp títol de la pàgina
ip:	cerca pàgines allotjades a la IP que s'indica (la IP són 4 números separats per punts)
language:	cerca pàgines escrites en la llengua indicada (amb codis del tipus: FR, ES, CA, etc.)
loc:, location:	restringeixa una determinada zona o regió
prefer:	de les diverses paraules que formen la cerca, quina és la que és més important que surti. Per exemple pluja prefer:neu. Sortiran documents amb les dues paraules, però prioritzarà les que inclouen neu
site:	restringeix a una determinada URL
feed:	restringeix la cerca a canals RSS d'una determinada temàtica.
hasfeed:	cerca pàgines de les quals penja un feed del tema indicat
url:	comprova sil a URL que aportem està indexada a Bing

Operadors de DuckDuckGo

operador	explicació i exemples
“”	retorna la cadena exacta situada entre cometes
-	exclou la paraula precedida d’aquest signe
+	busca els documents on la paraula precedida d’aquest signe surt més
filetype:	busca els documents que tenen l’extensió especificada
site:	busca dins d’un lloc determinat
-site:	exclou els d’un lloc determinat
intitle:	busca que dins del camp títol tingui la paraula que busquem
inurl:	busca que dins la URL tingui la paraula que busquem
\:	ens fa saltar directament al primer resultat sense mostrar-nos el llistat de cerca
!	És un operador Bang! Permet cercar directament a determinats llocs

DuckDuckGo ofereix les dreceres de cerca Bang!, que permeten fer cerques directes en determinats llocs. Per exemple si escrivim !tw pluja ens cercarà la paraula pluja dins de Twitter i ja ens oferirà el resultat directament a Twitter. El servei el presta en una quantitat ingent de serveis, des de repositoris acadèmics a grans botigues en línia, però també en glossaris de llenguatges de programació, bases de dades, etc.

Vegeu alguns dels principals operadors Bang! de DuckDuckgo:

operador	lloc on fa la cerca directa
!w	wikipedia
!a	amazon
!tw	Twitter
!ig	Instagram
!fb	Facebook

Trobareu tots els operadors Bang!, en aquesta pàgina.

Amb aquestes eines podeu realitzar cerques acurades en els principals cercadors. Els conceptes que aprendreu, us serviran, a més per millorar les cerques quan utilitzeu altres cercadors que tinguin prestacions avançades, encara que tinguin un abast més restringit.

Proveu de fer una cerca amb cada operador, si podeu canviant de cercador. Després, experimenteu cerques vàries amb cadascun dels cercadors per veure'n l'estil i les possibilitats

Ús del sistema d'expressions regulars REGEX

El sistema d'expressions regulars REGEX és un sistema de codificació de cerques basades en patrons de paraules. En trobaràs més informació a Viquipèdia i podràs experimentar i fer proves en aquest

Google admet l'ús d'expressions regulars molt simples, però que poden ser molt útils per trobar determinades cadenes literals de mots en combinació.

Si introduïm a Google: "(vi|arròs) (blanc|negre)", ens donarà el mateix resultat que aquesta cadena booleana: "arròs blanc" OR "arròs negre" OR "vi blanc" OR "vi negre"

Postcerca: filtratge addicional i ordenació dels resultats

Un cop obtinguts els resultats, sigui per cerca ordinària, amb operadors o avançada, la major part de cercadors permeten filtrar o ordenar els resultats mitjançant un menú que es troba al capdamunt de la llista de resultats obtinguts.

En el cas de DuckDuckGo, el filtre postcerca permet filtrar per tipologies de contingut (web, imatges, vídeos, notícies, mapes), per territori, per seguretat de la cerca i per temps.

En el cas de Bing, el filtre postcerca permet filtrar per imatges, vídeos, mapes, notícies, elements desats (pel mateix usuari, procedents d'anteriors cerques), per data, per llengua i per regió.

En el cas de Google, el filtre postcerca permet filtrar per imatges mapes, vídeos, productes, llibres, vols, finances (de fet, ho adapta a la cerca que ha fet la persona). Mitjançant l'apartat eines, permet encara altres filtratges addicionals: idioma, moment, etc. Quan apliquem un filtre addicional com el d'imatges, encara obtenim una segona capa de filtres: mida, color predominant, drets d'utilització, tipus d'imatge, hora. L'eina de postcerca de Google és excepcionalment rica.

-imatge del menú de postfiltratge de google

Cercar en un set de dades obertes

En un primer moment, els repertoris de dades obertes oferien l’accés directe als fitxers, que es decarregaven i es gestionaven des de l’ordinador dels usuaris amb eines com processadors de textos, fulls de càlcul, etc.. Mica en mica, el creixement del nombre de sets de dades disponibles i de la mida i quantitat de dades contingudes en aquests sets va fer que aquest sistema resultés poc útil i les administracions es van procurar eines especialitzades per gestionar i oferir dades obertes com Socrata, que és la que utilitza ara mateix la Generalitat. Altres administracions han optat pel mateix sistema o per sistemes que ofereixen prestacions similars. L’explicació que trobaràs a continuació et servirà, doncs, per a qualsevol repertori de dades obertes.

La cerca en un repertori de dades obertes es fa en dues passes. En primer lloc, ens cal cercar el set que necessitem. Un cop localitzat, busquem la dada que ens interessa a l’interior del set.

Imaginem que busquem un contracte menor de l’any passat entre l’empresa X i la direcció general Y del departament Z de la Generalitat.

En primer lloc, obrirem el repertori de dades obertes de Gencat i ens situarem al formulari de cerca per cercar el set que ens interessa. En aquest cas, la paraula de cerca serà “contractes”. Ens sortiran diversos sets de contractes i triarem el de contractes menors.

En aquest punt, accedirem al visualitzador de dades obertes, que ens mostrarà la relació de contractes menors en forma de taula de manera ben senzilla. Si, a més, ho consultem amb un ordinador disposarem de moltes visualitzacions possibles (gràfiques, estadístiques, etc.):

Obtenir un RSS amb les novetats del set (cada vegada que hi hagi un assentament nou)
Compartir el set
Accedir-hi des de diverses modalitats de vista i amb diverses ordenacions
Filtrar-lo per algun criteri (a partir d'operadors lògics accessibles des de menús i altres opcions)
Generar visualitzacions gràfiques (amb gràfics estadístics, etc.)
Exportar les dades a tota mena de formats (CSV, JSON, XML…)
Encastar-ho

Possibilitats d'accés i visualització que ofereix Socrata, el gestor de dades obertes de Gencat

Com que el que ens interessa és una dada concreta, el que farem és buscar la icona de la lupa que ens donarà accés al formulari del cercador. Allí podrem buscar pel criteri que ens convingui (el nom de l’empresa, el nom del departament o de la direcció general, l’import, la data…). Amb això obtindrem la dada exacta que ens interessa.

Encara hi ha alguns sets de dades que no són disponibles amb aquest visualitzador, però es poden descarregar i hi podem treballar i cercar informació des de programes de full de càlcul, etc.

El sistema d’altres sets de dades institucionals, tot i no ser igual és molt similar al de Gencat i les prestacions que ofereix i la manera de cercar-hi informació és la mateixa.

Vegeu alguns llocs de dades obertes que tenim a disposició:

Llocs per cercar dades estadístiques

Hi ha diversos llocs que ofereixen dades estadístiques. L'IDESCAT és l'organisme que, pel que fa a Catalunya, n'ofereix més. El mateix web mostra els sistemes per accedir a la informació, que és molt nombrosa i que pot resultar molt útil. Normalment cal triar el contingut i després el tipus d'estadística concreta que en volem consultar, però el web ofereix moltes maneres d'accedir-hi. A banda de l'IDESCAT també podem trobar molta informació estadística relacionada amb Catalunya al CEO, l'INE i en altres llocs d'estadística de l'administració:

Redacció d’indicacions per a xatbots basats en intel·ligències artificials generatives

Per comunicar-nos amb els xatbots basats en intel·ligències artificials generatives com els que hem presentat més amunt (ChatGPT, Bard, Perplexity), utilitzem indicacions o apunts (en anglès, "prompts"). A continuació, aportarem alguns consells per redactar indicacions amb finalitat de cerca d’informació, és a dir, no orientades a altres possibilitats com podria ser generar textos de ficció, etc.

Les indicacions són l’entrada d’informació que el sistema utilitzarà per desencadenar un determinat resultat. Si és una intel·ligència generativa basada en el text, el resultat serà un text desencadenat per la nostra indicació.

Els elements que aporta la indicació solen ser els següents:

Component	Descripció	Exemple
Dades d’entrada o pregunta	És la qüestió per a la qual necessitem una resposta	“Necessito informació sobre el rector de Vallfogona”
Instruccions	Tasques específiques que volem que el xatbot porti a terme mentre processa la resposta	“Inclou tota la informació que puguis sobre la relació del rector amb el barroc i amb els bandolers”
Elements de context	Ajudaran a afinar la resposta i evitaran que perdem el temps amb respostes que se’n vagin del tema o en completaran els aspectes que més ens preocupin	“No t'oblidis de parlar de la majordoma i de l'escolà, però no entris en debats sobre el lloc de naixement.”
Qüestions de format relatives a la sortida	Requisits de forma que ens aniran bé per treballar	“La resposta hauria de tenir un màxim de 300 paraules, que s’han de mostrar en vers, no en prosa.”

A continuació et facilitem consells per redactar indicacions útils en un procés de cerca d’informació i elaboració de coneixement:

Comença amb indicacions simples. Centra't doncs en la pregunta a la qual vols obtenir resposta. A partir de la primera resposta que obtinguis, afegeix els elements que t'ajudin a perfeccionar-la.
Si necessites un text amb moltes parts, t'anirà bé de trossejar la indicació i fer-ne de parcials.
Com més específica sigui la indicació, assoliràs més precisió. No obstant això, no descartis un tempteig previ d'abast més ampli per veure com respon.
No dubtis a demanar el format que més et convingui; per exemple: "Diga'm 50 noms de plantes verinoses en català. Utilitza aquest esquema per a cadascuna: -Nom de la planta en català: / Nom de la planta en llatí / símptomes que provoca el seu consum / gravetat".
Busca la màxima precisió en el tipus de resultat que vols; per exemple: "Explica'm en 3 frases qui era el rector de Vallfogona" i no "Explica'm, resumidament, qui era el rector de Vallfogona".
Sigues clar i concís, però tingues present que és més important la claredat que la concisió, ja que t’interessa que les respostes siguin precises.
Aporta el context adequat que sigui rellevant per a la pregunta. T’evitarà confusions i ajudarà a millorar la precisió de la resposta.
No dubtis a ser específic. Dona detalls. Evita que la resposta es perdi en generalitzacions.
Proporciona instruccions detallades si és necessari. Especifica el tipus de resposta que esperes (explicació, resum, pros i contres, etc.).
Especifica la tonalitat o l'estil de resposta desitjats; per exemple: "respon amb un to hostil" o "fes-ho de manera seriosa" o "fes-ho amb un to amigable".
Demana exemples concrets; per exemple: "Vull el nom de 50 obres d'art contemporani exposades en museus de Barcelona".
Limita l'extensió i determina la forma; per exemple: "respon en un màxim de 200 paraules", "respon en 300 frases successives", etc.
No tinguis por de revisar i ajustar el teu indicador si no obtens la resposta desitjada. Experimenta fins a obtenir els resultats que necessites.
Utilitza el xatbot de manera ètica i evita formular preguntes que puguin promoure contingut ofensiu o inapropiat.
No l'utilitzis en un entorn professional si no saps quin és el posicionament de la teva organització respecte d'aquesta eina.

Tingues sempre al cap que el nucli de la indicació pot ser, si vols, un comandament imperatiu. Aprèn a jugar amb un repertori d'instruccions del tipus "escriu, classifica, ordena, tradueix, resumeix, programa…", però, sobretot, no posis límits a la curiositat. A continuació t'oferim alguns exemples d'indicacions que et poden ajudar a veure les possibilitats de l'eina:

"Resumeix en una frase l'aportació del rector de Vallfogona al barroc català."
"Extreu tots els topònims que surten a l'obra de Cervantes."
"Classifica les comarques catalanes per prosperitat econòmica i justifica en cada cas la classificació."
"Contesta aquesta pregunta d'acord amb el to amb què la formulo: Ei, col·lega, què m'expliques de Nietzsche i el cavall?"
"Programa el codi Javascript necessari perquè un web et pregunti la data de naixement i respongui el signe del zodíac corresponent."
"Busca la relació entre la seqüència de Fibonacci i els balanços econòmics del sector urbanístic entre 1990 i 2007"

I recorda, sempre, les preguntes clàssiques, com aquesta:

"On, quan, com i per què va morir Juli Cèsar?"

↑ Índex de la unitat

← Inici | Unitat 2 →

Autoria i llicència

Data d'actualització: 23.11.2023

Cerca avançada, monitoratge i validació d'informació a Internet

Menú

Unitat 1: La cerca avançada d'informació en un món de dades

1.1 Què faràs amb aquests continguts?

1.2 El bosc s’ha tornat una selva

La millor actitud i les millors eines

Una selva amb perills, sobretot emocionals

1.3 Abundància d’informació, importància de les dades

Dades, informació, coneixement, saviesa

Dades obertes

Dades massives o “big data”

1.4 Com cercar a Internet

El miratge de la bombolla de filtres

Entendre bé les característiques de l’encàrrec

Definició del tema i l'àmbit de cerca

Elecció de les paraules o expressions de cerca

Elecció de les eines de cerca i la modalitat

Cerca

Calibratge dels resultats

Recopilació i homogeneïtzació del resultat

Establiment dels primers paràmetres de seguiment

1.5 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials

1.6 Eines de cerca: aproximació i ús avançat

Cercadors i tipus de cercador disponibles

Cercadors d’abast general (cerquen en el conjunt d’Internet)

Cercadors per a xarxes socials

Cercadors de caràcter acadèmic

Eines de cerca en dades obertes

Cercadors de notícies

Cerques millorades amb l'ús de serveis de xatbot d'intel·ligències artificials generatives

1.7 Posem-nos a cercar

Cerca simple

Introducció a la cerca amb operadors i avançada

Tipus de cerques amb operadors i avançada

Llista d'operadors vàlids als principals cercadors

Ús del sistema d'expressions regulars REGEX

Postcerca: filtratge addicional i ordenació dels resultats

Cercar en un set de dades obertes

Llocs per cercar dades estadístiques

Redacció d’indicacions per a xatbots basats en intel·ligències artificials generatives

Cerca avançada, monitoratge i validació d'informació a Internet

Menú

Codi QR

Unitat 1: La cerca avançada d'informació en un món de dades

1.1 Què faràs amb aquests continguts?

1.2 El bosc s’ha tornat una selva

La millor actitud i les millors eines

Una selva amb perills, sobretot emocionals

1.3 Abundància d’informació, importància de les dades

Dades, informació, coneixement, saviesa

Dades obertes

Dades massives o “big data”

1.4 Com cercar a Internet

El miratge de la bombolla de filtres

Entendre bé les característiques de l’encàrrec

Definició del tema i l'àmbit de cerca

Elecció de les paraules o expressions de cerca

Elecció de les eines de cerca i la modalitat

Cerca

Calibratge dels resultats

Recopilació i homogeneïtzació del resultat

Establiment dels primers paràmetres de seguiment

1.5 Fonts de dades i d’informació a Internet, amb especial atenció a les dades obertes i fonts de dades oficials

1.6 Eines de cerca: aproximació i ús avançat

Cercadors i tipus de cercador disponibles

Cercadors d’abast general (cerquen en el conjunt d’Internet)

Cercadors per a xarxes socials

Cercadors de caràcter acadèmic

Eines de cerca en dades obertes

Cercadors de notícies

Cerques millorades amb l'ús de serveis de xatbot d'intel·ligències artificials generatives

1.7 Posem-nos a cercar

Cerca simple

Introducció a la cerca amb operadors i avançada

Tipus de cerques amb operadors i avançada

Llista d'operadors vàlids als principals cercadors

Ús del sistema d'expressions regulars REGEX

Postcerca: filtratge addicional i ordenació dels resultats

Cercar en un set de dades obertes

Llocs per cercar dades estadístiques

Redacció d’indicacions per a xatbots basats en intel·ligències artificials generatives