Així vam crear el test dialectal de l’Ara.cat

tumblr_inline_n9f7rwC3ep1s4f3i6

Mai saps del cert si un projecte funcionarà o no, però en el cas del test dialectal que fa uns dies vam estrenar a l’Ara.cat teníem un precedent: el dialect quiz del New York Times, la història més vista del diari nord-americà el 2013. Tenint en compte com ens agrada als catalans jugar amb la nostra llengua, intuíem moltes visites.

tumblr_inline_n9fk6m2q5T1s4f3i6[quote_box_center] Per què ens agrada tant jugar amb la llengua?

Un guionista i dos filòlegs expliquen els motius de la fam verbívora dels catalans [/quote_box_center] A l’hora d’escriure aquest post, més de 165.000 lectors han completat el test. Més i tot del que segurament imaginàvem. [quote_box_center]El test dialectal ja és el més vist de la història de l’ARA[/quote_box_center]

El joc ‘Digue’m com parles i et diré d’on ets’ ha rebut en menys d’una setmana més de 300.000 visites La idea era donar a conèixer l’enorme riquesa de la nostra llengua i descobrir, amb un joc ben senzill, que cada catalanoparlant s’ha anat empeltant del parlar dels llocs on ha viscut ell i els seus avantpassats. ‘Escombra’ o ‘granera’? ‘Nosaltres’ o ‘naltros’? Construir el mapa dialectal de cada lector a partir de vint preguntes ràpides sobre paraules o expressions que es diuen diferent a diferents punts dels Països Catalans. ‘Digue’m com parles i et diré d’on ets’. Us animo a fer-lo si encara no l’heu fet. [quote_box_center]Les llengües dels pobles preromans, la dialectalització arribada des de la península Itàlica, la pressió del superstrat, el veïnatge d’altres llengües, les segregacions per causes polítiques, les relacions econòmiques, els trasllats humans, les variables socials, la convivència de llengües, la mateixa evolució interna, etc. són factors que, al llarg dels segles, han configurat les característiques de la nostra llengua històrica que, una i vària alhora, reflecteix, com en un mirall, l’esperit, la història, la manera de viure i pensar de tota la comunitat catalana. Els atles lingüístics constitueixen l’eina per excel·lència que permet estudiar, sobre bases científiques, la diferenciació d’una llengua des d’un angle geogràfic. Viquipèdia – Atles Lingüístic del Domini Català[/quote_box_center] He estat uns dies fora i ha estat divertit connectar el mòbil i veure com els amics anaven fent el joc i enviant missatges. “He fet el test dialectal de l’ARA. M’ha sortit Vallès / Barcelonès. Definitivament no puc tornar a Vic”, em deia irònicament un amic osonenc. Si feu la cerca “test dialectal” a Twitter veureu com els lectors de l’ARA han compartit en massa el seu mapa dialectal. Hi ha centenars de tuits. image Teníem clar l’objectiu i el to del joc, però per construir el mapa dialectal interactiu necessitàvem dades reals. Un estudi, un treball de camp rigorós, que avalés on es fa servir cada paraula per poder comparar després les respostes dels lectors al test. Com qui posa dos fulls a contrallum. Amb la Francina Bosch, ens vam posar a treballar amb el projecte. La Maria Rodríguez Mariné, lingüista de ARA, ens va parlar del Petit Altes Lingüístic del Domini Català (PALDC) de l’Institut d’Estudis Catalans. [quote_box_center] Explica la Maria Rodríguez a la introducció del test dialectal: “El Petit Atles Lingüístic del Domini Català és un dels resultats de la tasca ingent del nostre incansable dialectòleg Joan Veny. Ell mateix va ser un dels enquestadors del projecte que van iniciar als anys 50 Antoni Maria Badia i Margarit i Germà Colón, amb el qual es van recollir milers de dades: es van fer 2.453 preguntes a informants de 190 poblacions de tot el domini lingüístic. Des de la Secció Filològica de l’IEC, sota la direcció del mateix Veny i de Lídia Pons, encara avui es treballa per processar i divulgar totes aquestes dades (de moment, han vist la llum quatre dels nou volums previstos del ‘Petit…’)”. [/quote_box_center] La Maria es va bolcar en el projecte i ha estat la clau que el test afini tan bé. Partint de l’enquesta del PALDC, vam agafar vint paraules o expressions i vam crear una base de dades assignant a cada una de les 190 localitats de l’estudi la forma dialectal o formes dialectals que fan servir. En total, 3.800 registres. És la base sobre la qual podem esbrinar després d’on és el lector que completa el test.

La programació, la feina invisible

L’altra pota del projecte ha estat tecnològica. Una feina que sovint passa desapercebuda per l’usuari, però que en realitat és la clau perquè la idea abstracta sigui una realitat. El Marc Camprodon i la Idoia Longan, programadors, van idear l’algorisme que compara les respostes del test amb la base de l’enquesta del PALDC i busca en quin dels 190 punts és més possible que visqui el lector. Van geolocalitzar cada un dels 190 punts i ho van transformar en un mapa de calor per visualitzar millor el resultat. image Com que cada punt té assignat un dialecte i una comarca, podem saber el percentatge de similitud amb el dialecte, i la comarca on es més fàcil que hi visqui el lector. A comarques com el Maresme era més difícil ser precisos perquè l’ALDM només hi va fer enquesta a dos municipis (Tordera i Sant Andreu de Llavaneres). A mi, que sóc de Tiana –i a altres veïns del meu poble– ens surt que som del Barcelonès, el Bages i el Vallès Oriental. I resulta que és perquè suposadament a Tordera i a Llavaneres dels ‘bassals’ en diuen ‘basses’. A Tiana, que jo sàpiga sempre n’hi hem dit ‘bassals’. Hauríem pogut fer moltes preguntes, però poca gent hauria tingut la paciència d’acabar el test. Vam creure que amb vint n’hi havia prou. Era el màxim que podíem demanar als lectors. L’equilibri entre la precisió i la divulgació. La principal feina de la Maria va ser trobar mots i expressions que es diguessin diferent a molts llocs perquè l’algorisme funcionés amb només vint preguntes i no tingués dubtes entre punts distants. Per això vam incloure documents de so amb pronúncies, i això també explica perquè el guió de la història és una mica surrealista. Calia encabir paraules molt diferents. Va ser divertit buscar ‘actors’ per a les preguntes enregistrades. Aquí ens ho fem tot nosaltres: Gent d’ara, gent com tu, diu l’anunci del diari. La Inés Cornelles, de l’Ara TV; el Salva Almenar, el corresponsal al País Valencià; la Mariona Ferrer; la corresponsal gironina de Madrid… Quan el projecte va estar embastat, la Idoia Vallverdú va fer-ne aquest disseny tan clar i senzill, que el fa estiuenc i que t’empeny a jugar-hi. Volíem evitar que semblés una enquesta oficial, aquells formularis avorrits de les institucions. La idea del nom es del Marc Camprodon, cap de Tecnologia. L’Albert Pla, cap de Llengua, va donar l’okey al projecte amb el títol inclòs (‘digue’m’, en comptes de ‘digues-me’), i a última hora se’ns va acudir fer l’animació del títol, amb les paraules canviant (‘digue’m’, ‘dis-me’, ‘digues-mé’…).

El català que avui es parla

Les enquestes de l’ALDC es van començar a fer el 1964. Com que volíem que el test preguntés pel català que ara es parla vam evitar mots en desús. En canvi ens vam permetre la llicència d’incloure la pregunta de la ‘clara’, el ‘xampú’ i la ‘shandy’, que no és al llibre, és clar. La Francina i jo volíem expressions més col·loquials perquè el joc connectés amb els lectors i les diferents maneres de dir les coses. No és casualitat que la pregunta de la ‘clara’ fos la primera. Expressions que ens definissin geogràficament i dialectalment. Com ‘anar a fer el got’ / ‘anar a prendre algo’ / ‘anar a fer el toc’. O com les ‘vambes’ o les ‘kets’. O dir a les línies d’autobús per la companyia substantivitzada (la sarfa, la tusa)… Però no teníem prou base científica per assignar aquestes respostes en cada un dels 190 punts. A Vic hi han trobat a faltar els ‘eixavuiros’ i el ‘set’ [el participi del verb ser], i els de Badalona els ‘micacos’; que haurien afinat molt el resultat del test en aquestes ciutats. Però amb vint preguntes no hi cabia tot. Algú també hi ha trobat a faltar poder marcar més d’una resposta al test. En realitat no és cap problema perquè, en molts casos, a la base de dades ja havíem assignat per a cada un dels 190 punts més d’un mot possible. A Barcelona, l’arc de Sant Martí també es diu arc iris. I això està previst al joc. image

Al meu poble en diem…

Per compensar aquestes mancances i per seguir jugant amb la llengua, aquests dies hem estrenat un segon joc molt més participatiu. La Francina Bosch, amb el Carles Capdevila i la Sílvia Barroso, va buscar la manera que ara fossin els lectors els que proposessin paraules pròpies de cada localitat. La programació també és de la Idoia Longan i el disseny del Ricard Marfà, els responsables de la majoria d’interactius de l’ARA. [quote_box_center] El nou joc es diu Al meu poble en diem… i consisteix a anar escrivint els mots que us sembla que defineixen millor la parla de la vostra zona. També podeu confirmar si les paraules que proposen els altres per al vostre municipi les feu servir. Aquest cop ens la juguem més i depenem del tot de vosaltres, perquè serà més interessant com més material hi aneu introduint. Podreu veure els rànquings de les paraules i els municipis, i construirem una base de dades de localismes ben interessant, que conforma alhora la unitat i la diversitat de la llengua. Al meu poble en diem “Torno el diumenge 24”, Carles Capdevila [/quote_box_center]

Fer el test des de la platja 

Com que el consum per mòbil ja és tan alt com el de l’ordinador, i tant un com l’altre són jocs estiuencs que ve de gust fer-los a l’aire lliure amb més gent –cadascú amb el seu mòbil–, disseny i tecnologia van treballar plegats perquè tot s’adaptés a l’amplada del mòbil, cosa que en anteriors projectes, com ‘El joc dels Oscars’, no havíem pogut fer. El ‘responsive’ ha estat una de les claus de la viralització del test –el somni de tot periodista digital. Ens ha agradat descobrir com el joc ha donat per a tertúlies entre amics sobre com diem una cosa o una altra, i descobrir la diversitat i com el pas pels llocs i el contacte amb gent que ens estimem ens acaben canviant, també, com diem les coses. No preteníem res més.

… i així el va crear el New York Times

Darrere l’èxit del dialect quizz del ‘New York Times’ hi ha un becari. La història és curiosa. Josh Katz, un estudiant d’estadística de la Universitat de Carolina del Nord, va trobar un estudi de Harvard sobre els dialectes de l’anglès nord-americà i va estar treballant en la seva visualització fins que el diari ho va descobrir i el va cridar per fer-hi una estada. L’estudi original de Harvard consta de 122 preguntes a 155.000 nord-americans. Després Katz va ampliar-ho a 140 preguntes per incloure qüestions més actuals. Finalment, ja només per al joc interactiu, ho va reduir a 25.

image

Amb l’ajuda d’un editor gràfic, al cap d’uns mesos, Katz havia enllestit el que seria la història més vista del ‘New York Times’ l’any 2013. La llengua ens torna bojos.

image

La Maria Rodríguez, l’Esperança Sierra i jo vam explicar el joc en aquesta entrevista a Catalunya Ràdio.

New Comment