dimarts, 31 de maig del 2016

AntConc (2ª part): anàlisi de diversos articles


En l’anterior entrada al blog, vaig fer l’anàlisi d’un article en el programa AntConc on podíem veure, sense gaires problemes, la temàtica de què tractava l’article mitjançant l'anàlisi lèxic. 

Ara, en aquesta segona part, he volgut posar de manifest el resultat obtingut de l’anàlisi d’onze articles, tots ells del mateix blog de política Politikon, dins la seva secció de migracions.

Seguint les mateixes passes que l’anterior entrada, he comprovat les paraules més i menys freqüents que apareixen en aquests texts, sense filtrar, i que per tant no ens diuen gairebé res, i un cop filtrades (stopwords). Amb l’aplicació de la fórmula types-token ration, en aquest cas 2862/6272=0.456, observem com aquí ha disminuït la riquesa lèxica, en relació a l’anàlisi de l’article de l’anterior entrada al blog.  

 
La llista de freqüències ens permet ara estudiar i analitzar les dades obtingudes. Podem dir que les paraules majoritàriament usades són: més/immigració/crisi/immigrants/refugiats/Europa/treballadors/país/política, entre altres.



El que he trobat interessant és poder fer la recerca de la freqüència en què algunes de les paraules es repeteixen en els articles analitzats. Mitjançant la selecció de la paraula que ens interessa, posem com a exemple immigració, anem a l’apartat de Concordance Plot,  on ens mostrarà quins dels articles seleccionats utilitzen la paraula que hem triat.

 
Si posem un altre exemple de paraula podríem obtenir ja més detalls sobre el tractament que els articles fan d’aquesta immigració, com per exemple la paraula refugiats. Ara tenim que la paraula immigració és genèrica de pràcticament tots els articles però només cinc dels articles el relacionen amb refugiats.


Per últim podem veure la funció dels clusters o agrupacions que ens permet interrogar al corpus a partir d'una paraula clau i trobar unitats terminològiques per més d'una unitat. Gràcies a aquesta cerca podem veure que dos dels clusters més freqüents de la paraula crisi són crisi de (13 entrades) i crisi de refugiats (10 entrades).

Si a més a més fem clic sobre qualsevol dels candidats, s'accedeix a la pestanya de concordança dels mateixos.


Fins aquí l'exemplificació de l'ús d'aquest programa informàtic que ens ofereix, de manera gratuïta, les eines necessàries per analitzar i explorar un corpus de text com ara les concordances, els llistat de paraules més freqüents, col·locacions, agrupacions, n-gramas i llistes de paraules clau.  
Bibliografia

-Navarro Colorado, Borja. Guía rápida de análisis de corpus (con AntConc). Universidad de Alicante. 2014.

Cap comentari:

Publica un comentari a l'entrada