Seguidors

dimecres, 1 de juny del 2016

POST 17: ANÀLISI LEXICOMÈTRICA (2)


Seguint amb l'anàlisi, en una primera aproximació de la taula anterior podem veure que la paraula més repetida és: “dones”

21 vegades
"Dones, Lluita Feminista e Independència" (TEXT 1)
25 vegades
"Feministes per la independència" (TEXT 2)

Tanmateix, les paraules “feministes/feminista” tenen una freqüència molt més gran en el TEXT 2 (15 vegades) que en el TEXT 1 (3 vegades).

També podem destacar que hi ha 3 paraules que es repeteixen en els dos textos però amb freqüències diferents:

"Dones, Lluita Feminista e Independència" (TEXT 1)
"Feministes per la independència" (TEXT 2)
país
6 vegades
10 vegades
dret
6 vegades
5 vegades
independència / independentistes
7 vegades
4 vegades

I, finalment, també podem constatar que la paraula lluita (18 vegades) i social (6 vegades) apareixen en el TEXT 1, però cap en el TEX 2.


En tercer lloc, he utilitzat l’opció de la “Concordance”. Les concordances són una altra manera diferent de veure i analitzar un text: mostren tots els contextos en què apareix una paraula. És una visió transversal del text i permet analitzar cada un dels contextos en els quals apareixen les paraules del corpus.
Aplicat amb la paraula “independència”, el resultat és el següent:
 
TEXT 1


TEXT 2


També podem aplicar l’eina “Concordance Plot”, que ens permet observar les concordances d’una forma gràfica, com un “codi de barres”, i que ens indica en quina posició apareix la paraula que s’ha buscat.

En el cas de la paraula “dones”, el resultat és:



En el cas de les paraules  “lluita” i “social” podem observar que no són presents en el TEXT 2:




En quart lloc, he volgut comparar la riquesa lèxica dels dos textos. El càlcul es pot obtenir amb la fórmula anomenada Type-Token ration. Els Tokens són el conjunt de caràcters separats per un espai en blanc i els Types el nombre de Tokens iguals. Si tenim en compte que el nombre de Types sempre és inferior al nombre de Tokens, el valor resultant estarà sempre entre 0 i 1. Com més s’acosti aquest valor a 1, més riquesa lèxica tindrà el text. I com més s’acosti a 0, més pobre serà el text.

Les dades per fer el càlcul són les següents:
"Dones, Lluita Feminista e Independència" (TEXT 1)

"Feministes per la independència" (TEXT 2)
Després d’aplicar Word List

Després d’aplicar Word List
Word Types: 496

Word Types: 379
Word Tokens: 1338

Word Tokens: 969
Després d’aplicar Stopwords

Després d’aplicar Stopwords
Word Types: 422

Word Types: 319
Word Tokens: 664

Word Tokens: 502

I els resultats:

TEXT 1
TEXT 2
Riquesa Lèxica aplicant Word List TEXT 1
0,3707
0,3911
Riquesa Lèxica aplicant Word List i Stopwords TEXT 2
0,6355
0,6355

Com es pot observar, les dades són pràcticament iguals. Lògicament, la riquesa lèxica s’incrementa quan hem aplicat el filtre de les Stopwords.

Comptat i debatut, de l’anàlisi lexicomètrica dels textos proposats podem concloure que, des de posicions d’esquerra, “dones” i “procés independentista” de Catalunya van molt lligats.

Però hi ha una diferència cabdal. Mentre que en l’article de Blanca Serra, "Dones, Lluita Feminista e Independència" (TEXT 1), les paraules “lluita” i “social” apareixen i tenen un pes molt important, amb tot el significat de càrrega ideològica que comporten aquests dos termes, en l’article del grup Feministes per la Independència - "Feministes per la independència" (TEXT 2) -, aquestes dues paraules no apareixen en cap moment. La possible interpretació d’aquesta diferència, però, ja no s’ha de buscar en l’anàlisi de corpus textuals. I és que com deia R.Barthes : “...d'obra només n'hi ha una, de textos tants com lectors sàpiguen llegir...”.
 


Bibliografia i Webgrafia
Navarro Colorado, Borja (2014): Guia rápida de análisis e corpus (con AntConc). Universidad de Alicante. Material en PDF
AntConc 3.2.1.
http://www.slideshare.net/laurarp/gua-antconc-321-presentation

Cap comentari:

Publica un comentari a l'entrada