Seguidors

dimecres, 1 de juny de 2016

POST 17: ANÀLISI LEXICOMÈTRICA (2)



Seguint amb l'anàlisi, en una primera aproximació de la taula anterior podem veure que la paraula més repetida és: “dones”

21 vegades
"Dones, Lluita Feminista e Independència" (TEXT 1)
25 vegades
"Feministes per la independència" (TEXT 2)

Tanmateix les paraules “feministes/feminista” tenen una freqüència molt més grand en el TEXT 2 (15 vegades) que en el TEXT 1 (3 vegades).

També podem destacar que hi ha 3 paraules que es repeteixen en els dos textos però amb freqüències diferents:

"Dones, Lluita Feminista e Independència" (TEXT 1)
"Feministes per la independència" (TEXT 2)
país
6 vegades
10 vegades
dret
6 vegades
5 vegades
independència / independentistes
7 vegades
4 vegades

I, finalment, també podem constatar que la paraula lluita (18 vegades) i social (6 vegades) apareixen en el TEXT 1 però cap en el TEX 2.


En tercer lloc, he utilitzat l’opció de la “Concordance”. Les concordances són una altra manera diferent de veure i analitzar un text: mostren tots els contextos en què apareix una paraula. És una visió transversal del text i permet analitzar cada un dels contextos en els que apareixen les paraules del corpus.
Aplicat amb la paraula “independència”, el resultat és el següent:
 
TEXT 1


TEXT 2


També podem aplicar l’eina “Concordance Plot”, que ens permet observar les concordances d’una forma gràfica, com un “codi de barres”, i que ens indica en quina posició apareix la paraula que s’ha buscat.

En el cas de la paraula “dones”, el resultat es:



En el cas de les paraules  “lluita” i “social” podem observar que no són presents en el TEXT 2:




En quart lloc he volgut comparar la riquesa lèxica dels dos textos. El càlcul es pot obtenir amb la fórmula anomenada Type-Token ration. Els Tokens són el conjunt de caràcters separats per un espai en blanc i els Types el nombre de Tokens iguals. Si tenim en compte que el nombre de Types sempre és inferior al nombre de Tokens, el valor resultant estarà sempre entre 0 i 1. Quan més s’acosti aquest valor a 1, més riquesa lèxica tindrà el text. I quan més s’acosti a 0, més pobre serà el text.

Les dades per fer el càlcul són les següents:
"Dones, Lluita Feminista e Independència" (TEXT 1)

"Feministes per la independència" (TEXT 2)
Desprès d’aplicar Word List

Desprès d’aplicar Word List
Word Types: 496

Word Types: 379
Word Tokens: 1338

Word Tokens: 969
Desprès d’aplicar Stopwords

Desprès d’aplicar Stopwords
Word Types: 422

Word Types: 319
Word Tokens: 664

Word Tokens: 502

I els resultats:

TEXT 1
TEXT 2
Riquesa Lèxica aplicant Word List TEXT 1
0,3707
0,3911
Riquesa Lèxica aplicant Word List i Stopwords TEXT 2
0,6355
0,6355

Com es pot observar, les dades són pràcticament iguals. Lògicament, la riquesa lèxica s’incrementa quan hem aplicat el filtre de les Stopwords.

Comptat i debatut, de l’anàlisi lexicomètrica dels textos proposats podem concloure que, des de posicions d’esquerra, “dones” i “procés independentista” de Catalunya van molt lligats.

Però hi ha una diferència cabdal. Mentre que en l’article de Blanca Serra, "Dones, Lluita Feminista e Independència" (TEXT 1), les paraules “lluita” i “social” apareixen i tenen un pes molt important, amb tot el significat de càrrega ideològica que comporten aquests dos termes, en l’article del grup Feministes per la Independència - "Feministes per la independència" (TEXT 2) -, aquestes dues paraules no apareixen en cap moment. La possible interpretació d’aquesta diferència, però, ja no s’ha de buscar en l’anàlisi de corpus textuals. I és que com deia R.Barthes : “...d'obra només n'hi ha una, de textos tants com lectors sàpiguen llegir...”.
 


Bibliografia i Webgrafia
Navarro Colorado, Borja (2014): Guia rápida de análisis e corpus (con AntConc). Universidad de Alicante. Material en PDF
AntConc 3.2.1.
http://www.slideshare.net/laurarp/gua-antconc-321-presentation

Cap comentari:

Publica un comentari a l'entrada