Seguint amb l'anàlisi, en
una primera aproximació de la taula anterior podem veure que la paraula més
repetida és: “dones”
21 vegades
|
"Dones, Lluita
Feminista e Independència" (TEXT 1)
|
25 vegades
|
"Feministes per
la independència" (TEXT 2)
|
Tanmateix, les paraules “feministes/feminista” tenen una freqüència molt més gran en el
TEXT 2 (15 vegades) que en el TEXT 1 (3 vegades).
També
podem destacar que hi ha 3 paraules que es repeteixen en els dos textos però
amb freqüències diferents:
"Dones, Lluita
Feminista e Independència" (TEXT 1)
|
"Feministes per
la independència" (TEXT 2)
|
|
país
|
6 vegades
|
10 vegades
|
dret
|
6 vegades
|
5 vegades
|
independència / independentistes
|
7 vegades
|
4 vegades
|
I,
finalment, també podem constatar que la paraula lluita (18 vegades) i social (6
vegades) apareixen en el TEXT 1, però cap en el TEX 2.
En
tercer lloc, he utilitzat l’opció de la “Concordance”. Les concordances
són una altra manera diferent de veure i analitzar un text: mostren tots els
contextos en què apareix una paraula. És una visió transversal del text i
permet analitzar cada un dels contextos en els quals apareixen les paraules del
corpus.
Aplicat
amb la paraula “independència”, el resultat és el següent:
TEXT
1
TEXT
2
També
podem aplicar l’eina “Concordance Plot”, que ens permet observar les concordances
d’una forma gràfica, com un “codi de barres”, i que ens indica en quina
posició apareix la paraula que s’ha buscat.
En
el cas de la paraula “dones”, el resultat és:
En
el cas de les paraules “lluita” i
“social” podem observar que no són presents en el TEXT 2:
En
quart lloc, he volgut comparar la riquesa lèxica dels dos textos. El càlcul es
pot obtenir amb la fórmula anomenada Type-Token ration. Els Tokens
són el conjunt de caràcters separats per un espai en blanc i els Types
el nombre de Tokens iguals. Si tenim en compte que el nombre de Types
sempre és inferior al nombre de Tokens, el valor resultant estarà sempre entre
0 i 1. Com més s’acosti aquest valor a 1, més riquesa lèxica tindrà el text. I com més s’acosti a 0, més pobre serà el text.
Les
dades per fer el càlcul són les següents:
"Dones, Lluita Feminista e
Independència" (TEXT 1)
|
"Feministes per la
independència" (TEXT 2)
|
|
Després d’aplicar Word List
|
Després d’aplicar Word List
|
|
Word Types:
496
|
Word Types:
379
|
|
Word Tokens:
1338
|
Word Tokens:
969
|
|
Després d’aplicar Stopwords
|
Després d’aplicar Stopwords
|
|
Word Types:
422
|
Word Types:
319
|
|
Word Tokens:
664
|
Word Tokens:
502
|
I
els resultats:
TEXT
1
|
TEXT
2
|
|
Riquesa
Lèxica aplicant Word List TEXT 1
|
0,3707
|
0,3911
|
Riquesa
Lèxica aplicant Word List i Stopwords TEXT 2
|
0,6355
|
0,6355
|
Com
es pot observar, les dades són pràcticament iguals. Lògicament, la riquesa
lèxica s’incrementa quan hem aplicat el filtre de les Stopwords.
Comptat
i debatut, de l’anàlisi lexicomètrica dels textos proposats podem concloure
que, des de posicions d’esquerra, “dones” i “procés independentista” de
Catalunya van molt lligats.
Però
hi ha una diferència cabdal. Mentre que en l’article de Blanca Serra, "Dones,
Lluita Feminista e Independència" (TEXT 1), les paraules “lluita” i “social” apareixen i tenen un pes molt important, amb tot el
significat de càrrega ideològica que comporten aquests dos termes, en l’article
del grup Feministes per la Independència
- "Feministes per la independència"
(TEXT 2) -, aquestes dues paraules no apareixen en cap moment. La possible
interpretació d’aquesta diferència, però, ja no s’ha de buscar en l’anàlisi de
corpus textuals. I és que com deia R.Barthes : “...d'obra només n'hi ha una, de
textos tants com lectors sàpiguen llegir...”.
Bibliografia i Webgrafia
Navarro Colorado, Borja (2014): Guia
rápida de análisis e corpus (con AntConc). Universidad de Alicante.
Material en PDF
AntConc 3.2.1.
http://www.slideshare.net/laurarp/gua-antconc-321-presentation
Cap comentari:
Publica un comentari a l'entrada