Seguint amb l'anàlisi, en
una primera aproximació de la taula anterior podem veure que la paraula més
repetida és: “dones”
21 vegades
|
"Dones, Lluita
Feminista e Independència" (TEXT 1)
|
25 vegades
|
"Feministes per
la independència" (TEXT 2)
|
Tanmateix
les paraules “feministes/feminista” tenen una freqüència molt més grand en el
TEXT 2 (15 vegades) que en el TEXT 1 (3 vegades).
També
podem destacar que hi ha 3 paraules que es repeteixen en els dos textos però
amb freqüències diferents:
"Dones, Lluita
Feminista e Independència" (TEXT 1)
|
"Feministes per
la independència" (TEXT 2)
|
|
país
|
6 vegades
|
10 vegades
|
dret
|
6 vegades
|
5 vegades
|
independència / independentistes
|
7 vegades
|
4 vegades
|
I,
finalment, també podem constatar que la paraula lluita (18 vegades) i social (6
vegades) apareixen en el TEXT 1 però cap en el TEX 2.
En
tercer lloc, he utilitzat l’opció de la “Concordance”. Les concordances
són una altra manera diferent de veure i analitzar un text: mostren tots els
contextos en què apareix una paraula. És una visió transversal del text i
permet analitzar cada un dels contextos en els que apareixen les paraules del
corpus.
Aplicat
amb la paraula “independència”, el resultat és el següent:
TEXT
1
TEXT
2
També
podem aplicar l’eina “Concordance Plot”, que ens permet observar les concordances
d’una forma gràfica, com un “codi de barres”, i que ens indica en quina
posició apareix la paraula que s’ha buscat.
En
el cas de la paraula “dones”, el resultat es:
En
el cas de les paraules “lluita” i
“social” podem observar que no són presents en el TEXT 2:
En
quart lloc he volgut comparar la riquesa lèxica dels dos textos. El càlcul es
pot obtenir amb la fórmula anomenada Type-Token ration. Els Tokens
són el conjunt de caràcters separats per un espai en blanc i els Types
el nombre de Tokens iguals. Si tenim en compte que el nombre de Types
sempre és inferior al nombre de Tokens, el valor resultant estarà sempre entre
0 i 1. Quan més s’acosti aquest valor a 1, més riquesa lèxica tindrà el text. I
quan més s’acosti a 0, més pobre serà el text.
Les
dades per fer el càlcul són les següents:
"Dones, Lluita Feminista e
Independència" (TEXT 1)
|
"Feministes per la
independència" (TEXT 2)
|
|
Desprès d’aplicar Word List
|
Desprès d’aplicar Word List
|
|
Word Types:
496
|
Word Types:
379
|
|
Word Tokens:
1338
|
Word Tokens:
969
|
|
Desprès d’aplicar Stopwords
|
Desprès d’aplicar Stopwords
|
|
Word Types:
422
|
Word Types:
319
|
|
Word Tokens:
664
|
Word Tokens:
502
|
I
els resultats:
TEXT
1
|
TEXT
2
|
|
Riquesa
Lèxica aplicant Word List TEXT 1
|
0,3707
|
0,3911
|
Riquesa
Lèxica aplicant Word List i Stopwords TEXT 2
|
0,6355
|
0,6355
|
Com
es pot observar, les dades són pràcticament iguals. Lògicament, la riquesa
lèxica s’incrementa quan hem aplicat el filtre de les Stopwords.
Comptat
i debatut, de l’anàlisi lexicomètrica dels textos proposats podem concloure
que, des de posicions d’esquerra, “dones” i “procés independentista” de
Catalunya van molt lligats.
Però
hi ha una diferència cabdal. Mentre que en l’article de Blanca Serra, "Dones,
Lluita Feminista e Independència" (TEXT 1), les paraules “lluita” i “social” apareixen i tenen un pes molt important, amb tot el
significat de càrrega ideològica que comporten aquests dos termes, en l’article
del grup Feministes per la Independència
- "Feministes per la independència"
(TEXT 2) -, aquestes dues paraules no apareixen en cap moment. La possible
interpretació d’aquesta diferència, però, ja no s’ha de buscar en l’anàlisi de
corpus textuals. I és que com deia R.Barthes : “...d'obra només n'hi ha una, de
textos tants com lectors sàpiguen llegir...”.
Bibliografia i Webgrafia
Navarro Colorado, Borja (2014): Guia
rápida de análisis e corpus (con AntConc). Universidad de Alicante.
Material en PDF
AntConc 3.2.1.
http://www.slideshare.net/laurarp/gua-antconc-321-presentation
Cap comentari:
Publica un comentari a l'entrada