O presente artigo é um estudo exploratório sobre o sentimento público português relativamente a António de Oliveira Salazar, ditador e presidente do conselho de ministros em Portugal dede 1933 até 1968, 50 anos após a sua morte. Esta abordagem é possível através da utilização do software de análise qualitativa NVivo, com a ferramenta Classificação da Polaridade do Sentimento. Este software reuniu tweets escritos em 27 de Julho de 2020 — aniversário do falecimento do ditador — e, consequentemente, classificou-os como ‘positivo’, ‘negativo’, ‘neutro’, ou ‘misto’, relativamente aos seus sentimentos para com Salazar que veiculavam. No final, os dados obtidos foram equilibrados: concluiu-se que 14% dos tweets eram positivos, ou seja, 7 em cada 50 tweets elogiaram o trabalho do ditador. Foi acrescentada uma nova categoria através de rotulagem manual em que se estabeleceu que muitos tweets (119 em cada 731) eram “piadas”. Deverão os tweets positivos ser um sinal de alarme? Os portugueses, nesta amostra, tendem a ser mais simpatizantes no sentido estrito ou simplesmente mais tolerantes e parodiantes em relação à figura de Salazar? Esperemos que esta investigação seja um primeiro passo para compreender isso. Revisão de Ricardo Fortunato e Sílvia Pereira Diogo. Texto de Beatriz Fernandes da Silva (email, orcid).
Palavras-chave: António de Oliveira Salazar; NVivo; Opinião Pública Online; Salazar; Análise Sentimental; Classificação da Polaridade; Portugal; Português; Opinião Pública; Twitter
“Fantasma rentável” (Tavares, 2019), “maior português” (RTP, 2007), “ditador de baixo nível” (Tom Gallagher, 2020), António de Oliveira Salazar tem sido chamado de muitas coisas por críticos, historiadores e editores. E as pessoas comuns? Como que é que os portugueses consideram Salazar no contexto da expressão online? Este artigo aborda os vários sentimentos — negativos, neutros, mistos ou positivos — dos utilizadores portugueses da rede social Twitter em relação a Oliveira Salazar, no dia 27 de Julho de 2020, que assinalou o 50º aniversário da sua morte. Na sequência das palavras de Pang & Lee (2008, in Abrantes, 2017, p.1), “aquilo que os outros pensam sempre foi uma fonte essencial de informação”. Pretende-se assim interpretar as publicações partilhadas na rede social Twitter como equivalentes às opiniões dos respectivos utilizadores e representativas, através de um método sistematizado, da população portuguesa. Para tal efeito, os dados são tratados utilizando a técnica de análise de sentimentos através da ferramenta informática NVivo.
Em primeiro lugar, apresenta-se uma revisão bibliográfica com respeito a Salazar e à forma como o seu legado é visto hoje em dia. No passo seguinte, explica-se o processo metodológico (mais desenvolvido no anexo em que se apresenta o quadro teórico da técnica de extracção de textos, a análise de sentimentos, seguido de uma secção destacando porque é que o Twitter foi escolhido para conduzir a classificação da polaridade dos sentimentos). Subsequentemente, introduz-se o software NVivo, que classifica, de acordo com uma abordagem baseada no léxico, a polaridade dos sentimentos de cada tweet. Finalmente, ao analisar os dados obtidos, tenta-se explicar estes números de acordo com as teorias actuais sobre o assunto.
Da recolha total de 1052 tweets afixados na plataforma a 27 de Julho de 2020, e após excluir aqueles que não se encaixavam nos critérios, 731 tweets foram considerados válidos. Os resultados são bastante homogéneos, sem que nenhum sentimento em particular se sobreponha ao outro. “Positivo” é o sentimento menos expressivo, com 14% dos tweets (correspondente a 103 casos). Os tweets “neutros” representam 27% do total: 197 destes não têm uma abordagem totalmente positiva ou totalmente negativa. Ainda, 35% dos tweets são rotulados como “negativos” (254 casos). Finalmente, 24% dos tweets foram classificados como “mistos”: 177 publicações fizeram tanto referências positivas como negativas a Salazar.
É importante notar que a análise dos dados descortinou a existência de uma nova categoria para o modelo que tinha sido inicialmente proposto: 16% do número total de tweets (119 de 731) foram classificados como “piadas” referentes a Salazar. Isto pode ser entendido de diversas perspetivas: por exemplo, como uma forma de depreciar Salazar e a sua memória, a fim de ridicularizar o antigo ditador e fomentar um sentido de identidade colectiva; contudo, pode também significar uma naturalização da figura do ditador num panteão de estadistas sem grande valorização positiva ou negativa, ou seja, reduzindo-o à caricatura.
Todas estas estatísticas fornecem uma visão da opinião pública portuguesa que está, apesar de equilibrada no seu todo, bastante polarizada nas suas expressões particulares. No entanto, o feedback positivo tirado do entendimento de Gallagher (2020) pode não se dever ao declínio do presente regime democrático mas, em vez disso, somente a uma admiração dos portugueses face a um líder humilde, a imagem mais frequentemente associada a Salazar. Se estes padrões vão continuar ou não, ficará por ver, através de uma replicação deste método durante um período de tempo significativo.
O estudo é finalizado apresentando dificuldades e considerações para trabalhos futuros, bem como uma conclusão sobre se podemos dizer que Salazar é considerado hoje o grande português, como em tempos recentes foi. Apresenta-se ainda um anexo com descrições mais técnicas da metodologia do estudo.
Procura-se: Salazar, Morto ou Vivo
Muito tem sido dito sobre Salazar, em termos de apreciação popular contemporânea, mas pouco tem sido escrito e menos ainda estudado com metodologias robustas. Esta secção começará assim por destacar os debates dominantes bem como as perspectivas que tanto a academia como os meios de comunicação social têm em relação ao legado de Salazar na sociedade portuguesa.
A literatura actual sobre a percepção pública do ex-ditador é bastante limitada. Uma pesquisa exaustiva na Internet torna claro que as opiniões contemporâneas estão divididas com base na polarização política, sendo analisadas apenas por um punhado de colaboradores de jornais sob a forma de artigos e colunas de opinião. Quanto ao cidadão comum, poucos têm interrogado sobre o que pensa. Um dos poucos indicadores que temos para responder a esta pergunta é uma sondagem televisiva de 2007 sobre qual seria o maior português de sempre, onde, entre antigos líderes políticos, reis e descobridores, Salazar foi galardoado com o primeiro lugar. Foi assim considerado o número um entre os Grandes Portugueses por 41% dos eleitores (vd. RTP, 2007; Afonso, 2020). Desde então, a opinião pública certamente não se calou, mas nunca mais ninguém voltou a pedir de forma concreta a sua opinião.
Há pouco mais de 50 anos, a 27 de Julho de 1970, deu-se o falecimento do ditador, um dos estadistas de maior longevidade no poder em Portugal, quem Nogueira Pinto (in Claro, 2020) considera a pessoa “(…) que, para o melhor ou para o pior, foi o político mais importante e decisivo no século XX português”. Nogueira Pinto, um dos apresentadores do já referido programa de televisão de 2007, é um crente convicto que é o ódio da esquerda política que perpetua a memória de Salazar, mantendo-o assim vivo. “Da oposição comunista à oposição democrática, dos liberais progressistas aos bloquistas, é o seu velho ódio continuado que nunca se cansa e um rancor que não passa, que o mantém [Salazar] vivo durante o século XXI”. Quando colocada a questão “Como é que o país enfrentou a morte de Salazar? “Nogueira Pinto respondeu que “Não há ‘o país’. Apenas em espectáculos como o Big Brother os apresentadores dizem ´os portugueses decidiram!’. E os demagogos dizem também estas coisas. Houve os que seguiram e respeitaram Salazar, e os que o detestaram e o odiaram. Alguns quase paranóicos. Ainda existem estas duas espécies. Mas havia, em geral, o sentimento de que se tratava do fim de uma época. ”
De acordo com Céu e Silva (2020), o reflexo de Salazar no espelho em que Portugal se vê a si mesmo está a ficar menos claro: “Passados 50 anos após a morte de Salazar, o seu nome é raramente pronunciado, nem sequer entre as novas lutas de extrema-direita pelo seu legado”. Além disso, o autor argumenta que nem mesmo o típico dito popular “no tempo de Salazar era melhor” faz grande parte das conversas quotidianas. Da mesma forma, o historiador Fernando Rosas está certo de que o nome de Salazar não é ouvido com tanta frequência: o autor acredita firmemente que Salazar é um mito, apenas utilizado como símbolo por uma franja particular da extrema direita, reanimando-o paulatinamente, embora de forma artificial. “Salazar como um mito também se perde, afinal, as novas gerações não se vêem nesses valores e, sobretudo, não têm a experiência do passado que a minha geração teve (…) A distância também desmistifica estes personagens históricos (…) o tempo nestas coisas tem um papel desdramatizante”.
Para Ribeiro de Meneses (in Céu e Silva, 2020), autor de ‘Salazar – A Political Biography’, há uma perda de interesse por parte da academia. “Salazar não desperta por si só o interesse dos historiadores”; o autor é da opinião que existe uma “relutância por parte dos historiadores portugueses em abordar o tema”. No entanto, relativamente ao interesse popular, este mesmo autor argumenta que Salazar desperta um interesse que ultrapassa o domínio académico, o que o leva a concluir que os portugueses “ainda não ultrapassaram o legado, pois este não desapareceu e continua a ter muito peso”: Salazar “ainda marca parte da população” e continua a ser uma figura que polariza as opiniões.
Pelo contrário, o investigador de sociologia Boaventura de Sousa Santos considera que parte da dificuldade de esquecer o passado vem da academia, da parte dos “[i]ntelectuais com presença nos media [que] escrevem livros em que consideram Salazar como um dos maiores políticos portugueses do século XX. Nem sequer os espanhóis ousam falar tanto de Franco, muito menos os italianos de Mussolini ou os alemães de Hitler (…) Este ‘esquecimento’ da ditadura cria nostalgia de voltar a um passado imaginado” (Oliveira, 2021).
Na sequência das palavras de Ribeiro de Meneses, o jornalista Pedro Coelho (2021, in SIC Notícias, 2021) é de opinião que o discurso salazarento ainda hoje está presente e interage com a sociedade portuguesa. O autor da reportagem televisiva A Grande Ilusão, na qual analisa a abordagem política de André Ventura, menciona que o discurso de Ventura é eficaz porque ressoa com o de Salazar. Segundo Coelho, Ventura está bem consciente de que este tipo de retórica “(…) tem força e eco em Portugal. Um país que “(…) ainda está muito ligado à ideologia de Salazar”. Cardina (2019), corroborando esta perspectiva, afirma que Salazar criou uma “imagem de um político que sabe apresentar-se como antipolítico, um humilde servidor da nação com a qual se casou”. Esta imagem (…) ainda hoje é preservada em sectores consideráveis da população”, o que resulta no regresso de Salazar “(…) de novo como uma presença invisível”. Também para alguns autores como Tavares (2019), Salazar é um espírito que continua a vaguear livremente: “Salazar é o fantasma mais rentável em Portugal. (…) Salazar está morto e enterrado há 50 anos. Mas o seu cadáver continua a provocar tremendas paixões”.
À pergunta “Quem mantém Salazar vivo? ” este artigo propõe responder se são os portugueses comuns os que mantêm a sua memória viva, analisando, através de um corpus limitado, os seus sentimentos actuais em relação ao antigo ditador.
Metodologia
Primeiro, há que explicar o processo pelo qual a técnica de análise de sentimentos foi executada, utilizando o software NVivo, através dos tweets dos utilizadores portugueses do Twitter relativamente às opiniões sobre Salazar. De seguida, delinearemos um breve contexto teórico sobre a Análise de Sentimentos, o que é e o que veicula, após o que se deve consolidar a devida justificação da recolha, do método e do uso da plataforma. Por fim, seguindo esta abordagem, será interpretada especificamente a investigação em questão, os dados recolhidos, a forma como foram processados, os seus resultados e as considerações finais desses resultados.
Uma Análise dos Sentimentos
A Análise de Sentimentos é uma abordagem enraizada na mineração de texto, um método de inteligência artificial através do qual dados não estruturados podem ser organizados em conjuntos adequados para análise (IQVIA, 2021). Neste contexto, considerei a Análise de Sentimento tal como definida por Soroka et al. (2015, p.111 em M’Bareck, 2019, p.21), “[a] construção ampla compreendendo atitudes, opiniões e emoções, em que as atitudes se referem a avaliações positivas ou negativas”. Além disso, tive em mente o trabalho de Souza & Vieira (2012, p.1), uma vez que a análise dos sentimentos é utilizada para ajudar na “(…) identificação ou extracção de emoções, opiniões ou pontos de vista expressos em texto”.
O método pelo qual os sentimentos serão analisados inclui um “corpus [textos] de rotulagem baseado na avaliação positiva, negativa ou neutra de um objecto” (Mars & Gouider (2017 na p.14). Como primeiro passo, é imperativo classificar o que é considerado uma opinião ou não. Esta questão, denominada classificação da subjectividade, determina o que é informação factual versus informação subjectiva (Liu, 2012, p. 44/45). Neste sentido, a classificação objectiva é considerada como “neutra” em termos de opinião e, consequentemente, aquela informação que é considerada subjectiva precisa de ser qualificada num espectro que vai do positivo ao negativo em termos de valoração.
Há dois tipos de técnicas através das quais os sentimentos são classificados: a aprendizagem por inteligência artificial e as abordagens baseadas no léxico (Guevara, Costa, Arroba, & Silva, 2018). A análise de dados produzida pelo software NVivo é, pois, processada através do léxico. A técnica utilizada pela NVivo assume que “a polaridade colectiva de um documento ou tweet é a soma das polaridades, quer sejam palavras ou frases individuais” (Guevara, Costa, Arroba, & Silva, 2018, p. 2). Esta “tarefa de classificação binária de rotular um documento opinativo como expressando ou uma opinião geral positiva ou uma opinião geral negativa é chamada classificação de polaridade de sentimentos ou classificação de polaridade” (Pang & Lee, 2008, p.25).
Os Pássaros tweetam. Porque é que os humanos o fazem?
As novas tecnologias permitem aos utilizadores expressarem as suas opiniões de forma ampla e facilmente sistematizável nas redes sociais: o seu conteúdo, uma vez analisado, é muito útil para extrair quadros de informação mais estruturados e, portanto, fazer uma estimativa instruída sobre os sentimentos expressos acerca de um tópico específico. De acordo com Liu (2021), o crescimento da investigação em relação à análise dos sentimentos está correlacionado com o aumento do uso destas plataformas: “As opiniões e os seus conceitos relacionados, tais como sentimentos, avaliações, atitudes e emoções, são os temas de estudo da análise dos sentimentos e da extracção de opinião. O início e o rápido crescimento do campo coincidem com os das redes sociais na Web (…) porque, pela primeira vez na história da humanidade, temos um enorme volume de dados de opinião registados em formas digitais” (Liu, 2021, p.5).
Entre várias plataformas sociais, com várias características distintivas mas com o móbil central da expressão verbal em quase todas elas, temos o Twitter, uma rede particularmente dedicada à emissão de opiniões/impressões/descrições curtas e facilmente digeríveis. Tem sido assim “amplamente utilizada como um meio para expressar pensamento político” (Ansaria, et al., 2019, p. 1821/1822). Quando comparado com as outras plataformas disponíveis, o Twitter é tendencialmente visto como o melhor para analisar pesquisas para compreender a opinião pública. Seguindo as palavras de Reyes-Menendez (Saura, & Alvarez-Alonso 2018, p.1), “é uma rede social cada vez mais utilizada na investigação para obter informação e compreender a opinião pública (…)”. Além disso, como afirmado por Elghazaly et al., (2016), “(…) [T]o estudo do Twitter tem um grande potencial de exploração e compreensão das pessoas, das suas vidas, potencial, interesses e opiniões.”
No caso português, um dos poucos exemplos do uso do twitter para aferir a opinião pública é o Twittómetro, “(…) uma ferramenta de análise de opinião sobre os candidatos à campanha presidencial portuguesa (…) [onde] os autores executam a análise dos sentimentos utilizando uma abordagem à base de léxico combinada com padrões léxico-sintácticos para identificar e compor os sentimentos expressos em tweets” (Souza & Vieira, 2012, p.2).
Os tweets, neste sentido particular, são considerados como fazendo parte da Comunidade de Dados, conceito operacional que é defendido por George et al. (2014 em Abrantes, 2017, p.5), como um tipo de “dados, especialmente em formato de texto, retirados de sítios/rede de partilha (Meios de Comunicação Social, Fóruns, Blogs, etc.)” que são de acesso e conhecimento público. Contudo, os tweets são considerados dados não estruturados, o que significa que “requerem técnicas e sistemas específicos de processamento e análise” (Santos et al., 2017 em Abrantes, 2017, p.7): como dissemos, a ferramenta usada para esse efeito foi o NVivo. Passemos agora a uma breve análise da pesquisa e aos resultados.
“O povo é quem mais ordena”
Antes de qualquer análise de dados poder ser realizada, é importante notar que o Twitter é considerado um barómetro de polarização política. Como M’Bareck (2019, p.5) defende, “Twitter encoraja inerentemente o cinismo e o discurso divisionista.” Algumas particularidades da plataforma exacerbam esta polarização de opiniões: o autor identifica características que constituem essa natureza maníaca do Twitter como “(a) a sua simplicidade, que impede o discurso detalhado e sofisticado, (b) impulsividade: a conveniência de tweetar em qualquer lugar e em qualquer momento prejudica a capacidade das pessoas de serem atenciosas e ponderadas; (c) incivilidade: que vem da estrutura informal do Twitter, normalizando os erros gramaticais e, portanto, o discurso incivil entre os utilizadores”.
Além disso, toda a análise da classificação do sentimento de polaridade é uma questão subjectiva, o que é considerado uma expressão emocional por oposição a uma constatação de facto. “A classificação da subjectividade classifica as frases em duas classes, uma subjectiva e outra objectiva (Wiebe, Bruce, e O’Hara, 1999). Uma frase objectiva exprime alguma informação factual, enquanto que uma frase subjectiva dá geralmente pontos de vista e opiniões pessoais. ” (Liu, 2012, p. 45). Tendo isto em mente, os tweets foram separados em subjectivos – qualificáveis assim como positivos, neutros ou mistos – por oposição a objectivos – qualificáveis apenas como neutros. A figura 1 é uma imagem ilustrativa dos padrões de distribuição.
A maioria dos utilizadores deu de alguma forma um contributo pessoal e subjectivo aos seus tweets sobre o ditador; estes juíos de valor, como defendido por Liu (2012, p. 28) decorrem de respostas emocionais a entidades, e Salazar é sem dúvida um objecto susceptível de causar respostas intensas. De um total de 731 tweets, 103 foram considerados ‘positivos’ em relação a Salazar, o que equivale a 14% (7 em cada 50 tweets). No outro extremo do espectro, mais do dobro eram ‘negativos’ (n=254), um total de 35%. No entanto, 197 tweets não tiveram qualquer valoração emocional nem qualquer classificação de sentimento, sendo considerados ‘neutros’ e lidos como informativos ou factuais — 24% do total. Ainda, 177 tweets tinham sentimentos ‘mistos’ em relação a Oliveira Salazar (6 em cada 25). Por fim, como mencionado anteriormente, foi observado um padrão particular de troça em relação a Salazar, tendo sido decidido que seria inserida uma nova categoria. Do total, 119 tweets foram considerados uma ‘piada’; são 16% de todos os tweets (figura 2). Vamos então centrar-nos tanto na categoria ‘positivo’ como na categoria ‘piada’, devido ao seu aspecto antagónico.
Salazar, uma cadeira, e a Internet entram num bar….
A categorização ‘piada’ encontrada em 119 dos 731 tweets é considerada pela literatura como uma forma de desacreditar Salazar através de sátira. Esta classificação é assim, vista como humor político, um “termo generalista que engloba qualquer texto humorístico que trate de questões políticas, pessoas, eventos, processos ou instituições” (Young, 2018, p.3).
A sátira, a forma de expressão pela qual as pessoas provocam risos enquanto simultaneamente fazem julgamentos (George Test, 1991 em Young, 2018, p.3), é uma forma de canalizar o descontentamento, pelo que, neste contexto, a ‘piada’ é uma sub-categorização embutida na esfera ‘negativa’ dos tweets. Contudo, não se pode excluir uma utilização da sátira de forma neutral, sem afiliações ideológicas ou políticas — principalmente em casos como no exemplo que será citado mais abaixo, onde a troça pode ser em relação ao ditador ou em relação a uma outra situação e/ou objecto que simultaneamente o envolvam.
Além disso, o humor pode ser usado como arma de protesto político (Hart, 2007, p.1) e fomentar a identificação colectiva, ao mesmo tempo que exclui outros grupos. Hart (2007, p.1&14), exemplifica o poder do humor em “ridicularizar o representante do governo” com os Grevistas dos Estaleiros Navais de Lenin na Polónia durante a década de 1980, bem como com o movimento socialista norte-americano do início do século XX, no qual “[r]desenhos animados adicais serviam uma política de riso consciente da classe, atacando o adversário de uma forma ridícula, e tal imaginação provou muitas vezes ser um método de comunicação mais directo do que os tratados escritos”.
A maioria dos tweets de “brincadeira” incluí um tom de troça em relação a Salazar cair de uma cadeira como metáfora para a sua morte. Alguns exemplos escolhidos aleatoriamente são: “A expressão ‘puxa uma cadeira e senta-te no chão’ ganhou popularidade após a morte de António Oliveira de Salazar”, “Faz 50 anos que Salazar morreu” e “Se fosse hoje a cadeira era do IKEA e ele ainda estaria vivo a tentar montá-la…”. No entanto, como Young (2018, p.6) observou, o papel do humor ou como agente de influência ou como barómetro da opinião pública está muito na sua fase inicial, portanto, ainda não há quaisquer respostas a este respeito.
Saudades do humilde servo de Portugal?
Centrando-se na percentagem de tweets ‘positivos’ (14%), este valor pode talvez ser explicado, como defende Tom Gallagher (2020), numa saudade (nostalgia) de um líder que encarna a honestidade e coloca a nação acima de tudo, como Salazar é frequentemente recordado.
Otelo Saraiva de Carvalho, um dos responsáveis operacionais pelo golpe militar de 1974 que depôs o regime salazarista do Estado Novo, disse uma vez: “Precisamos de um homem com a inteligência e honestidade de Salazar mas sem a intenção de impor um fascismo de estilo italiano” (Gallagher, 2020, p.263). Um líder honesto, como Salazar é retratado, parece uma alternativa mais apelativa aos portugueses quando comparado com os líderes actuais, envoltos em escândalos de desconfiança política e corrupção. Como Gallagher (2020, p.275) afirmou, “Salazar o homem é susceptível de manter um certo fascínio devido à sua honestidade e asceticismo amplamente percebidos”. Além disso, Gallagher considera que “Salazar pode ser invocado – não tanto o ditador mas o homem que se viu como o primeiro servidor da nação” (Gallagher, 2020, p.263), especialmente numa época em que “(…) sondagens de opinião também demonstraram frequentemente desencanto com políticos pluralistas por serem muito menos escrupulosos e sérios na sua abordagem à governação” (Gallagher, 2020, p.276). Assim, é nosso entender que talvez as referências positivas a Salazar em 27 de Julho de 2020 não tenham sido tanto um elogio à ditadura e ao autoritarismo, mas sim uma nostalgia de um líder que, tanto quanto é do conhecimento do povo, foi humilde e honesto. “O ditador de baixa patente, que morreu há cinquenta anos, ainda exerce um apelo para muitos portugueses devido à sua rectidão pessoal” (Gallagher, 2020, p.274).
A maior parte dos tweets ‘positivos’ englobavam um tom de louvor, quer em relação à humilde sepultura de Salazar, quer quando o comparam a sua ética de trabalho com a dos políticos actuais. Alguns exemplos escolhidos aleatoriamente são: “Hoje, 27 de Julho, assinala-se o cinquentenário da passagem de Salazar para a vida eterna. Ontem, no cemitério do Vimeiro, junto à campa rasa e humilde do maior servidor da Pátria do século XX. Salazar, Presente! ” e “Não houve branqueamento de Salazar em lado nenhum. O pessoal está farto de xuxas corruptos…”.
Salazar está de volta para revalidar o seu título de “O Maior Português”?
Esta investigação foi, acima de tudo, um mergulho exploratório no desconhecido. Como primeiro trabalho sobre o tema, há inconvenientes decisivos que foram mencionados e que desempenharam um papel importante em todo este processo. Existem lacunas tanto no assunto como no método para o estudar. Salazar já não é um nome explorado na academia, o que leva a um trabalho limitado que lhe diz respeito, tanto como indivíduo como quanto ao seu legado. Além disso, há retrocessos consideráveis no que diz respeito às limitações do campo da Análise de Sentimentos, especialmente a incapacidade das máquinas para aprenderem sarcasmo e gírias. Para acrescentar a esta questão, é particularmente problemático fazer tal análise em português, devido ao muito pequeno software que o faz.
No entanto, algumas conclusões podem ser tiradas desta peça como uma tentativa de utilizar o Twitter como representante da opinião pública portuguesa. Se os tweets forem vistos como uma pista para compreender os sentimentos dominantes dos cidadãos, pode ser declarado que os portugueses estão bastante distribuídos nos seus sentimentos em relação a Salazar. Como as estatísticas mostram, a menor percentagem vem de tweets positivos (14%), e os tweets negativos têm um peso maior no total (35%). No entanto, existe um número considerável de tweets rotulados como misto e neutros, 24% e 27% respectivamente. Além disso, foi acrescentada uma característica lateral, ‘piada’, que reuniu 16% dos tweets. Esta última categorização pode ser entendida como uma forma de depreciar Salazar e a sua memória, a fim de ridicularizar o antigo ditador e fomentar um sentido de identidade colectiva, embora possa também ser lida como uma valoração neutra, já que o objecto da piada não é necessariamente mal visto pelo autor do tweet. No outro extremo do espectro, segundo Tom Gallagher (2020), a percentagem de positivos pode derivar de um sentimento nostálgico da ideia que o cidadão comum tem de Salazar como um servo honesto da nação, especialmente quando contextualizado nos escândalos políticos actuais em Portugal.
Pode esta última consideração ser um regresso ao passado? Só replicando e melhorando este método é que podemos estabelecer padrões e compreender a evolução do sentimento geral que os portugueses têm em relação ao seu antigo ditador. É nosso entendimento que esta investigação pode abrir novas possibilidades para compreender os sentimentos políticos do público e dar sentido às suas opiniões, o que é especialmente importante nestes tempos politicamente incertos.
Anexo: Sobre a Metodologia, Desvantagens e Trabalho Futuro
O QSR NVivo 12 (QSR International, 2016) é um software capaz de analisar dados não estruturados de várias fontes, incluindo aqueles que o Twitter proporciona através do seu add-on, NCapture. Por esta razão, além da sua riqueza social, o Twitter foi também escolhido como fonte de dados devido à facilidade de acesso que aquele software permite com a rede social. É, dessa forma, considerado como uma ferramenta valiosa no campo de investigação da Análise de Sentimentos, “NVivo, o software de análise de dados qualitativos desenvolvido para gerir os procedimentos de ‘codificação’, é considerado o melhor a este respeito” (Hilal & Alabri, 2013, p.181).
Antes de qualquer codificação poder ser executada, e na sequência do trabalho de Ansaria et al., (2019, p. 1824) pedi a cinco anotadores de diversos grupos etários e de género, bem como opiniões políticas, para rotularem os tweets que consideravam “lixo”: o nome de código utilizado para cada tweet que, de alguma forma, não estava relacionado com o tópico em questão.
A ferramenta de classificação dos sentimentos do autocodificador apresentada em NVivo não tenta classificar um comentário inteiro como positivo ou negativo no seu todo; em vez disso, analisa as palavras isoladamente (Pudaruth et al., 2018, p.46). Esta técnica é baseada na análise a nível de espectro. Ao classificar a polaridade dos sentimentos de cada tweet, utilizando o software Wordnet (2016), cada “caso” (tweet) pode ser codificado de acordo com as suas palavras como positivo ou negativo. Os tweets com referências tanto negativas como positivas são rotulados como ‘misto’. Aqueles que não forneceram qualquer tipo de resultado emocional foram considerados pelo software como ‘Neutros’.
Reunidos todos os tweets de uma data específica, numa língua específica — o português —, usando a ferramenta NCapture, foram depois limpos, através da remoção do ‘lixo’ e, de seguida, pré-processados, nos quais se removeram caracteres especiais, como por exemplo URLs, menções, hashtags, emojis, bem como tweets duplicados e retweets. Por fim, à medida que os tweets rotulados de ‘válidos’ se tornaram disponíveis, foi realizada a Auto Code Wizard Query em NVivo, que atribuiu uma polaridade de sentimentos a cada tweet.
A análise compreende todos os tweets escritos em português de Portugal contendo as palavras-chave: ‘António Salazar’; ‘António de Oliveira Salazar’ e ‘Salazar’. Todos os dados foram recolhidos em 27 de Julho de 2020, utilizando o add-in NCapture do software NVivo. Foram contabilizados 1052 tweets. Todos retornaram várias características para além do texto em si: tendo em consideração as limitações do software disponível relativamente ao processamento e, na sequência do trabalho de Tavabi (2015), todos os tweets que eram duplicados, retweets (Ansaria, et al., 2019, p. 1823), ou que continham hashtags, URLs de imagem, URLS externos adicionais, @ do utilizador, bem como a sua localização, data e hora do post, foram removidos por terem sido considerados desnecessários (Elghazaly, Hefny, & Mahmud, 2016; Silva R. M., 2018).
Antes de começar com o pré-processamento, quaisquer tweets que não cumprissem os critérios tinham de ser excluídos – por exemplo, os escritos em português brasileiro ou que mencionassem Salazar, mas referindo-se a outra pessoa com o mesmo apelido. Nisto, seguindo o trabalho de Ansaria et al. (2019, p. 1824), os referidos cinco anotadores ao lado do autor, codificaram como ‘lixo’ qualquer tweet que fosse: 1) de algum modo não relacionado com Salazar, mas com pessoas do mesmo nome; 2) tweets em português do Brasil; 3) tweets que não tinham Salazar como o seu foco principal. Após chegar a um consenso entre todos os intervenientes, 321 tweets foram classificados como ‘lixo’, pelo que no total havia 731 tweets válidos para analisar.
Os tweets válidos foram então tidos em consideração e codificados como ‘casos’ na plataforma NVivo (figura 3). No passo seguinte, foi necessário fazer o pré-processamento dos dados não estruturados, o que envolve a remoção de quaisquer hashtags, URLs, menções, ou emoticons presentes nos tweets.
Como passo final, a consulta do Auto Code Wizard foi executada em NVivo a fim de alcançar a Classificação de Polaridade Sentimental de todos os 731 tweets. Os resultados desta consulta serão discutidos na secção seguinte.
Inspirado nos trabalhos de Bazeley (2007 em Hilal & Alabri, 2013, p. 182), de Guevara et al., (2018), Medhat & Korashy (2014, p. 1095), Abrantes (2017, p.19), M’Bareck (2019, p.28) e Caetano et al., (2018, p.3), o processo final de Análise de Sentimentos do Twitter utilizando NVivo foi realizado da seguinte forma
- Recolha de dados: Extracção de tweets utilizando o add-in NCapture
- Rotulagem Manual: Exclusão manual de tweets considerados ‘lixo’
- Pré-Processamento de dados: Remoção de caracteres especiais: URLs, menções, hashtags, emojis, assim como os tweets duplicados e os retweets
- Classificação da Polaridade de Sentimento de Dados: Usando o Auto Code Wizard em NVivo
- Visualização e discussão de dados: Apresentação e análise dos resultados a fim de melhor compreender as etapas, foi criado um Infográfico (figura 4)
Várias deficiências metodológicas dificultaram a presente investigação, especialmente no que diz respeito à sensibilidade do contexto e idiossincrasias dos tweets; “Os dados do Twitter colocam dificuldades à análise linguística automática – devido a uma grande variação linguística e a gírias”. (Souza & Vieira, 2012, p.1).
O inconveniente mais predominante do software é a sua incapacidade de detectar o sarcasmo. Esse registo, frequente na coloquialidade, pode ser especialmente prejudicial à classificação dos sentimentos quando se considera que pode “(…) agir como um factor interferente em qualquer texto que possa inverter a polaridade” (Bharti et al., 2016, p.108/109). Além disso, “sarcasmo é um tipo de sentimento em que as pessoas expressam os seus sentimentos negativos usando palavras positivas ou intensificadas positivas no texto. (…) Nos dados textuais, faltam estas pistas tonais e gestuais, tornando a detecção do sarcasmo muito difícil” (Bharti et al., 2016, p.108). Por esta razão, autores como Caetano et al. (2018, p.13), e Reyes-Menendez, Saura, & Alvarez-Alonso 2018, p.6), sugerem que a detecção do sarcasmo é um problema aberto que deve ser o foco de futuras investigações no campo da análise de sentimentos. Além disso, uma desvantagem notável foi a necessidade de remover quaisquer símbolos não textuais como emoticons para que os dados pudessem ser analisados. No entanto, a investigação como a apresentada por Kolchyna et al. (2016), reforça a necessidade de o software incorporar léxicos de sentimentos com emoticons, abreviaturas, e expressões de gírias da social-media, a fim de aumentar a exactidão da classificação baseada em léxicos para o Twitter, que faltava neste estudo.
Todos os inconvenientes acima mencionados podem ser encontrados em praticamente todos os trabalhos que se concentram na Análise de Sentimentos. Contudo, ao considerar os problemas que esta investigação específica enfrentou, os mais proeminentes foram a falta de investigação demográfica sobre a esfera do twitter português e as particularidades da língua portuguesa. Em relação à primeira, não há nenhum estudo sobre a demografia dos utilizadores do Twitter em Portugal. Devido a este raciocínio, tivemos de confiar na experiência pessoal, embora limitada a uma bolha, bem como em estatísticas que afirmam que 80% dos utilizadores do twitter são millenials (Aslam, 2021), ou seja, pertencentes à geração que nasceu entre 1995 a 2005, para fazer um palpite educado de que o grupo etário dos 18-24 anos estava mais representado do que qualquer outro.
Além disso, é importante notar que a língua portuguesa permite três tipos de negação, pré-verbal, pós-verbal, e uma dupla negação tanto pré como pós-verbal (Souza & Vieira, 2012, p.3). Tendo em conta que a análise de polaridade, o NVivo funciona como uma base de nível de espectro, analisa palavra por palavra e não o contexto completo, neste caso, os indicadores de negação actuam como polarizadores.
Foi também particularmente desafiante encontrar software que analisasse a língua portuguesa, ainda mais em português de Portugal. Nesse sentido, como aconselhado por Medhat & Korashy (2014, p.1109), este artigo gostaria de encorajar que a futura investigação possa expandir a análise de sentimentos em outras línguas além do inglês, a fim de enriquecer o campo, bem como lançar luz sobre outros tópicos de outras realidades.
Finalmente, um aspecto contextual importante a ter em consideração é que, por vezes, os utilizadores do Twitter censurar-se-ão ao mencionar ou falar de pessoas, especialmente figuras públicas, com quem não simpatizam nem partilham a mesma ideologia, princípios, ou valores. Ao publicar tweets, palavras como “S@lazar” ou “Salaz*r” são escritas em vez da forma correcta, a fim de controlar o algoritmo, e de não acrescentar ao número de menções na plataforma. Como consequência disso, podem existir alguns posts relativos a Salazar que não foram codificados por não terem sido considerados pelo software.
Epílogo: as contas Twitter de Salazar
Bibliografia
Afonso, C. (2020, November 9). Opinião. From Expresso: https://expresso.pt/opiniao/2020- 11-09-Portugal-dos-pequenitos
Ahmed, W. (2018). Using Social Media Data for Research: An Overview of Tools. Journal of Communication Technology.
Ansaria, M. Z., Aziz, M. B., Siddiquib, M. O., Mehraa, H., & Singh, K. P. (2019). Analysis of Political Sentiment Orientations on Twitter. International Conference on Computational Intelligence and Data Science (ICCIDS 2019), 1821-1828.
Aslam, Salman. (2021, January 6) Twitter by the Numbers: Stats, Demographics & Fun Facts.From Omnicore: https://www.omnicoreagency.com/twitter-statistics/
Bailey, Samantha (05th December 2019). How to collect data from tweets with Nvivo and Ncapture [Video]. YouTube. https://www.youtube.com/watch?v=q-e_2l9Qmck
Bakliwal, A., Foster, J., Puil, J. v., O’Brien, R., Tounsi, L., & Hughes, M. (2013). Akshat Bakliwal. Association for Computational Linguistics.
Bazeley, P., & Jackson, K. (2013). Qualitative Data Analysis with NVivo. SAGE.
Bharti, S. K., Vachha, B., Pradhan, R. K., Jena, S. K., & Babu, K. S. (2016, August). Sarcastic sentiment detection in tweets streamed in real time: a big data approach. Digital Communications and Networks, 2(3), 108-121.
Caetano, J. A., Lima, H. S., Santos, M. F., & Marques-Neto, H. T. (2018). Using Sentiment Analysis to define Twitter Political User’s Classes and their Homophily during the 2016 American Presidential Election. Journal of Internet Services and Applications.
Cardina, M. (2019, September 5). Opinião. From Público: https://www.publico.pt/2019/09/05/politica/opiniao/patrimonializar-salazar-1885547
Chaovalit, P., & Zhou, L. (2005). Movie Review Mining: a Comparison between Supervised and Unsupervised Classification Approaches. Proceedings of the 38th Annual Hawaii International Conference on System Sciences. IEEE.
Claro, L. (2020, July 25). Política. From SOL: https://sol.sapo.pt/artigo/703946/com-a-morte- de-salazar-houve-em-geral-o-sentimento-de-que-era-o-fim-de-uma-epoca
Elghazaly, T., Hefny, H. A., & Mahmud, A. (2016). Political Sentiment Analysis Using Twitter Data. The International Conference, (pp. 1- pp. 5). Cambridge.
Gallagher, Tom (2020). The Afterlife of Salazar: Fifty Years of Controversy. Salazar. The Dictator Who Refused to Die (pp. 255 – pp. 276) London: C. Hurst & Co.
Guevara, J., Costa, J., Arroba, J., & Silva, C. (2018). Harvesting Opinions in Twitter for Sentiment Analysis. 2018 13th Iberian Conference on Information Systems and Technologies (CISTI)
Hart, Marjolein ‘t (2007). Humour and Social Protest: An Introduction, International Review of Social History, (pp.1- pp. 20)
Hilal, A. H., & Alabri, S. S. (2013, January). Using NVivo for Data Analysis in Qualitative Research. International Interdisciplinary Journal of Education, 2(2).
IQVIA, Linguamatics. (2021). What is Text Mining, Text Analytics and Natural Language Processing? From: https://www.linguamatics.com/what-text-mining-text-analytics- and-natural-language-processing
Kolchyna, O., Souza, T. T., Treleaven, P. C., & Aste, T. (2016). Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method, and Their Combination. Handbook of Sentiment Analysis in Finance. Mitra, G. and Yu, X. (Eds.).
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. Max Weber Org. (02nd May 2020). NVivo – Analyzing Twitter Data [Video]. Youtube.
M’Bareck, M. L. (2019). Political Speech on Twitter: A Sentiment Analysis of Tweets and News Coverage of Local Gun Policy. University of Arkansas, Fayetteville.
Medhat, W., & Korashy, A. H. (2014). Sentiment Analysis Algorithms and Applications: A Survey. Ain Shams Engineering Journal, 1093-1113.
Methodology Related Presentations – TCSP. (27th October 2016). Analyzing Twitter Data Using NVivo 11 – Part 1 (Philip Adu, Ph. D) [Video]. YouTube. https://www.youtube.com/watch?v=3ShdSzublcQ
Methodology Related Presentations – TCSP. (03rd November 2016). Analyzing Twitter Data Using NVivo 11 – Part 2 (Philip Adu, Ph. D) [Video]. Youtube. https://www.youtube.com/watch?v=wOAJhsgNaAU
Nogueira Pinto, J. (2020, July 4). O Século de Salazar. Retrieved from Observador: https://observador.pt/opiniao/o-seculo-de-salazar/
NVivo by QSR. (08th September 2016). Introduction to Text Analysis with NVivo for Mac https://www.youtube.com/watch?v=GnwCPLDglUU&t=1267s
Oliveira, S. D. (2021, January 13). Notícias Magazine. From Jornal de Notícias: noticiasmagazine.pt/2021/extrema-direita-a-via-rapida-do-descontentamento-ao- populismo/historias/258413
Pang, B., & Lee, L. (2008). Opinion Mining and Sentiment Analysis. 2, 1-135.
Princeton University (2021) Wordnet. A Lexical Database for English. From: Princeton University: https://wordnet.princeton.edu
Pudaruth, S., Moheeputh, S., Permessur, N., & Chamroo, A. (2018). Sentiment Analysis from Facebook Comments using Automatic Coding in NVivo 11. ADCAIJ: Advances in Distributed Computing and Artificial Intelligence Journal, 7(1), 41-48.
QSR International (n.d.). From: https://www.qsrinternational.com/nvivo-qualitative-data- analysis-software/home/
RTP (Rádio e Televisão de Portugal) (Producer). (2007). Os Grandes Portugueses [Motion Picture]. RTP1.
Ravi Parikh, M. M. (2009). Sentiment Analysis of User-Generated Twitter Updates using Various Classification Techniques. 1-18.
Research Beast. (13th February 2020) Sentiment Analysis using NVIVO – A Step by Step Guide – Research Beast [Video]. Youtube. https://www.youtube.com/watch?v=n0Ejl1zraB4&t=643s
Reyes-Menendez, A., Saura, J. R., & Alvarez-Alonso, C. (2018). Understanding #WorldEnvironmentalDay User Opinions in Twitter: A Topic-Based Sentiment Analysis Approach. International Journal of Environmental Research and Public Health.
SAPO. (2020, July 18). Nascer do Sol. From SAPO: https://sol.sapo.pt/artigo/703317/50-anos- apos-morte-extrema-direita-promove-homenagem-a-salazar-com-romagem-e-missa
SIC Notícias. (01st, April 2021). André Ventura “não é um salazarista, mas apropria-se do discurso de Salazar [Video]. SIC Notícias. https://sicnoticias.pt/programas/reportagemsic/2021-04-01-Andre-Ventura-nao-e-um- salazarista-mas-apropria-se-do-discurso-de-Salazar-d3d78e3f
Silva, J. C. (2020, July 25). Capas. From Diário de Notícias: https://www.dn.pt/edicao-do- dia/25-jul-2020/reflexo-de-salazar-no-espelho-portugues-esta-a-ficar-menos-nitido- 12463662.html
Silva, M., & Team, R. (2011, May). Notas sobre a realização e qualidade do Twittómetro. University of Lisbon, Faculty of Sciences.
Silva, R. M. (2018). Análise de Sentimento em Tweets.
Souza, M., & Vieira, R. (2012). Sentiment Analysis on Twitter Data for Portuguese Language. Heidelberg: Springer.
Statworks Group (09th April 2020) NVivo – Autocoding through Sentiment Extraction and Analysis [Video]. Youtube. https://www.youtube.com/watch?v=FRormTwrWVA
Tavabi, L. L. (2015). Evaluation of Political Sentiment on Twitter. University of California.
Tavares, J. M. (2019, September 10). Opinião. From Público: https://www.publico.pt/2019/09/10/politica/opiniao/fantasma-antonio-oliveira- salazar-1886077
Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. (2010). Predicting election with Twitter: What 140 characters reveal about political sentiment. Proceedings of the International Conference on Weblogs and Social Media, (pp. 178-185). Pennsylvania.
Uma Página Numa Rede Social (25th May 2020) As “Novas Direitas” [Video]. Facebook. https://www.facebook.com/UmaPaginaNumaRedeSocial/videos/386275165984763/
Young, D. G. (2018). Theories and Effects of Political Humour: Discounting Cues, Gateways, and the Impact of Incongruities. Obtido de Oxford Handbooks Online: https://www.oxfordhandbooks.com/view/10.1093/oxfordhb/9780199793471.001.000 1/oxfordhb-9780199793471-e-29