Seleção da nomenclatura: elaboração do vocabulário em português concernente aos temas selecionados

Foram pesquisadas primeiramente todas as unidades lexicais referentes aos trinta temas, constantes em todos os dicionários arrolados em Seleção dos Temas. Em seguida, com base na listagem de freqüência do Dicionário de freqüências do português brasileiro contemporâneo (BIDERMAN, 1997) e na própria competência lexical de diversos informantes (três adolescentes, três universitários, três professores de língua portuguesa e todos os professores de línguas estrangeiras responsáveis por este trabalho), desbastamos o resultado inicial fornecido pelos dicionários. Assim, algumas palavras foram destinadas a um outro nível, outras excluídas e algumas incluídas.
Cremos ser pertinente enfatizar que nossa principal fonte, o dicionário de freqüências acima referido, trabalhou com a base textual informatizada do “Laboratório de Lexicografia” da UNESP, campus de Araraquara. Assim, dada a extensão do corpus proveniente dessa base textual, à semelhança da dimensão do corpus utilizado pela pesquisa American Heritage Word Frequency Book (apud BIDERMAN, 1984), pudemos determinar que 20 ocorrências representem o limiar mínimo para uma palavra ser considerada freqüente. Estaríamos de acordo com o parâmetro SFI (Standar Frequency Intermediate), estabelecido pela análise estatística de Carrol, um dos membros da equipe da pesquisa citada acima. Isso significa que, considerando-se esse parâmetro, de 20 a 40 teríamos palavras de baixa freqüência – em se tratando de vocabulário fundamental – na composição do vocabulário de NA; de 40 a 100, palavras de freqüência média, indicadoras do vocabulário de NI; e acima de 100, palavras de alta freqüência para a formação do NB. Foi preciso, entretanto, atentar para alguns problemas:

1. Apesar de o corpus utilizado para a elaboração deste dicionário ser da ordem de seis milhões de ocorrências de palavras, sendo cinco milhões concernentes a textos escritos de 1950 a 1995, e um milhão extraídos de um subcorpus de língua falada, a sua própria nomenclatura apresenta restrições. Referindo-nos apenas às formas lematizadas, verificamos que não há registro de ‘berinjela’, ‘coala’, ‘hambúrguer’ ou ‘retroprojetor’, como exemplos de unidades lexicais simples, nem de ‘rabo-de-cavalo’, como exemplo de unidade lexical composta, nem de ‘panela de pressão’, ‘tênis de mesa’ ou ‘tubo de ensaio’, como exemplos de unidades lexicais complexas. Essas entradas, todavia, da mesma forma que algumas outras indiscutivelmente bastante usuais, são encontradas em todos os dicionários temáticos pesquisados que também nos serviram de corpus, e foram, portanto, acrescidas à nossa nomenclatura. Ressaltemos, ainda, que este fenômeno, também ocorreu na elaboração tanto do português fundamental de Portugal, quanto na do francês ou do espanhol, e as unidades lexicais acrescentadas constituíram o que se chamou “corpus de disponibilidade”.

2. Nosso dicionário temático procurou atender a uma organização onomasiológica, sendo os temas unidades lexicais que representam conceitos propostos para se obter uma determinada estruturação global do léxico referente ao vocabulário fundamental da língua portuguesa. Por sua vez, cada unidade lexical constante em um tema representa um tipo de relação analógica possível. Assim, o tema Lazer e Cultura nos traz, dentre outras analogias, “futebol”, que nos remete à ‘bola’, dentre outras relações. Portanto, não foram apenas as palavras de altíssima freqüência que compuseram o vocabulário do nível básico. O que se observou foi o que podemos chamar de freqüência relativa, ou seja, a freqüência das unidades lexicais representativas de um tema do NB em relação às unidades do mesmo tema do NI e do NA. Desse modo, pudemos considerar ‘beber’, ‘comer’ ou ‘tomar banho’, por exemplo, entradas melhor adequadas ao NB de aprendizagem por se tratarem de Ações Comuns bastante corriqueiras; ‘cortar’, ‘empurrar’ ou ‘mentir’, ao NI, pois são um pouco menos usuais que as do primeiro bloco; e ‘agachar’, ‘bocejar’ e ‘dobrar’, ao NA, por representarem um emprego comparativamente ainda menos marcado.