Compilation of a University Learner Corpus


  • Deise Prina Dutra Universidade Federal de Minas Gerais
  • Andressa Rodrigues Gomide Universidade Federal de Minas Gerais


Palabras clave:

Learner corpus, Corpus design, Independent task, Integrated task.


Corpus Linguistics (CL) and Second Language Acquisition (SLA) areas have been complementary background for researchers interested in contrastive interlanguage analysis (Granger, 1998), shedding light on our understanding of English acquisition by various learner groups. In Brazil there is a paucity of research that describes university learner English so that pedagogical interventions fit their needs. The main objective of this paper is to describe the compilation of a Brazilian university level learner corpus, CorIsF-Inglês, and illustrate how a frequency analysis can reveal learner choices when they perform different written tasks. The type of task, independent or integrated, is likely to have influenced the frequency of nouns, verbs and adjectives learners used.




A Criação de um Corpus de Aprendizes Universitários

Resumo: As áreas de Linguística de Corpus (LC) e de Aquisição de Segunda Língua (ASL) têm sido pano de fundo complementares para pesquisadores interessados em análise contrastiva da interlíngua (Granger, 1998), iluminando nossa compreensão sobre a aquisição de inglês por aprendizes de vários grupos. No Brasil, há poucas pesquisas que descrevem o inglês de aprendizes universitários que permitam que intervenções pedagógicas sejam adequadas a suas necessidades. O objetivo principal deste artigo é descrever a compilação de um corpus de aprendizes brasileiros, CorIsF-Inglês, e ilustrar como uma análise de frequência pode revelar as escolhas dos aprendizes quando eles fazem tarefas de escrita. O tipo de tarefa, independente ou integrada, pode ter influenciado a frequência de substantivos, verbos e adjetivos que os aprendizes utilizaram.

Palavras-chave: Corpus de aprendiz; Desenho do corpus; Tarefa independente; Tarefa integrada.


Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Deise Prina Dutra, Universidade Federal de Minas Gerais

English and Linguistics professor at UFMG. Research interests: learner corpus; teaching education and English for academic purposes. IsF-UFMG general coordinator.


Alcântara, Christiane Fontinha de Alcântara 2015. Intensificação sob a ótica da Linguística de Corpus: Uma investigação sobre o inglês oral de aprendizes brasileiros. Retrieved from on June 18th, 2015.

Berber Sardinha, Antonio Paulo 2001. O corpus de aprendiz Br-ICLE. Intercâmbio, 10, pg. 227-39.

Biber Douglas; Gray, Bethany 2013. Discourse Characteristics of Writing and Speaking Task Types on the TOEFL iBT ® Test: A Lexico-Grammatical Analysis. TOEFL iBT ® Research Report. 2013. Retrieved from

Chomsky, Noan 1981. Lectures on government and binding. Dordrecht: Foris.

Dutra, Deise Prina. & Berber Sardinha, Tony 2013. Referential expressions in English learner argumentative writing. In Granger, Sylviane;; Gilquin, Gaëtanelle, & Meunier. Fanny (Eds.). Twenty Years of Learner Corpus Research: Looking back, Moving ahead. Corpora and Language in Use – Proceedings 1, Louvain-la-Neuve: Presses universitaires de Louvain, pg. 117-127.

Dutra, Deise Prina In press. Formação de professores: colaboração sem fronteiras. In: Dalacorte, Maria Cristina Ferreira (Org.).

Dutra, Deise Prina; Gomide, Andressa; Oliva, Katherine; Guedes, Annallena In press. Corpus de aprendizes do Inglês sem Fronteiras: caminhos para compreender a interlíngua de alunos universitários brasileiros. In: Sarmento, Simone (Org.).

Granger, Sylviane (Ed.) 1998. Learner English on Computer. London & New York: Addison Wesley Longman.

Granger, Sylviane, Dagneaux, Estelle, Meunier, Fanny, Paquot, Magali 2009. The International Corpus of Learner English. Version 2 Handbook and CD-ROM. Louvain-la-Neuve: Presses universitaires de Louvain.

Granger, Sylviane 2015. Contrastive interlanguage analysis: A reappraisal. International Journal of Learner Corpus Research, 1(1), pg. 7–24.

Leech, Geoffrey 1998. Preface. In: Granger, S. (Ed.) Learner English on Computer. London & New York: Addison Wesley Longman.

Mello, Heliana; Avila, Luciana; Neder Neto, Tufi; Orfano, Barbara 2012. LINDSEI-BR: an oral English interlanguage corpus. In: VII GSCP International Conference: Speech and Corpora, 2013, Belo Horizonte. Proceedings of the VII GSCP International Conference: Speech and Corpora. Florença, Itália: Firenze University Press, pg. 85-86.

MacWhinney, Brain 1987. The competition model. In: MacWhinney, Brain (Ed.). Mechanisms of language acquisition. Hillsdale NJ: Erlbaum,

Schachter, Jacquelyn 1988. Second language acquisition and its relationship to universal grammar. Applied Linguistics, 9(2), pg. 219-235.

Selinker, Larry 1972. Interlanguage. International Review of Applied Linguistics, 10, pg. 209-231.

Shepherd, Tânia 2009. Corpora de aprendiz de lingua estrangeira: um estudo de n-gramas. Veredas, 2, pg. 100-116.

Wang, Maolin; Malmasi, Shervin; Huang, Mingxuan 2015. The Jinan Chinese Learner Corpus. Proceedings of the Tenth Workshop on Innovative Use of NLP for Building Educational Applications. Denver: Association for Computational Linguistics

White, Lydia 1989. Universal grammar and second language acquisition. Philadelphia: John Benjamins.




Cómo citar

Dutra, D. P., & Gomide, A. R. (2016). Compilation of a University Learner Corpus. BELT - Brazilian English Language Teaching Journal, s21-s33.