Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Litera
Правильная ссылка на статью:

Значения существительного terra (на материале корпуса современных португальских газет)

Силкина Инесса Алексеевна

аспирант, кафедра романского языкознания, Московский государственный университет им. М. В. Ломоносова

119991, Россия, г. Москва, ГСП-1, Ленинские Горы, 1, стр. 51, филологический факультет

Silkina Inessa

post-graduate student of the Department of Roman Language Studies at Lomonosov Moscow State University

119991, Russia, g. Moscow, GSP-1, Leninskie Gory, 1, str. 51, filologicheskii fakul'tet

inessa.silkina@gmail.com

DOI:

10.25136/2409-8698.2018.2.26140

Дата направления статьи в редакцию:

26-04-2018


Дата публикации:

18-06-2018


Аннотация: Данная статья посвящена анализу значений существительного terra в португальских газетах конца XX–начала XXI вв. Информация о значениях слова также содержится в толковых словарях, однако в них фиксируется лексическая норма литературного языка, в отличие от письменных и устных текстов, созданных носителями языка и отражающих узуальное употребление. В связи с тем, что целью настоящего исследования является анализ употребления, а не нормы, в качестве материала нами были использованы тексты современных португальских газет, содержащиеся в корпусе текстов O Corpus de Referência do Português Contemporâneo (CRPC). Нами было проанализировано более тысячи контекстов из газетного подкорпуса, соответствующих запросу terra, а выявленные значения структурированы в соответствии с их смыслом и современными представлениями о Земле и её строении, а также с учетом данных толковых словарей. Научная новизна статьи связана с использованием данных и функционала корпуса текстов CRPC для анализа существительного terra, которое ранее не рассматривалось отечественными исследователями. В результате анализа контекстов было выявлено восемь широких значений, в шести из которых было выделено несколько более узких, причем во многих из них отражены особенности восприятия terra современными носителями языка.


Ключевые слова:

современный португальский язык, европейский вариант, узус, лингвистический корпус, газетный подкорпус, лексика, частотность, контекст, значение, многозначность

Abstract: This article is devoted to the analysis of the nouns terra in Portuguese newspapers of the end of the 20th – beginning of the 21st centuries. Information about the meanings of a word is also contained in explanatory dictionaries, however they contain the lexical norm of a literary language, in contrast to written and oral texts created by native speakers and reflecting the usual usage. Due to the fact that the purpose of this study is to analyze usage rather than norms, we used the texts of modern Portuguese newspapers contained in the corpus O Corpus de Referência do Portuguê Contemporâneo (CRPC) as the material. We have analyzed more than a thousand contexts from the newspaper subcorpus corresponding to the terra request, and the revealed values are structured in accordance with their meaning and modern ideas about the Earth and its structure, as well as taking into account the given explanatory dictionaries. The scientific novelty of the article is related to the use of data and the functionality of the CRPC corpus for the analysis of the noun terra, which was not previously considered by domestic researchers. As a result of the analysis of contexts, eight broad meanings were identified, in six of which several somewhat narrower ones were identified, and many of them reflected the peculiarities of terra perception by modern native speakers.


Keywords:

modern Portuguese, European Portuguese, usus, linguistic corpus, newspaper subcorpus, lexicon, frequency, context, meaning, polysemy

Обработка больших объемов информации при помощи компьютеров позволила создавать электронные корпусы текстов, которые «произвели революцию практически во всех разделах лингвистики (здесь и далее перевод наш. – И. С.[19, p. 4]. Такого же мнения придерживаются и другие зарубежные и отечественные исследователи (ср., например, [4, 5, 10, 14, 21]). (Отметим, что в данной работе мы рассматриваем корпус как «большой, представленный в машиночитаемом формате, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач» [6, с. 5]).

Говоря об отличительных чертах корпусных исследований Е. Е. Голубкова отмечает, что их «эмпирический характер ..., наблюдаемость феноменов, верифицируемость теорий, информация о частотности, освобождение от субъективности суждений <...>, идея о том, что слова определяют свое окружение и сами определяются им, привели к переоценке понятия лексической единицы и возрастанию роли фразеологии» [5, с. 41].

В свою очередь, «отчетливая смена теоретических приоритетов – с переходом от „системы‟ к „узусу‟ и от „языка‟ к „речи‟» [10, с. 8], способствовала росту популярности корпусных исследований, направленных более на изучение употребления, чем системы [17, p. 168].

Таким образом, нельзя не признать, что «именно корпуса текстов являются сегодня важнейшим источником сведений о живом языке» [1, с. 37], в отличие от грамматик и словарей [8, с. 265], которые, тем не менее, могут быть усовершенствованы благодаря использованию данных, извлеченных из корпусов [11, с. 10].

Всё вышесказанное свидетельствует об актуальности данного исследования. Что касается его цели, то она состоит в выявлении и анализе значений португальского существительного terra, которые встречаются в письменных тестах, содержащихся в подкорпусе португальских газет конца XX–начала XXI вв., т. е. в описании его современного употребления носителями языка в отличие от употребления, зафиксированного в словарях [12] и отражающего норму в узком смысле слова. При этом нельзя не отметить, что «в узком смысле норма – это результат целенаправленной кодификации языка. Такое понимание нормы неразрывно связано с понятием литературного языка, который иначе называют нормированным, или кодифицированным (разрядка автора. – И. С.[7, с. 5].

Использованный подкорпус является частью Справочного корпуса современного португальского языка (O Corpus de Referência do Português Contemporâneo (CRPC)) [16], созданного в Центре лингвистики Лиссабонского университета (O Centro de Linguística da Universidade de Lisboa (CLUL)) [20]. CRPC относится к закрытым корпусам, которые «наиболее функционально развиты: исследователю может предоставляться возможность работать с подкорпусами, на которых произведено ручное снятие омонимии или проведена разметка, включая синтаксическую и семантическую». [1, с. 38].

Новизна данного исследования обусловлена тем, что в отечественной португалистике отсутствуют работы, посвященные анализу значений слова terra с использованием корпусных данных и, в частности, газетного подкорпуса. Кроме того, нами будет сделан небольшой обзор Справочного корпуса современного португальского языка (CRPC), который ранее не использовался отечественными исследователями.

На данный момент общий объем CRPC составляет около 312 миллионов слов (palavras), причем 310 миллионов, т. е. абсолютное большинство, относятся к письменному корпусу, в то время как остальные входят в устный [20]. В CRPC вошли разные типы текстов на разных национальных и региональных вариантах португальского языка, большая часть которых относится к периоду с 1970 по 2008 г. в связи с тем, что задачей составителей корпуса было создание собрания текстов, отражающих состояние современного португальского языка [18].

По причине того, что нас интересуют особенности функционирования существительного terra в письменных текстах, относящихся к европейскому варианту португальского языка, поиск контекстов осуществлялся в письменном подкорпусе CRPC: Portugal only (далее – корпус), объем которого составляет 289 840 619 слов.

Что касается типов текстов или категорий (categories), то в рассматриваемом корпусе представлена художественная, учебная, техническая литература, журналы, газеты, политические тексты, литература разных жанров, техническая литература, переписка, брошюры, юридические тексты. В следующей таблице приводится статистическая информация по распределению запроса terra (форма И. п., ед. ч.) по текстам разных жанров. В первом столбце приводятся перечисленные выше типы текстов, во втором зафиксировано общее количество слов во всех текстах каждого типа, затем следует количество соответствий запросу во всех текстах каждого типа, количество файлов, в котором запрос встретился 1+ раз, а также частотность запроса в пересчете на миллион слов в текстах каждого типа.

Таблица 1

Category [↓]

Words in category

Hits in category

Dispersion (no. files with 1+ hits)

Frequency [↓] per million words in category

livro_literario

8 056 234

5 647

379 out of 417

700.95

livro_didactico

1 214 622

616

41 out of 58

507.15

livro_tecnico

9 113 420

4 358

223 out of 386

478.2

revista

3 363 058

910

435 out of 3 836

270.59

jornal

98 579 946

15 143

9 853 out of 160 289

153.61

politica

163 225 296

20 268

12 104 out of 163 497

124.17

varia

2 187 884

258

102 out of 2 200

117.92

revista_tecnica

1 615 349

165

64 out of 663

102.15

correspond

87 503

8

5 out of 99

91.43

folheto

80 833

7

3 out of 36

86.6

direito

2 316 474

60

24 out of 851

25.9

Total:

289 840 619

47 440

23 233 out of 332 332

163.68

Как видно из таблицы, подавляющее большинство текстов относится к политическим изданиям (politica) и газетам (jornal), в них же представлено больше всего соответствий запросу terra. Кроме того, на долю газетных текстов приходится 50,8% от всех тестов в составе корпуса, они содержат 35,7% от общего количества слов, в то время как политическими являются 45,9% текстов, содержащих 52,7% всех слов [20]. В то же самое время, наибольшая частотность terra отмечается в текстах художественной, учебной, технической литературы (livro literario/didactico/tecnico).

В качестве источника материала для анализа нами был выбран газетный подкорпус, в котором содержатся публицистические статьи, новости политики, экономики, спорта, анонсы, рецензии и другие типы текстов, охватывающие различные сферы жизни общества (данная классификация газетных текстов отсутствует в корпусе и была сделана нами на основе анализа отобранных контекстов, поэтому не может быть названа окончательной). Подобное разнообразие содержания позволяет предположить, что язык представленных в корпусе газет ближе к языку повседневного общения, чем, например, язык юридических или политических текстов. В связи с этим можно также предположить, что в газетных текстах представлен достаточно разнообразный набор значений terra, т. к. тексты, представленные в газетах, не ограничиваются той или иной специальной тематикой. Кроме того, на выбор этого подкорпуса также оказала влияние информация о его объеме, который во много раз превышает объём практически всех остальных подкорпусов, в том числе и подкорпуса художественной литературы.

Для составления списка значений рассматриваемого существительного нами было проанализировано более тысячи контекстов, которые были отсортированы в алфавитном порядке по слову, находящемуся слева от terra. Однако нельзя не отметить, что анализ значительного количества контекстов не является гарантией того, что в них встретятся все значения слова, существующие как в языке, так и присутствующие во всём (под)корпусе. Кроме того, именно поэтому мы не рассматривали частотность употребления разных значений, т. к. полученные данные могли отразить ситуацию характерную только для нашей выборки.

Проанализированные контексты были извлечены из газет Expresso, P&u