Большой словарь мата. Том 1, стр. 89

Структура базы данных русского мата

1. Общие принципы

База данных русского мата была задумана как источник для толкового словаря обсценной («грубо-непристойной») интердиалектной (т. е. над-диалектной, просторечной) лексики. Основная задача базы данных – предоставить исследователям материал, ранее не представленный в словарях. Предпринимается попытка описания обсценной лексики, зафиксированной в источниках XVII-XX веков. Если в поздних источниках обнаруживался более ранний материал (до XVIII века), то он также давался в базе данных. Соответственно, использовались современные издания источников XI-XIX веков. Базы данных неизбежно отразила динамику языковых форм в установленных пределах, являя ряд диахронических изменений в некоторых частях системы. В ней оказались объединены отдельные языковые элементы, разнородные в плане диахроническом. В то же время здесь могли оказаться рядом слова, употребляемые разными социальными группами, слова, относящиеся к функционально различным проявлениям мата. Избежать подобных недостатков, вероятно, удалось далеко не во всех случаях. Особенно это касается разных значений одного и того же, казалось бы, общеупотребительного выражения. В действительности это могут быть не два значения одной идиомы, а две разные идиомы. Применительно к лексике обычно говорят о случаях так называемой областной или социальной омонимии.

Большая часть этих противоречий порождена особенностями самого объекта или ограниченностью сведений о данной области языка. Сложнейшая система табу, опутывающая сниженную экспрессивную часть языка, препятствует получению объективных данных даже применительно к современному материалу, который всегда в той или иной степени маркирован. К тому же просторечие попадает в письменные тексты зачастую лишь фрагментарно и строится в виде новой системы.

2. Источники

Были использованы источники как художественные, так и нехудожественные; как прозаические, так и поэтические; как опубликованные, так и неопубликованные; как литературные, так и фольклорные (см. список источников).

Культурные контексты бытования мата недостаточно прояснены. Мат в высокой литературе, в анонимной массовой литературе, в фольклоре, в русском роке, в устной речи и в переводных текстах представляет разные модификации подсистемы. Такая разнородность источников требует хотя бы краткой их типологии.

2.1. Типология источников

Материалы, на основе которых составлялась база данных, можно условно разделить на шесть основных групп: 1) устные источники; 2) фонограммы; 3) печатные источники; 4) переводные печатные источники; 5) рукописные источники; б) источники из Интернета. Устные источники делятся на записи анонимныхтекстов, сделанные автором, материалы, предоставленные информантами, и материалы, полученные в результате психолингвистического эксперимента. Фонограммы делятся на тиражированные и архивные записи. Печатные источники делятся на художественные и нехудожественные тексты, в частности словари. Рукописные источники делятся на архивные материалы и рукописи, предоставленные авторами. Среди рукописных источников обеих групп есть и словари, и художественные тексты и др. Словари всех типов (как рукописные, так и печатные, как собственно обсценные, так и жаргонные в широком смысле) анализируются отдельно в статье «Словарь русского мата как культурный феномен». Какявствуетиз сказанного, данная типология столь разнородных источников хотя и является условным исследовательским конструктом, но необходима в лексикографической работе.

2.1.1. Устные источники и их обработка

Фиксация устного материала производилась следующими способами. Во-первых, в словник базы данных включена лексика, зафиксированная автором в период с 1978 по 2000 год. в речи представителей различных социальных и возрастных групп. Материалы записывались в разных городах и населенных пунктах только от русскоязычных информантов [23] . Лексика, зафиксированная лишь в одном пункте, условно рассматривалась как диалектная и в словарь не включалась. Во-вторых, с информантами велась работа в виде опросов. Таким образом, факт функционирования лексики был зафиксирован в большинстве случаев трижды: 1) психолингвистическим экспериментом, 2) печатными источниками и 3) устными источниками. В словарь были включены все слова, факт существования которых подтверждался не менее чем двумя информантами, даже если они не были зафиксированы автором в устной речи и не встречались в письменных текстах.

Кроме записей устной речи в качестве источников использовались авторские записи анонимных текстов. Такие примеры условно снабжены не ссылкой на источник, а пометой «Фольк». Разумеется, среди текстов, условно рассматриваемых в качестве анонимных, могут встречаться малоизвестные авторские тексты, усвоенные фольклором. Автор не занимался проблемами атрибуции текстов и не несет ответственности за проникновение авторских текстов в фольклор.

Привлекались тексты самые разнообразные как в жанровом, так и в стилистическом отношении [24] . В список источников малые жанры из авторских записей, не имеющие заглавий, естественно, не выносились (паремии, другие языковые клише, загадки и частушки). В тексте базы данных они сопровождаются пометой «Фольк». Названия песен, басен, поэм и других крупных жанров вынесены в список источников.

2.1.2. Фонограммы

Обсценная лексика достаточно широко представлена в текстах отечественных рок-групп [25]. Иллюстративный материал был бы ущербным без использования этого материала. При цитировании мы приводили тексты в общепринятой орфографии и пунктуации. В тех случаях, когда альбомы были снабжены списками названий содержащихся в нихтекстов, ставилось сначала название группы, затем название альбома и уже потом название текста песни (например: АукцЫон. Птица. Спи, солдат). Если мы не располагали заглавиями текстов, то указы вались только название группы и альбома. Использовалисьтакже общеупотребительные сокращения названий групп. Например, «ГО» вместо «Гражданская оборона»: ГО. Молодежь. Для авторских альбомов сначала ставилось имя автора, затем сокращенное название альбома (например: Лаэртский. Зорька). Все сокращенные названия выносились в список источников. Рок-тексты цитировались по фонограммам из собрания автора.

2.1.3. Печатные источники

Важной группой печатных источников являются словари. Однако если оригинальность материалов, включенных, скажем, в Словарь московского арго (Елистратов), не может вызывает сомнений, то этого никак нельзя сказать о словаре Флегона и многих других. Следовательно, если наличие какого-либо языкового элемента в словаре Елистратова и одновременно в словаре Изнародова было достаточным подтверждением его существования, то, напротив, его наличие в словаре Флегона и одновременно в словаре Drummond-Perkins не было достаточным основанием для включения в нашу базу данных, поскольку составители последнего использовали некритически словарь Флегона в качестве источника (не говоря уже о словарях Н. Кабанова, А. Волкова, А. Н. и Н. Н. Кохтевых, которые попросту представляют собой плагиат). Если языковой элемент встретился в двух и более словарях, каждый из которых сделан на основе предыдущего, мы не включали его, при условии, что данный языковой элемент не был зафиксирован в других источниках. Таким образом, к использованию словарей в качестве источников мы подходили с известной осторожностью. Языковые элементы, встречающиеся в каком-нибудь одном из ранее вышедших словарей, но не найденные в других источниках (не зафиксированные хотя бы один раз в устной речи, не обнаруженные в литературных источниках, не подтвержденные информантами), в базу данных не вошли. Таким образом, в базу данных были включены материалы, зафиксированные как минимум дважды в устных и / или письменных источниках. Например: включавшиеся ранее хотя бы в один словарь и при этом зафиксированные хотя бы один раз в других источниках, или встречавшиеся не менее двух раз в независимо составленных словарях, или встречавшиеся не менее двух раз в письменных текстах. Цитаты из словарей вынесены в справочно-библио-графические разделы базы данных. В справочно-библиографических разделах были задействованы все словари, представляющие хоть какой-то научный интерес. Таким образом, данная база данных содержит в себе элементы справочно-библиографического словаря. Она включает в себя все наиболее интересные языковые факты, зафиксированные в ранее вышедших словарях, начиная с дополнений Бодуэна де Куртенэ к третьему изданию словаря В. И. Даля и заканчивая кратким и как бы шуточным, но тем не менее единственным научным словарем обсценностей, подготовленным А. Н. Барановым и Д. О. Добровольским (кстати, наша база данных была одним из источников словаря Баранова-Добровольского). Однако А. Н. Баранов и Д. О. Добровольский не ставили перед собой задачи максимального охвата материала. Их словарь содержал ограниченный набор фразеологизмов, но зато был сделан как экспериментально-лингвистический, снабжен научным аппаратом.

вернуться

23

Так, например, значительный лексический материал был зафиксирован автором осенью и зимой 1982 г. в военном госпитале г. Североморска от более чем ста русских информантов, проживавших до армии в разных регионах СССР.

вернуться

24

Это и паремии, и загадки, и частушки, и песни («Собраласьтолпа друзей…», «Сосед», «Как-то с Мишкой из деревни…», «Песня двух старых знакомых», «Песенка Крокодила Гены», «Песня о работе в милиции»), и басни («Лев и заяц», «Ворона и лисица»), и порнопоэмы («Евгений Онегин», «Фелиста», «Рассказ с того света»), и некоторые другие фольклорные жанры.

вернуться

25

Все фонограммы цитируются по записям из собрания автора.