Какой из языков соответствует требованиям к ипя. Организационная структура предприятия: виды и схемы. Апробация информационно-исследовательской базы данных

Какой из языков соответствует требованиям к ипя. Организационная структура предприятия: виды и схемы. Апробация информационно-исследовательской базы данных "Русский Шекспир"

УДК 007.52 + 159.95

Ю.Л. Шередеко

// "Управляющие системы и машины УС и М", №1, 1998.

Представлена продуктивная классификация информационных процессов, построенная на базе модели семантического пространства любого субъекта (не только индивидуального). Приведено обоснование и описание построения модели, даны основные определения, в частности, определения понятий "информационная операция" и "информационный процесс". Особое внимание уделено когнитивным информационным процессам, рассмотрена модель понятийного аппарата субъекта.

Определений информационных процессов (ИП) не многим меньше, чем определений информации. Уже само обилие таких определений служит убедительным свидетельством их недостатков, показывая их частный характер, ориентацию каждого из них на узкий круг задач.

Процессом, в самом общем случае, называют ход, протекание какого-либо явления, последовательную смену его состояний. Искусственно воссоздаваемые процессы имеют утилитарное предназначение, потому понимаются как совокупность последовательных целенаправленных действий (в соответствии, например, с ДCТУ 2938-94. Системы обработки информации. Основные понятия. Термины и определения). Искусственная реализация процесса предполагает построение технологии, где последовательности операций процесса ставится в соответствие последовательность взаимоувязанных средств реализации этих операций (операция здесь понимается как отдельное элементарное (нерасчленимое) действие, отдельная законченная часть процесса).

В силу ряда причин в данной статье рассматриваются не информационные технологии, а именно ИП. Во-первых, при разработке новой информационной технологии сначала нужно точно определить, какой именно ИП эта технология будет реализовывать. Во-вторых, поскольку технологиями считаются только искусственные реализации процессов, то далеко не все процессы реализованы в виде технологий. И, главное, в-третьих, различные технологии могут реализовывать один и тот же процесс при помощи различных средств. А поскольку множество средств реализации каждой операции процесса всегда открыто (не ограничимо в принципе), то построить полную классификацию технологий, реализующих даже один процесс, невозможно. Более того, подобные классификации всегда непродуктивны, не способны дать ничего существенно нового, так как содержат комбинации только известных средств реализации операций. В то же время множество процессов, состоящих из счетного множества операций тоже счетно, т.е. при условии определения множества всех возможных операций построение полной классификации процессов является вполне разрешимой задачей.

Для получения полной и продуктивной классификации, содержащей не только хорошо известные, но и все возможные (мыслимые) ИП, необходимо опираться на инвариантные свойства (атрибуты) любых ИП. Исходными предпосылками для нахождения таких атрибутов. ИП служат, во-первых, неотрывность информации от субъектно-объектных отношений , и, во-вторых, то, что наиболее полный набор ИП реализован в самом субъекте (все искусственно созданные ИП только воспроизводят, дублируют некоторые ИП, выполняемые субъектом, именно субъект задает программы функционирования и управления искусственных систем). Поэтому для нахождения атрибутов, определяющих ИП, необходимо исследовать субъект и, в частности, его информационную деятельность.

1. Определение понятия "субъект"

Субъект обычно определяется как источник активности, направленной на объект, носитель предметно-практической деятельности и познания . При этом субъект обычно понимают как индивид, хотя им может быть и социальная группа [З], и юридическое лицо - субъект права, в частности - международного права.

1.1. Любой субъект является целостным, т.е. системой, но чтобы система могла быть источником активности (субъектом), необходимо и достаточно одновременное соблюдение трёх условий:

  • I. Система должна быть способной в своих представлениях отделять себя от внешнего мира, других субъектов (всякая система ограничена, но далеко не всякая может сама устанавливать свои границы);
  • II. Система должна иметь собственный (уникальный) внутренний мир, свои (субъективные) представления;
  • III. Система должна быть способной взаимодействовать с миром и с другими субъектами.

Эти три условия являются условиями существования любого субъекта, поэтому они определяют все его инвариантные свойства. Без выполнения любого из этих условий невозможно в полной мере выполнение двух других и само существование субъекта как источника активности. В то, же время, любая система, в которой одновременно выполняются все три условия, может быть источником активности, следовательно, является субъектом.

1.2. Выполнение этих трёх условий приводит прежде всего к тому, что система становится информационно обособленной, у системы (субъекта) формируется своё семантическое пространство, сфера внутренних информационных процессов. Это основное инвариантное свойство любого субъекта. Понятие "семантического поля", введенное В.В. Налимовым , предполагает соотнесение смыслов с числовой осью - линейным континуумом Кантора, что, по сути, является одномерным семантическим пространством.

2. Семантическое пространство субъекта

Отличие употребляемого здесь понятия "семантическое пространство" от аналогичного понятия, введенного Осгудом , будет рассмотрено в конце данного раздела. Сначала обратимся к понятию смысла, как его трактует В.В. Налимов: "Что такое смыслы, значения слова? Это единичные объекты, их свойства и отношения, классы объектов, свойств и отношений. Совокупность всего этого - типология Мира, его общего разнообразия. Каждому слову сопоставляется пятно в типологии Мира. Размытость этого пятна всегда воспринималась как дефект языка. Везде, будь то в науке или юриспруденции, мы стараемся как можно резче оконтурить это пятно, подразумевая дискретность не только индивидов, но и таксонов. ...Вероятностная модель языка смиряется с размытым смысловым полем слова. Может быть, это капитуляция языка перед сложностью Мира, сложностью его типологии, бесчисленным множеством его таксонов. А может быть, это - отражение свойств типологии Мира? Дискретны ли сами таксоны, или они вероятностны по природе?" .

Подобную трактовку смысла находим у Г.Л.Мельникова: "Смысл - единица мыслительная, абстракция из области не коммуникативной, а собственно мыслительной, например, прогнозирующей деятельности, к лингвистике она имеет лишь косвенное отношение, в первую очередь как объект, который обслуживается средствами языка в актах коммуникации, но имеет самостоятельное существование и независимые от языка функции" .

Теперь вернемся к условиям существования субъекта и рассмотрим, как они отражаются в его смысловом пространстве.

2.1. Согласно первому условию, в смысловом пространстве выделяется область смыслов, с которыми система себя отождествляет, - область "Я", отделяя себя от всех остальных смыслов - области "не-Я". (По И.С. Кону "Оппозиция "Я - не-Я" не содержит ничего, кроме утверждения своего отличия, выделения из окружающего мира" ). В области "Я" содержатся смыслы, такили иначе связанные со спецификой субъекта, - "специализированные" знания, в отличие от универсальных, содержащихся в области "не-Я". Всё содержащееся в области "Я" значимо (актуально) для субъекта, затрагивает его, т.е. всё, чему субъект придает значение, представлено в его области "Я". Смыслы, входящие в эту область, влияют или потенциально могут влиять на активность субъекта, на процессы восприятия и на всю его деятельность, т. е. в этой области актуальные для субъекта и актуализируемые смыслы. Здесь его потребности и желания, притязания, цели и ценности, т.е. всё, что касается бытия субъекта. Мотивация (но не мотивировка) действий субъекта также исходит из этой области. Следовательно, чтобы войти в эту область, смыслы должны обладать потенциалом, достаточным для управления восприятием, активностью и всей деятельностью субъекта . Мы приводим к тому, что граница этой области может быть представлена в виде барьера (разности) потенциалов. Так как смыслы, находящиеся в этой области, выражают то, с чем субъект отождествляет себя, естественно будет назвать отождествлением функцию, реализующую первое условие.

2.2. Согласно второму условию, в смысловом пространстве субъекта выделяется область освоенных, включенных в тезаурус субъекта, "внутренних " смыслов (содержащиеся в этой области знания можно назвать осмысленными) в отличие от остальных (неосвоенных, "внешних", в том числе и чужих, противоречащих тезаурусу) смыслов (в этой области - неосмысленные знания). Внутри тезауруса всё взаимоувязано и нет противоречий, именно эта область является для субъекта настоящим смысловым континуумом, поскольку она непрерывна и нерасчленима. Вхождение в эту область чего-то нового возможно только при его увязке со всем тезаурусом путем переосмысления, рефлексии содержимого этой области. Это требует определённой работы, потому оправданны представления о границе этой области как о барьере (разности) потенциалов. Необходимость такой работы появляется только в случае возникновения новой нетривиальной ситуации. Рефлексия, как отражение собственных познавательных установок, как раз и является функцией, реализующей второе условие, потому смыслы, находящиеся в этой области, назовём отрефлексированными (дабы избежать тавтологии "осмысленные смыслы"). Эта область содержит то, в чём субъект уверен (система верований), в чём не сомневается, его навыки, возможности, способности (то, что он может реализовать).

2.3. Согласно третьему условию, в смысловом пространстве субъекта выделяется область смыслов, которые могут быть как-то обозначены, введены в сферу внимания, проанализированы (рассмотрены абстрактно и/или последовательно по частям) и переданы другим субъектам (или приняты от них), т.е. в этой области смыслов возможна внутренняя и внешняя коммуникация. Эта область отделена границей от смыслов невыразимых (пока или уже), непередаваемых и недоступных отчету и самоотчету (даже вниманию). Замеченным (а тем более переданным) может быть только то (те смыслы), для чего у субъекта (или, соответственно, у субъектов) есть дискретные метки - знаки, составляющие понятийный аппарат субъекта (близкие понятия: "концептуальная система" |11], "категориальная модель мира" ). Эта проявленная дискретность, из которой рождается язык, является достаточно четким основанием для разделения семантического пространства субъекта. Как и в предыдущих случаях, граница является барьером (разностью) потенциалов, поскольку для вхождения в эту область новых смыслов должна быть проделана работа по их обозначению. Обозначенные смыслы могут быть осознаны (любым субъектом, как и человеком), поэтому функцию, разграничивающую семантическое пространство согласно третьему условию, естественно назвать сознанием. Отметим, что за этим понятием здесь стоит не вся психика, а лишь связанная с произвольной деятельностью её часть.

2.4. Теперь становится понятным, что семантическое пространство Осгуда, где определённым образом упорядочены все понятия, которыми оперирует человек, соответствует в нашей модели только области осознаваемого. Семантическое пространство Осгуда строится посредством соотнесения слов со шкалами, краевыми точками которых являются антонимичные пары языка, следовательно, всё содержание этого пространства вербализуемо (уже по построению). Отметим, что три выделенных Осгудом главных фактора, на которые проецируются практически все содержащиеся в языке исходные шкалы -- шкалы оценок, силы и активности, хорошо корреспондируются, соответственно с областями отождествления, рефлексии и сознания нашей модели, оставаясь, тем не менее, в рамках области осознаваемого.

3. Классификация информационных операций

Таким образом, в семантическом пространстве субъекта существует три разных барьера потенциалов, которые выделяют в нем три соответствующих взаимопересекающихся области смыслов. Прохождение любой из этих границ в одну или другую сторону меняет положение (и соответствующий потенциал) смысла. Такое действие по изменению положения смысла в семантическом пространстве назовём информационной операцией. Поскольку границ три и преодолеваться они могут либо в одну, либо в обратную сторону, то существует всего три пары (шесть) информационных операций.

Информационные операции могут иметь локальный или глобальный характер. При локальной информационной операции часть семантического пространства субъекта меняет свой потенциал настолько, что переходит через барьер, т.е. меняет конфигурацию участка границы соответствующей области. При глобальной информационной операции изменяется конфигурация всей границы определённой области вследствие общего изменения её потенциала, что связано со значительно большими изменениями субъекта.

3.1. Информационные операции, изменяющие границы области отождествленного, представляют собой аксиологический аспект информации (операции над ценностью, значимостью информации), изменяют систему ценностей субъекта. Этот аспект исследуется в рамках прагматического подхода к теории информации, где основное внимание обращается на ценность информации.

3.1.1. При вхождении в область отождествленного нового смысла (локальная информационная операция) этому смыслу придаётся значение, он становится значимым для субъекта. Этот смысл приобретает потенциал, достаточный для управления деятельностью субъекта.

3.1.2. Обратная локальная информационная операция связана с тем, что определённый смысл перестаёт быть значимым для субъекта, становится индифферентным, потенциал его значения падает, он оказывается вне этой области, за барьером. Смысл перестает быть связанным с бытием субъекта, теряет способность влиять на его восприятие и активность, выпадает из системы предпочтений субъекта.

3.1.3. Общее снижение барьера потенциалов этой области (глобальная информационная операция) приводит к тому, что её границы расширяются, вмещая смыслы, ранее считавшиеся недостаточно значимыми. В результате смягчается конфронтация, устанавливается толерантное отношение к более широкому кругу явлений.

3.1.4. Глобальная информационная операция, обратная описанной, - общее повышение барьера потенциалов области отождествленного - приводит к сужению границы этой области, к разотождествлению. При этом значительная часть смыслов теряет своё значение для субъекта, выпадая за границы его области "Я". Оставшаяся область смыслов становится всё более значимой (в силу условий нормировки), возрастает конфронтационное отношение к окружающему.

3.2. Информационные операции, изменяющие границы области отрефлексированного, представляют собой семантический аспект информации (операции над смыслом информации, её связностью), изменяют систему представлений субъекта. Этот аспект исследуется в рамках семантического подхода к теории информации, который рассматривает информацию как смысл, содержащийся в сообщении для субъекта.

3.2.1. При вхождении в область отрефлексированного нового смысла (локальная информационная операция) происходит его увязка со всем тезаурусом субъекта (осмысливание), он становится своим, внутренним, в чем субъект абсолютно уверен, на что полагается не задумываясь, не сомневаясь. Такое вхождение в тезаурус нового смысла происходит через открытие своего понимания, что является установлением связи данного смысла со смыслами тезауруса субъекта.

3.2.2. Обратная информационная операция возможна, когда теряются связи с тезаурусом и смысл становится обособленным, происходит разуверивание в нем, он ставится под сомнение, выпадает из системы верований субъекта.

3.2.3. Общее снижение барьера потенциалов области отрефлексированного приводит к снижению критичности. Субъект начинает верить в то, что раньше ему казалось сомнительным, но зато появляются обширные возможности для понимания нового.

3.2.4. Обратная глобальная информационная операция приводит к тому, что из тезауруса выпадают смыслы с меньшим потенциалом связности и остаются только жестко связанные. В этом случае повышается критичность и догматизм субъекта, его зона уверенности сужается.

3.3. Информационные операции, изменяющие границы области осознаваемого, представляют собой синтаксический аспект информации (операции со знаковой информацией), изменяют понятийный аппарат субъекта. Этот аспект исследуется в рамках синтаксического подхода к теории информации.

3.3.1. Вхождение нового смысла в область осознаваемого (локальная информационная операция) происходит благодаря его обозначению, т.е. установлению соответствия между этим смыслом и некоторым другим или другими, содержащимися в области осознаваемого, способными выступать в виде метки-знака. Такая метка является признаком или совокупностью признаков и даёт возможность замечать и удерживать во внимании соответствующий ей смысл, оперировать им, запоминать его и передавать другим. Процесс осознавания есть выражение нового имеющимися средствами. Таким образом смысл становится представленным в понятийном аппарате субъекта.

3.3.2. Обратная информационная операция возможна, когда устраняется соответствие между знаком-меткой и обозначаемым смыслом или когда сам знак-метка становится недоступным для пользования. Потенциал связи знака со смыслом может быть уменьшен до значений ниже барьера потенциалов области осознаваемого либо в случае, когда одни знак обозначает слишком много смыслов (агрегирование смыслов, сворачивание), либо когда один смысл обозначается многими разными знаками

3.3.3. Общее понижение барьера потенциалов области осознаваемого (глобальная информационная операция) приводит к "расширению" сознания за счет ранее неосознаваемых, недостаточно отчетливых ("сумеречных") смыслов. Одновременно с расширением сознания эта информационная операция приводит к снижению уровня волевого контроля за происходящим, к иррациональному поведению.

3.3.4. Обратная глобальная информационная операция - повышение барьера потенциалов области осознаваемого - приводит к повышению отчетливости сознания и уровня волевого контроля за счет перенесения за границы области осознаваемого недостаточно отчетливых смыслов и, таким образом, сужения области осознаваемого. При этом возрастает рациональная составляющая деятельности.

3.4. Отметим, что действия, изменяющие один из потенциалов смысла, но не приводящие к преодолению этим смыслом границы соответствующей области, являются составной частью определённой информационной операции (микрооперацией). Классификация таких действий для каждого вида информационных операций - предмет особого рассмотрения, хотя обычно именно такие действия называют информационными операциями.

Приведенная классификация информационных операций обладает свойством полноты, так как включает в себя все возможные типы преобразования информации. Поэтому любой информационный процесс может быть корректно представлен в виде последовательности указанных информационных операций.

4. Структура семантического пространства субъекта

Итак, любой субъект имеет свой понятийный аппарат, систему верований и систему предпочтений, а также соответствующие функции - сознание, рефлексия и самоотождествление. Сочетание этих признаков однозначно определяет субъект. Наиболее четко взаимоотношения этих понятий выявляются, если в семантическом (смысловое) пространстве (как инвариантном атрибуте любого субъекта психики) рассмотреть структуру и содержание не только трёх областей, ограничиваемых (выделяемых) соответственно самоотождествлением, сознанием и рефлексией, но и зон, которые получаются при пересечении этих областей, - структуру семантического пространства субъекта.

То, что эти три области смыслов не тождественны, ясно по определению. Более того; как правило, они и не концентричны (концентричность даже некоторых из них является весьма редким исключением). В самом деле, не всё, относящееся к области "Я", осознается или отрефлексировано, не всё осознаваемое отрефлексировано или относится к области самоотождествления и т.д. Наглядно это можно представить подобно диаграмме Венна (рис. 1), где каждая из областей изображена в виде круга и центры этих кругов не совпадают. То, что очертания областей постоянно флуктуируют и могут никогда не совпадать по форме с кругом, в данном случае не меняет сути рассматриваемых явлений, не влияет на корректность модели и на получаемые выводы. Еще два допущения - одинаковые размеры и центрально-симметричное расположение кругов - позволяют рассматривать наиболее обобщенный случай, не акцентируя внимание на индивидуальных отличиях.

Рис. 1. Структура
семантического
пространства
субъекта.

4.1. В результате пересечений областей всё пространство делится на 8 зон:

1 (центральная) - пересечение всех трёх областей - содержит отрефлексированные осознаваемые отождествляемые с "Я" смыслы - своё (внутреннее) осознанное мнение о себе (осмысленные осознаваемые специализированные знания). Наличие этой зоны является достаточным условием существования субъекта. В ней содержатся задачи, на решении которых субъект сосредоточивает своё внимание.

2 - пересечение области "Я" с областью осознаваемого за исключением отрефлексированного - внешнее (чужое) осознанное мнение о себе (неосмысленные осознаваемые специализированные знания). В этой зоне содержатся проблемы (то, что необходимо решить, но не вполне ясно как).

3 - пересечение области "Я" с областью отрефлексированного за исключением осознаваемого - своё неосознаваемое мнение о себе (осмысленные неосознаваемые специализированные знания). Эта зона содержит автоматизированный навык субъекта. Задачи решаются без привлечения сознания, т.е. процесс их решения проходит автоматически, вне сферы внимания. То, что в этой связи говорят о подсознании , относится к этой области.

4 - область "Я" за исключением пересечений с осознаваемым и отрефлексированным - внешнее неосознаваемое мнение о себе (неосмысленные неосознаваемые специализированные знания). Эта зона содержит побуждения и потребности, для реализации которых субъект не имеет готовых средств. Из них возникают проблемные ситуации.

5 - пересечение областей осознаваемого и отрефлексированного за исключением области "Я" - своё осознаваемое мнение о мире (осмысленные осознаваемые универсальные знания), мировоззрение субъекта (те знания о мире, в которых он уверен). Эта зона содержит известные возможности субъекта, тривиальные ситуации, в которых для субъекта нет необходимости действовать.

6 - область осознаваемого за исключением пересечений с областями "Я" и отрефлексированного - внешнее осознаваемое мнение о мире (неосмысленные осознаваемые универсальные знания), эрудиция субъекта.

7 - область отрефлексированного за исключением пересечений с областями "Я" и осознаваемого - своё неосознаваемое мнение о мире (осмысленные неосознаваемые универсальные знания). Эта зона содержит скрытые возможности субъекта. То, что говорят о над- или сверхсознании , относится к этой зоне.

8 - пространство, внешнее по отношению ко всем трем областям - внешнее неосознаваемое мнение о мире (неосмысленные неосознаваемые универсальные знания). Это зона непроявленных ни в каком отношения смыслов - семантический вакуум. Это реальная смысловая среда субъекта, с которой он взаимодействует помимо своей воли.

4.2. Вся деятельность субъекта отражается в указанных зонах семантического пространства. Так, если у субъекта возникают неосознаваемые побуждения или потребности, то это значит, что соответствующее смысловое образование попало в зону 4 смыслового пространства (например, из зоны 8). Если в этой зоне потенциал данного смысла (его значимость) возрастает, то соответствующая потребность занимает существенное место в деятельности субъекта, направляя её на своё удовлетворение. Если навык субъекта (зона 3) содержит готовый метод удовлетворения подобных потребностей, то данная потребность удовлетворяется автоматически (даже без осознания её существования), её потенциал снижается и соответствующий смысл покидает зону 3. Если же навык субъекта не содержит такого метода, то возросший потенциал данного смысла приводит к выходу в сознание проблемной ситуации, к осознанию проблем, т.е. указанный смысл попадает в зону 2. Здесь способность сознания к анализу реализуется в разбиении проблемы на части. Некоторые из этих частей решаются автоматически, используя подсознательный опыт, потому сознанием не замечаются, другие являются тривиальными задачами (решаются в зоне 1), а третьи, возможно, и нетривиальными (творческими) задачами. Подробно механизм решения задач (а также формирование навыка) рассмотрен автором в на материале исследований психологии творчества.

Рис. 2. Представление
семантического
пространства
субъекта
в виде булева куба
(обозначения см. в п. 4.1).

4.3. Более подробно данная модель (графическая интерпретация структуры семантического пространства) рассмотрена в , где интерпретированы оси и секторы семантического пространства субъекта. По мнению автора, этот графический образ может быть примером того, что принято называть когнитивной графикой , ведь анализ его структуры способствует познанию моделируемой (соотнесенной с этим образом) реальности.

Другим графическим представлением структуры семантического пространства субъекта может послужить булев куб (рис. 2), где трем ортогональным осям соответствуют 3 вышеназванных функции, восьми вершинам - 8 указанных зон, а шести единичным векторам - 6 возможных информационных операций.

4.4. Интересно отметить аналогию между представлением семантического пространства в виде булева куба и синсемическим кубом , особенно в части векторов (векторы синсемического куба являются частным случаем определённых выше информационных операций). Однако установить взаимно однозначное отображение вершин кубов вряд ли представляется возможным из-за различий в объекте анализа.

Более близкую аналогию представления семантического пространства в виде булева куба можно отметить с коммутативным кубом .

Г.Я. Буш использовал кубическую модель креативного пространства проблемных задач для представления типологии всех возможных научно-технических задач . Эта модель хорошо корреспондируется с представленной выше, так как является её частным случаем (креативное пространство проблемных задач содержится в семантическом пространстве субъекта).

Однозначное соответствие можно установить между содержанием зон семантического пространства и приведенной в классификацией видов информации, которая была получена из других исходных посылок.

5. Классификация информационных процессов

Информационным процессом (ИП) будем называть ненулевую последовательность информационных операций. В результате ИП определённый участок смыслового континуума попадает из одной зоны смыслового пространства субъекта в другую. Последовательность информационных операций, в результате которых участок смыслового континуума попадает в ту же самую зону (ненаправленный ИП), также следует считать ИП, поскольку в результате такого процесса структура смыслового пространства субъекта изменяется.

5.1. В отличие от информационных операций, определяемых как изменение содержания областей смыслового пространства субъекта, ИП определяются как "изменение содержания зон смыслового пространства субъекта (при этом не берется во внимание характер (локальный или глобальный) соответствующих информационных операций). Это изменение рассматривается в отношении определённого участка смыслового континуума. т.е. рассматривается, каким образом определённое смысловое образование попадает из одной зоны смыслового пространства субъекта в другую, как оно при этом трансформируется и как изменяется сам субъект.

5.1.1. ИП, в результате которых определённое смысловое образование попадает в ту же самую зону смыслового пространства субъекта, выше были названы ненаправленными. Восьми зонам смыслового пространства субъекта соответствуют 8 классов таких ИП.

5.1.2. ИП, в результате которых определённое смысловое образование перемещается через один барьер (границу области смыслового пространства субъекта) относительно своего исходного состояния, назовём однонаправленными. Таких ИП существует 24 класса (в каждую из 8 зон смыслового пространства субъекта смысл может переместиться, преодолев границу одной из трёх областей).

5.1.3. ИП, в результате которых определённое смысловое образование перемещается через два барьера относительно своего исходного состояния, назовём двунаправленными . Таких ИП существует также 24 класса (для смысла, переместившегося в любую из 8 зон смыслового пространства субъекта, осталась непреодолённой граница одной из трёх областей).

5.1.4. ИП, в результате которых определённое смысловое образование перемещается через три барьера относительно своёго исходного состояния, назовём трёхнаправленньми. Таких ИП существует 8 классов (каждая из 8 зон смыслового пространства субъекта имеет только одну "противоположную" ей зону-антипод, в которую смысл может переместиться, преодолев границы всех трёх областей).

5.2. При описании ИП важно знать не только начальное и конечное состояние (возможно только 64 варианта, т.е. всего существуют 64 класса информационных процессов), но и "маршрут" (последовательность информационных операций, посредством которых определённое смысловое образование попадает из одной зоны смыслового пространства субъекта в другую).

Далее будем рассматривать простые ИП - не содержащие взаимно противоположных информационных операций (без учета их характера: локального или глобального). Простой ИП по определению не может быть ненаправленным или содержать таковой. ИП, содержащие взаимно противоположные информационные операции, будем называть сложными и рассматривать как состоящие из нескольких простых.

5.3. Поскольку границ областей смыслового пространства субъекта всего три, простые ИП содержат максимум три информационных операции. Это значит, что для перемещения определённого смыслового образования из одной зоны смыслового пространства субъекта в любую другую достаточно не более трёх информационных операций.

Простые ИП могут состоять из одной, двух или трёх стадий. Стадии, содержащие две или три одновременно протекающие информационные операции, назовём критическими, соответственно критическими будем называть и ИП, которые содержат такие стадии (маршруты таких стадий проходят не по рёбрам булева куба (см. рис. 2), а по равнодействующим единичных векторов).

5.4. Поскольку, как было сказано, простой ИП не может быть ненаправленным, то ни один из 8 классов ненаправленных ИП не содержит простых ИП. В каждом из 24 классов однонаправленных ИП содержится один простой. В каждом из 24 классов двунаправленных ИП содержится 3 простых, один из которых критический. В каждом из 8 классов трёхнаправленных ИП содержится 13 простых, 7 из которых - критические. Таким образом, всего существует 200 простых ИП, 80 из которых - критические (120 простых некритических ИП).

5.5. Любой ИП является отражением взаимодействия субъекта со средой. Если субъект взаимодействует не просто с объектом из среды, а с другим субъектом (или субъектами), то соответствующий ИП назовём интерсубъектным. Он состоит из взаимосвязанных ИП каждого из взаимодействующих субъектов. Если в процессе взаимодействия субъектов в пересечении их областей семантического пространства образовалась общая зона 1 (см. п. 4.1), то можно говорить об образовании коллективного субъекта .

6. Когнитивные информационные процессы

В наиболее широкой трактовке когнитивным информационным процессом (КИП) считают процесс переработки информации системой, при котором она получает новую информацию, - например, процессы восприятия, памяти, мышления, изучаемые когнитивной психологией. В терминах нашей модели эти представления означают, что любое событие, приводящее к повышению потенциала участка смыслового пространства, есть КИП. Однако не всякое изменение потенциала приводит к преодолению барьера и является информационным процессом (операцией). С другой стороны, ИП, приводящие к снижению потенциала, также могут быть когнитивными. Например, опровержение представления, мнения или теории является актом познания, хотя и снижает потенциал соответствующих смыслов.

В более узком смысле когнитивными называют ИП по переработке знаний, которые проходят при участии сознания (хотя бы на отдельных этапах), т.е. содержат логические преобразования. Примерами таких процессов могут быть: принятие решений, аргументация, понимание и т.п., как они изучаются в рамках когнитивной лингвистики и искусственного интеллекта. Однако процесс познания не обязательно связан с осознанием. Во-первых, далеко не всякая осознаваемая информация является знанием (даже из доступной сознанию информации некоторая часть является знаниями других, а субъект может оперировать с ними только как с данными). Во-вторых, существуют невербализованные и даже невербализуемые знания (как это было показано, например, Майклом Полани ).

Понятие "знание" часто (например, в теории представления знаний) связывают с понятием "интенсионал". "Экстенсионал - это набор конкретных данных, заданных в декларативной форме. Интенсионал же, как правило, задает некоторую процедуру, позволяющую определять принадлежность того или иного конкретного факта к некоторому понятию. Интенсионал выделяет знания, отделяя их от данных, которые всегда задаются экстенсионально" . С другой стороны, понятие "интенсионал" связывают с понятием "смысл" . В нашей модели семантического пространства то, что субъектом осмыслено, находится в области рефлексии. Эта область содержит и невербализуемые знания.

Таким образом, познание в нашей модели может быть представлено как преодоление границы области отрефлексированных смыслов. Вхождение в эту область новых смыслов возможно посредством одного из 16 простых некритических ИП (4 однонаправленных, 8 двунаправленных и 4 трёхнаправленных). Преодоление границы этой области в другую сторону возможно посредством такого же количества простых ИП, обратных перечисленным. Следовательно, существует всего 32 простых некритических ИП, которые можно отнести к классу когнитивных.

Однако с практической точки зрения всегда больше интересуют вербализуемые знания, которые можно передавать, сохранять, извлекать и использовать, т.е. осознаваемые знания, выраженные посредством понятий, доступных субъекту. Такие знания находятся в пересечении области отрефлексированного с областью осознаваемого - с понятийным аппаратом субъекта. Рассмотрим, как отражается процесс познания на понятийном аппарате субъекта.

6.1. Допустим, что нам удалось представить понятийный аппарат в виде морфологического множества (определение см. в ), заданного посредством некоторого количества (п) двузначных признаков. Для распознавания объекта (системы, явления, процесса, ...) необходимо определение его в координатах понятийного аппарата путем выбора одного значения каждого признака. В рамках представленной морфологической модели понятийного аппарата происходит выбор одного из двух возможных значений. Выбор осуществляется по законам Аристотелевой логики (закон противоречия и закон исключенного третьего) и заканчивается нахождением требуемого варианта в рамках понятийного аппарата, если таковой может быть найден. Этот процесс обычно автоматизирован и свернут (о сворачивании мыслительных циклов см. ), т.е. выполняется подсознательно. На отсутствие искомого варианта указывает ситуация, когда нельзя сделать выбор одного значения какого-то признака. При этом возможны два случая:

1) подходят оба - и одно, и другое - значения (необходимо изменить условия выбора - снять некоторые априорные ограничения или ввести новые признаки); 2) не подходит ни первое, ни второе значение (требуется изменение формулировок признаков). В обоих случаях необходимо познание - изменение понятийного аппарата (его перепрограммирование), т.е. возникновение в системе новой информации. Аристотелева логика здесь ничем не может помочь. (Выход может быть найден либо при развитии четырехзначных логик, на что очень надеется Д.А. Поспелов , либо при использовании предложенной В. В. Налимовым логики, основанной на формуле Бейеса, интерпретированной как силлогизм .)

6.1.1. Если признаки имеют одинаковый вес, а значения могут приниматься с равной вероятностью, то с помощью такого понятийного аппарата можно описать 2 n абсолютно одинаковых независимых явлений. Субъект имеет свои пристрастия, интересы, предубеждения, заключенные в его познавательных установках. всё это отражается и на понятийном аппарате: признакам придаётся различный вес, значениям - разная вероятность, появляются структурные связи в системе понятийного аппарата. По отношению к объекту познания они выступают в качестве априорных знаний, аксиом, сужающих (как это известно из логики) возможности понятийного аппарата в описании действительности за счет уменьшения его неопределённости. Так, если все варианты в такой системе равновероятны, то для выбора одного искомого, т.е. для проведения морфологического синтеза (понятие введено В.М. Одриным, см. ) нужно п раз сделать выбор, который каждый раз делил бы объем морфологического множества пополам (энтропия n бит). Структурные связи в системе упрощают выбор, поскольку сами могут рассматриваться как предварительный выбор (с учётом этого энтропия системы, т.е. количество разнообразия, уменьшится, что можно определить по формуле Шеннона ). Разница между энтропией системосоздающих факторов и энтропией системы с учётом структурных связей показывает, сколько информации усвоила система, т.е. насколько структурные связи упрощают выбор, уменьшают неопределённость. Полная емкость такого понятийного аппарата могла бы составлять 2 n разных событии, (предметов и явлений), так как он имеет столько разных состояний, но "освоённых" состояний этого понятийного аппарата (событий, различаемых субъектом) обычно меньше на много порядков. Налицо огромная избыточность. Однако такая избыточность, при условии формирования структурных связей, повышает надежность понятийного аппарата: позволяет реагировать на события при неполной информации.

6.1.2. Одним из возможных вариантов образования связей является возникновение устойчивых сочетаний значений признаков понятийного аппарата (бинарных или большей размерности). Если определённое сочетание значений признаков встречается единственный раз (назовём его предпочтением"), то оно однозначно определяет некоторое событие. Если определённое сочетание значений признаков не встречается ни в одном из различимых событий, то имеем дело с "запрещением". Если бы определённые значения двух признаков встречались исключительно в одном сочетании (а поскольку мы рассматриваем только бинарные признаки, то и обратные значения этих признаков встречались бы в единственном варианте сочетания, и в сумме прямой и обратный варианты сочетаний встречались бы п раз), - это означало бы что два соответствующих признака являются, по сути, одним. А если бы один из вариантов сочетаний встречался п раз, то эти признаки никак не способствовали бы различению событий, так как при всех событиях они принимают одинаковые значения. Такие признаки были бы совершенно бесполезными (строго говоря, они не являются признаками, поскольку могут принимать только одно значение), а потому - излишними.

Сказанное о сочетаниях значений признаков справедливо и в отношении отдельных значений признаков.

6.1.3. Наиболее часто употребляемые (устойчивые) сочетания значений признаков могут обозначаться собственным именем, образуя понятия. Именно наименование сочетаний значений признаков позволяет оперировать с соответствующими им свойствами как с объектами, что и делает возможным такие умственные действия, как абстракция, идеализация, обобщение, сравнение, определение. Свойства, выражаемые сочетанием значений признаков, являются содержанием понятия, а события, обладающие этими свойствами, - его объемом. Содержанием понятия может быть значение одного признака.

6.1.4. Среди известных понятийному аппарату событий обычно нет ни одного, которое бы требовало для однозначного определения всех п признаков. Это следствие избыточности понятийного аппарата даёт огромное преимущество, как ни странно, в краткости описания событий, позволяя указывать только их отличительные особенности "ключевые" сочетания значений признаков. На этой основе формируются частные профессиональные языки, использующие в своей узкоспециальной области такие краткие описания. Подобные описания, по причине их краткости, очень широко распространены (не только при реальном познании, но и в обычной жизни), настолько широко, что даже при классифицировании события или объекта различают по разным основаниям, потому такие классификации, за редким исключением, некорректны и неполны.

6.1.5. Отметим, что формирование связей является функцией рефлексии, а в сознании отражаются лишь некоторые результаты, связанные с образованием или преобразованием понятий. Такое познание почти не доступно формализму сознания, невербально и имеет отношение больше к творческим, креативным процессам.

6.2. Познание, как показывает морфологическая модель понятийного аппарата субъекта, может происходить по следующим вариантам сценария: 1) новое явление отождествляется с уже известным; 2) для новых явлений отыскивается вакантная ячейка существующей морфологической классификации (новый вариант сочетания значений п- мерной матрицы понятийного аппарата; вариант, свободный как от отождествления с другими событиями, так и от априорных связей). Если подходящая вакансия не найдена, то необходимо либо 3) снять некоторые априорные ограничения, либо 4) ввести дополнительное количество (k ) признаков в понятийный аппарат, что расширяет морфологическое множество (увеличивает энтропию) понятийного аппарата. При этом первый и, частично, второй варианты являются не познанием, а, скорее, узнаванием или распознаванием, так как не вносят существенных изменений в понятийный аппарат, но прежде чем перейти к следующему сценарию познания, необходимо пройти предыдущий, более простой. Итак, познанием мы считаем не всякое распознавание или узнавание, а лишь то, которое изменяет понятийный аппарат, причем не произвольным образом, а в сторону его совершенствования.

Рассмотрим функционирование понятийного аппарата в каждом из четырех возможных сценариев познания новых событий.

6.2.1. Отождествление новых событий с известными, имеющимися в понятийном аппарате. В этом случае в рамках системы признаков данного понятийного аппарата разные события имеют одинаковую конфигурацию, один знак передаёт различные значения (многозначные понятия). Поскольку понятийный аппарат не имеет средств для их различения, то на новое событие он отреагирует как на известное. Эта реакция, конечно, оказывается неадекватной, поэтому возникает проблемная ситуация. Выход может быть найден, если, например, использовать контекст как признак, что требует усложнения понятийного аппарата (как это происходит, будет описано ниже). Обратим внимание, что контекстуальные определения достаточно распространены при реальном познании в обычной жизни.

6.2.2. Нахождение "вакантных" вариантов в понятийном аппарате для новых событий.

Здесь необходимы пояснения. Поиск "вакантных" вариантов в понятийном аппарате можно рассматривать как поиск в лабиринте возможностей. При наличии связей в системе понятийного аппарата "вакантным" можно называть вариант, свободный от запрещений и/или от предпочтений. Последнее условие важнее, поскольку требует сохранения привычных способов различения и краткого описания известных событий.

Если система помнит и использует все предпочтения и запрещения понятийного аппарата (назовём её сильносвязанной), то понятийный аппарат не содержит неопределённости, поэтому свободных вариантов (как от запрещений, так и от предпочтений) найти невозможно. Более того, в этом случае трудно найти "частные" вакансии - варианты, свободные либо от предпочтений (не нарушающие их), либо от запрещений.

Сильносвязанными системами, понятийный аппарат которых не содержит неопределённости, являются, например, формальные и формализованные теории, описывающие определённый круг явлений. Для применения этих теорий к новым явлениям (для построения более общих теорий) необходимо снятие некоторых связей (запретов), т.е. введение неопределённости в понятийный аппарат (это проанализируем ниже). Другим примером сильносвязанных систем, понятийный аппарат которых не содержит неопределённости, может быть описанная антропологами (см., например, ) особенность системы верований аборигенов диких племен, для которых нет ничего неизвестного, для любого события находится объяснение (по первому сценарию познания), поэтому чувство удивления им вовсе незнакомо.

Однако система может использовать не все возможности понятийного аппарата: может не помнить всех запрещений и пользоваться не всеми предпочтениями для различения известных событий. Потенциально возможная связь может не быть актуализированной или вообще не содержаться в понятийном аппарате, который в силу этого содержит некоторую неопределённость, позволяющую отыскать вакансию по предпочтениям для некоторого возможного события.

6.2.3. Снятие связей в понятийном аппарате (актуализированных предпочтений или запрещений) увеличивает неопределённость понятийного аппарата и делает возможным вмещение им (т.е. познание и описание) новых событий. Предыдущий пример поясняет механизм включения новых событий как при отсутствии связей, так и при их снятии. Но если предыдущий сценарий восприятия нового сводится к простому добавлению нового события (познание как коллекционирование, собирание фактов), то в данном случае для познания нового необходимо отказаться от части старых установок (новое знание частично опровергает и дополняет старое). В этом наглядно проявляется различие между данными и знаниями.

6.2.4. Введение новых признаков для восприятия новых событий. В этом случае снимаются проблемные ситуации, подобные описанным в первом сценарии познания. Но неопределённость понятийного аппарата значительно возрастает и требуется переопределение всех известных событий. С увеличением размерности понятийного аппарата связи должны увеличивать свою размерность, хотя возможны и отдельные исключения. Такие изменения в понятийном аппарате носят революционный характер.

При этом понятийный аппарат увеличивает свою емкость. Такое увеличение емкости понятийного аппарата требует его переструктурирования не только и не столько в связи с введением в ней новых событий, но, главным образом, потому, что и известные события приобрели дополнительно новые конфигурации, одно значение стало передаваться разными синонимичными знаками. Это позволяет вводить различия между многозначными понятиями, разрешая таким образом проблемные ситуации при первом сценарии познания. Синонимичность можно рассматривать как еще один вид связи, уменьшающий неопределённость понятийного аппарата.

6.3. Итак, можно сказать, что рассмотренная морфологическая модель понятийного аппарата адекватно и полно отображает феномены и механизм процесса вербального познания.

Выводы

Представленное здесь исследование ИП занимает промежуточное место между словесным содержательным анализом их структуры, свойств и разновидностей и формальными исследованиями. Это, с одной стороны, позволяет сохранить наглядность и простоту интерпретации, а с другой, - дает возможность, опираясь на адекватные модели информационной деятельности субъекта, получать описания не только известных но и всех возможных ИП.

Полученные результаты представляются полезными для разработки новых информационных технологий. На основании представленных моделей могут быть рассмотрены аспекты взаимодействия человека и информационных систем, что особенно актуально при разработке когнитивных и креативных интеллектуальных систем , например систем поддержки постановки и решения научных и технических проблем или систем компьютерного обучения.

Литература

  1. Одрин В.М. Метод морфологического анализа технических систем. - М.: ВНИИПИ, 1989. - 311 с.
  2. Философский энциклопедический словарь / Ред-кол: С. С. Аверинцев, Э.А- Араб-Оглы, Л.Ф. Ильичев и др. - М.: Сов. энциклопедия, 1989. - 815с.
  3. Краткий психологический словарь / Сост. Л.А- Карпенко; Под общ. ред. А.В. Петровского, М.Г Ярошевского. - М.: Политиздат, 1985. - 43 с.
  4. Налимов В.В. Дрогалина Ж.А. Вероятностная модель бессознательного. Бессознательное как проявление семантической Вселенной // Психологический журнал. - 1984. - 5. № 6. - С. 111-112.
  5. Налимов В.В., Дрогалина Ж.А. Как возможно построение модели бессознательного // Бессознательное, т.4. - Тбилиси: Мецниереба, 1985. - С. 185-198.
  6. Налимов В.В. Спонтанность сознания. Вероятностная теория смыслов и смысловая архитектоника личности. - М.: Прометей, 1989. - 287 с.
  7. Налимов В.В. Реальность нереального. Вероятностная модель бессознательного. - М.: Мир идей. 1995. - 432 с.
  8. Osgood Сh. Тhе Reргеsеntаtional Моdel and Rеlе-vant Research Methods // Trends in Сопtеnt Analysis / Рооl I de S. Urbana, 1959.
  9. Мельников Г.П. Системология и языковые аспекты кибернетики / Под ред. Ю.Г. Косарева. - М.: Сов. радио, 1978. - 368 с.
  10. Кон И.С. В поисках себя: личность и её самосознание. - М.: Политиздат, 1984. - 335 с.
  11. Гладун В.П. Методы формирования знаний о предметных областях, ситуациях и проблемах // Вопросы когнитивно-информационной поддержки постановки и решения новых научных проблем: Сб. науч. тр. - Киев, Ин-т кибернетики НАН Украины. -1995. - С. 32-35.
  12. Павиленис Р.И. Проблема смысла: современный логико-философский анализ языка. - М.: Мысль, 1983.-286с.
  13. Дружинин В.В., Конторов Д.С. Системотехника. - М: Радио и связь, 1989. - 200 с.
  14. Симонов П.В. О двух разновидностях неосознаваемого психического: под- и сверхсознании // Бессознательное, т.4. - Тбилиси: Мецниереба, 1985.-С. 149-159.
  15. Шередеко Ю.Л. Психологический механизм решения задач // Вопросы когнитивно-ииформационной поддержки постановки и решения новых научных проблем: Сб. науч. тр. - Киев, Ин-т кибернетики НАН Украины. -1995. - С. 147-158.
  16. Шередеко ЮЛ. Структурная модель семантического пространства субъекта // Сб. статей 1-й Ме-ждунар. науч.-практ. конф. "Математика и психология в педагогической системе "технический университет"" -Одесса: ОГПУ, 1996. -- С. 37-38.
  17. Valkman Y. Definition of Соgnitive Graphics and its Methods // Information Theories & Applications. - Sofia, 1994. - 2, № 1 - Р. 30-36.
  18. Бургин М.С. Фундаментальные структуры Ноосферы. Достижение Абсолюта. - Киев: Украинская Академия Информатики, 1997. - 96 с.
  19. Буш Г.Я. Проблемные задачи и регулятивы поиска их решения. Уч. пособие. - М.: ВНИИПИ, 1989. -92с.
  20. Дашкиев Г.Н. Типы информации и информационные процессы в обществе // Вопросы когнитивно-информационной поддержки постановки и решения новых научных проблем: Сб. науч. тр. - Киев, Ин-т кибернетики НАН Украины. -1995 - С. 84-95.
  21. Полани М. Личностное знание. На пути к посткритической философии. - М.: Прогресс, 1985. - 344 с.
  22. Поспелов Д.А Ситуационное управление: теория и практика. - М.: Наука, 1986. - 282 с.
  23. Шеннон К. Математическая теория связи // Работы по теории информации и кибернетике. - М.: Изд-во иностранной литературы, 1963. - С. 243-332.
  24. Голицин ГА., Петров В.М. Гармония и алгебра живого. - М.: Знание, 1990. - 128 с.
  25. Леви-Строс К. Структурная антропология. - М.: Наука, 1985. - 536 с.
  26. Палагин А.В. К проблеме проектирования системы активизации научно-исследовательской деятельности // Вопросы когнитивно-информационной поддержки постановки и решения новых научных проблем: Сб. науч. тр. - Киев, Ин-т кибернетики НАН Украины. -1995. - С. 4-16.

Конец статьи


Информационно-поисковые языки: Искусственная знаковая система, предназначенная для описания (путем индексирования) основного смыслового содержания текстов документов или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации.






Фонетический уровень Это алфавит языка. Список используемых элементарных символов (символы естественного языка): кириллица, латинский алфавит арабские и римские цифры знаки пунктуации спец. символы # & * и т.п.)


Лексический уровень Словарный запас – совокупность всех употребляемых в ИПЯ лексических единиц. Лексическая единица – наименьшая осмысленная последовательность элементарных символов (знаков), задаваемая при конструировании отдельных слов языка. Лексические единицы образуют лексику языка. Систематизируют лексические единицы парадигматические отношения.


Парадигматические отношения (аналитические) Это внетекстовые, объективно существующие смысловые отношения между лексическими единицами, которые устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска. Учитывают сходство и различие в объеме и содержании лексических единиц (понятий).


Объем– множество предметов, отображаемых в данном понятии. Количество предметов, входящих в объем может быть: Фиксированным (конечным) Бесконечным Единичным Содержание – отраженная в сознании совокупность свойств, присущих каждому предмету, входящему в объем понятия.






Сильные парадигматические отношения: Эквивалентности (равнозначности) – отношения между понятиями, объемы которых совпадают, но в содержании имеются различия. Подчинения – отношения между понятиями, когда объем одного или нескольких понятий входит в объем другого. Род Вид Соподчинения – отношения между видовыми понятиями, в равной степени подчиненными одному родовому.


Сильные парадигматические отношения: Перекрещивания – отношения между понятиями, содержание которых различно, но объемы часто совпадают. Противоположности – отношения между соподчиненными понятиями, которые в своем содержании имеют несовместимые признаки, обуславливающие несовпадение объемов. Противоречия (контрадикторности) – отношения между соподчиненными понятиями, видовые признаки которых несовместимы, что обуславливает несовпадение объемов этих понятий. Исключают друг друга.


Слабые парадигматические отношения: Выражают связи не между понятиями, а между самими предметами (технологические, причинно-следственные, системно-элементные и т.д.). Целое – часть Система – элемент Причина – следствие (отношения детерминации) Процесс – оборудование Процесс – материал




Синтаксический уровень Синтагматические отношения (синтаксические, грамматические, текстуальные) – отношения устанавливающие правила образования и правила интерпретации ИПЯ. Правила образования устанавливают какие комбинации элементарных символов допускаются при построении слов и выражений. Правила интерпретации – как надлежит понимать эти слова и выражения.




Характеристики ИПЯ Семантическая сила – возможность передавать полно и точно содержание сообщений. Простота лексики и грамматики. При разработке ИПЯ учитываются: Специфика отрасли или предмета Особенности текстов, образующих поисковый массив Характер информационных запросов




Типы и виды ИПЯ В основу классификации положены три видообразующих признака, учитывающих структурные элементы языка: лексику, парадигматику и синтагматику. К этим признакам относится: Способ задания лексических единиц. Способ координации (сочетания) лексических единиц. Способ учета парадигматических отношений.


По способу задания лексических единиц Контролируемые Неконтролируемые Контролируемые ИПЯ – лексика задается заранее с помощью словарей и таблиц. ББК – библиотечно-библиографическая классификация. УДК – унифицированная десятичная классификация. Неконтролируемые ИПЯ – лексика задается на основе выбора неограниченного множества терминов естественного языка из индексируемых сообщений.


По способу координации лексических единиц Некоординируемые Координируемые Некоординируемые ИПЯ – языки, не допускающие координации лексических единиц ни в процессе индексирования, ни в процессе поиска. Координируемые ИПЯ – языки, лексические единицы которых координируются либо в процессе индексирования, либо в процессе поиска. Предкоординируемые – устанавливают порядок записи лексических единиц в процессе индексирования по заранее оговоренным правилам и предусматривается их жесткая последовательность. Посткоординируемые – лексические единицы задаются в процессе индексирования и сочетаются между собой только в процессе поиска. Языки иерархической структуры Представляют систему классов, по которым распределяются понятия на основании наиболее существенных признаков, присущих этим понятиям и отличающих их друг от друга. Класс – совокупность объектов, имеющих один или несколько общих содержательных признаков. Недостаток: невозможность организации вне иерархических связей.


Языки иерархической структуры 1. Документы 1.1 Иконические 1.2 Идеографические 1.3 Текстовые Первичные Неопубликованные Опубликованные Вторичные

Семное варьирование значения представляет собой приспособление значения-компетенции к коммуникативным условиям конкретного речевого акта, выражающееся в образовании тех или иных актуальных смыслов. Коммуникативная задача конкретного речевого акта определяет набор сем, подлежащих актуализации, т.е. «избирательную актуализацию семантических признаков значения» (Шмелев, 1983, с. 34; см. также: Бергельсон, Кибрик, 1981, с. 343; Брудный, 1972, с. 214; Солганик, 1981, с. 72; Языковая номинация. Виды наименований, 1977, с. 136 и др.).

Семное варьирование осуществляется на уровне отдельного значения (семемы), связано с выбором семантических компонентов, подлежащих актуализации в связи с определенной коммуникативной задачей и осуществляется посредством ряда семантических процессов, действующих в семеме на уровне отдельных сем. Рассмотрим эти процессы.

Актуализация семы есть коммуникативно обусловленное выделение семы в структуре значения, приводящее к восприятию ее участниками акта общения как коммуникативно релевантной, входящей в актуальный смысл слова. Актуализироваться может любая сема из структуры значения, как ядерная, так и периферийная. Те семы, которые не вошли в актуальный смысл слава, остаются неактуализован-ными. Иногда в таком случае говорят о погашении семы. Представляется, однако, что с точки зрения коммуникативного анализа значения особого процесса (Погашения сем выделить нельзя – коммуникативно нерелевантная сема лрос-то «игнорируется» в речевом акте, т.е. не актуализируется. В значении-компетенции (вне речевого акта) все семы не актуализованы, т.е. все они в равной мере погашены, и поэтому при актуализации одних семантических компонентов другие, коммуникативно нерелевантные, не нуждаются в каком-либо особом механизме погашения сем. Психофизиологической основой актуализации семы является возбуждение тех нейронных ансамблей коры головного мозга, которые кодируют информацию, отражаемую данной семой. Соответствующая сема не актуализируется, если не возбужден соответствующий нейронный участок. Проиллюстрируем, актуализацию разных сем в составе значения на примере употребления слова иголка.



Дай мне иголку, мне надо пришить пуговицу. Актуализируются семы «заостренный металлический стержень с ушком для вдевания нити, употребляемый для шитья».

Черный металл – это иголка и сковородка, плуг и локомотив (В. Чивилихин. Память). Актуализированы семы «предмет быта, первой необходимости».

Ночная молния вспыхнет, и все как на ладони. Иголку, и ту видно (Г. Марков. Моя военная нора). Актуализованы семы «небольшой предмет».

Смотрите, ваш ребенок схватил иголку! Актуальный смысл – «предмет, представляющий опасность, способный причинить боль».

В этот зазор даже иголка не пройдет. Актуализованы семы «тонкий, заостренный предмет».

Актуализация семы может быть осложнена одновременной актуализацией одноименной переносной семемы. Это явление мы обозначаем как процесс двойной актуализации семы, заключающийся в том, что сема, которая в языке одновременно выступает и как самостоятельная семема, может при своей актуализации вовлечь за собой актуализацию переносной семемы, сохраняющей с ней живую связь. Например, в значении слова бритва содержится яркая сильнове-роятностная сема «острая». В предложении «Не девка, а форменная бритва» (Ю. Семенов. ТАСС уполномочен заявить) – об острой на язык, язвительной девушке – актуализируется сема «острая», которая в свою очередь актуализирует переносное значение прилагательного «острый» – «остроумная, язвительная», что и составляет актуальный смысл слова бритва в данном коммуникативном акте. Таким образом, актуализованная сема одновременно осознается и как компонент значения коммуникативно реализуемого слова, и как переносное значение другой, не присутствующей в коммуникативном акте единицы.

Приведем еще примеры двойной актуализации сем: кремень-человек – актуализируется сема «твердый» и переносная семема «сильный, решительный»; аналогично – гранит, а не человек; воск, а не хорунжий – актуализована сема «мягкий» и переносная семема «кроткий, уступчивый, поддающийся воздействию»; скала-вратарь – актуализована сема «твердый» и переносное значение «надежный, устойчивый»; облачко грусти – актуализована сема «легкий» и переносная семема «слабый, незначительный, небольшой»; ты льдина, сосулька – актуализована сема «холодный» и переносная семема «равнодушный, бесстрастный» и т.д.

Иногда наблюдается двойная актуализация семы и содержания устойчивого словосочетания или фразеологизма. Например, Ну, ты снайпер! (о быстро догадавшемся человеке): актуализируется сема «точность попадания», которая актуализирует значение фразеологизма «попасть в точку». Слова некоторых тематических групп имеют тенденцию к двойной актуализации определенных сем. Так, наименования сладостей (пирожное, бисквит, конфета, персик и др.) часто используются в актуальном смысле «сладкий», актуализирующем переносную семему «приятный; доставляющий удовольствие» или семему «приторно-нежный, умильный»; наименования твердых предметов (камень, кремень, скала, металл и др.) часто актуализируют сему «твердый» и переносные семемы «надежный» или «решительный» и др.

Усиление семы представляет собой изменение яркости семы в сторону ее повышения. Оно приводит к тому, что та или иная сема в структуре актуализованного значения оказывается ярче по сравнению с другими семами, чем по отношению к ним же в структуре значения-компетенции. Ослабление семы представляет собой изменение яркости семы в сторону ее уменьшения. При формировании актуального смысла в коммуникативном акте усиление яркости одних сем автоматически ведет к ослаблению других, тоже актуализованных, так как на фоне более ярких сем они проигрывают, становятся менее заметными. На возможность подобного явления указывал W. Schmidt (1965, с. 54): «актуализованное значение слова не является монолитным, оно разложимо на элементы, одни из которых в условиях конкретного контекста усиливаются, доминируют, другие – отступают на задний план, могут исчезать и заменяться новыми».

На возможность различной по яркости актуализации отдельных семантических компонентов обращает внимание и Э.В. Кузнецова. Она приводит конкретные примеры изменения яркости сем в различных контекстах употребления слова: «в разных контекстах одно и то же слово с одним и тем же, судя по словарю, значением, может быть содержательно не вполне адекватным. Возьмем для иллюстрации этого положения глагол вытащить, значение которого определяется в словаре следующим образом: «Таща, извлечь, удалить откуда-либо; таща, вывести, вынести»... Во фразах, приведенных в качестве словарных иллюстраций, глагол вытащить осмысляется неоднозначно. Ср.: «Его [Дубенко] сонного вытащили из кузова и уложили на землю» (А. Попов). В этой фразе акцентируется признак «перемещение», смысл глагола вытащить ближе всего к значению глагола вынести. Так же осмысляется этот глагол и во фразе: «Были такие силачи, что могли вытащить на берег затонувшую лодку с водой» (Скиталец). В других фразах, например, «Иван Ильич вытащил из автомобиля кожаные плащи и погребец с провизией» (А. Толстой), в глаголе вытащить сильнее проявляются признаки «доетавания», «взятия», нежели признак «перемещения» (Кузнецова, 1980, с. 11).

Приведем еще пример коммуникативного изменения яркости сем. Значение слова штукатур – «рабочий, специалист по штукатурке».

Штукатуры приступили к отделке помещения. В актуальном смысле слова штукатур сема «специалист по штукатурке» выступает как наиболее яркая, а сема «рабочий» – как более слабая.

Придет, поработает, допустим, штукатуром, короткое время пройдет, смотришь, а он уже сидит в кабинете с вывеской (В. Кожевников. Там, где нет ни пыли, ни мух). В данном предложении сема «рабочий» усилена, сема «специалист по штукатурке» ослаблена; актуализована также периферийная сема «рядовая должность».

Могут быть ослаблены все яркие семы значения, как ядерные, так и периферийные, что приводит к образованию нечеткого актуального смысла. В этих случаях все актуали-зованные семы выступают одинаково неяркими, что и создает нечеткость актуального смысла, например слово инженер в конструкции типа «Инженер – не чиновник». Отметим, что само явление актуализации предполагает, что актуализованная сема обладает известной яркостью, в этом – сущность явления актуализации. Однако яркость актуализованных сем, как травило, различна, и в рамках актуального смысла слова всегда можно выделить более и менее яркие семантические компоненты.

Еще одним семным процессом при коммуникатизации значения является расщепление сем, под которым понимается неполная актуализация семы, т.е. актуализация в коммуникативном акте лишь части семы. Расщепляются эксплицитные семы; при этом часть эксплицитной семы, актуализирующаяся в коммуникативном акте, оказывается одной из скрытых сем данной эксплицитной семы. Это означает, что расщепление эксплицитной семы фактически представляет собой актуализацию одной из скрытых в ней сем. Но так как при коммуникативном описании значения мы всегда имеем дело с уровнем рассмотрения семемы, на котором семантические компоненты представлены как эксплицитные, мы и говорим о расщеплении сем.

Расщепление сем – семантический процесс, характерный для переносного употребления слова и не встречающийся при прямом употреблении. Наиболее часто расщепляются семы, содержащие в качестве скрытых компоненты, выражающие количественную и качественную оценку какого-либо объекта, при этом редуцируется компонент, указывающий на объект. Например (в скобках приводятся редуцированные, т.е. не актуализованные компоненты расщепленной эксплицитной семы): лавина мероприятий – обилие (снега), с бороной ребятишек – многочисленность (зубьев), муравейник эфира – многочисленность (муравьев), половодье зелени – обилие (воды), табун, стая, стадо – многочисленность (животных), дрожжи – вызывают увеличение, рост (теста), спринтер – быстрота (бега) и др. Нередко расщепляются семы, содержащие скрытую сему «часть», «элемент», «компонент» и др.: кирпичики памяти – элемент (здания), головной мозг корабля – основная часть управления (человеком), тылы книгохранилища – участок (расположения войск), гарнир – дополнительная часть (обеда) и др. Расщепляются семы, содержащие скрытый фазисный компонент: обрыв знаний – конец (ровной поверхности), финиш жизни – этап (соревнований) и др. При расщеплении эксплицитной семы всегда актуализируется та ее часть, которая имеет более обобщенный характер, семантический же объект чаще всего подвергается редукции.

Следующим семантическим процессом является модификация сем, которая заключается в контекстуальном переосмыслении содержания семного конкретизатора в рамках того или иного семантического признака. Как отмечал В. Скаличка, «любую или почти любую сему можно употребить в различном смысле» (1967, с. 143). Модификация семы бывает двух видов – смысловая, представляющая собой изменение содержания семы в коммуникативном акте, и модальная – придание семе модальной окраски. Рассмотрим сначала смысловую модификацию.

Семный конкретизатор, уточняющий тот или иной семантический признак в определенной семе, парадигматически противостоит другим семным конкретизаторам с этим же семантическим признаком. Например, семные конкретизаторы «большой», «маленький», «огромный» противостоят друг другу в рампах семантического признака «размер», семные конкретизаторы «юный», «взрослый», «молодой», «старый» противопоставлены друг другу по семантическому признаку «возраст» и т.д. Разумеется, противопоставленность сем осуществляется через противопоставленность слов, содержащих эти семы в системе языка. Каждый семный конкретизатор в подобной парадигме несет свой собственный семантический груз, очерчивает свою денотативную область. В определенных коммуникативных условиях та или иная сема, а точнее, тот или иной семный конкретизатор, может подвергнуться речевой модификации, т.е. переосмыслению. Сравним два примера:

А колхозное дело такое молодое, и страшно необходимое. Все должны быть за нас. И старушки, и женщины (М. Шолохов. Поднятая целина); Из темноты проступали лица девушек и женщин (Там же).

Семантический признак «возраст» в значении слова женщина представлен семой «взрослая», однако в первом примере эта сема осмысляется как «не старая», а во втором – как «не очень молодая». Следовательно, сема «взрослая» модифицируется в данных контекстах. Подчеркнем, что сама сема «взрослая» в значении слова женщина ни в первом, ни во втором случае не исчезает, а лишь выступает в модифицированном виде, приспособленном к условиям коммуникативного акта.

Как указывалось выше, семные конкретизаторы нечетких сем обладают абсолютным содержанием и значимостью. Необходимо разграничивать модификацию значимости семы в акте речи и актуализацию системных значимостеи таких сем.

Семные конкретизаторы нечетких сем могут иметь как абсолютное содержание, так и значимость, или обладать только значимостью и не иметь абсолютного содержания. Значимость семното конкретизатора, как отмечалось, возникает как следствие системной парадигматической ранжировки семных конкретизаторов по тому или иному семантическому признаку. К примеру, семантический признак «возраст» в значении слова женщина представлен семой «взрослая», содержащей полный семный коикретизатор: абсолютное содержание – «взрослая», значимость – «старше девочки, девушки, ребенка, младше старика, старухи и т.д.». А вот семантический признак «вес» в значении слова мальчик представлен семой с неполным семным конкретизатором: кроме самого семантического признака «вес», эта сема содержит только значимость по данному признаку – «больше младенца, портфеля, рыбы, книги, меньше мужчины, машины и т.д.»; абсолютного содержания семный коикретизатор в данном значении не имеет, нет компонента типа «тяжелый» или «легкий». При отсутствии как абсолютного содержания, так и значимости мы имеем дело с автономным семантическим признаком, например признак «возраст» в значении слова человек.

Абсолютное содержание конкретизатора нечеткой семы определяется только в рамках его собственной тематической группы, к примеру, размер или вес животного определяется только относительно других животных, возраст людей – относительно других людей, эффективность инструментов – относительно инструментов и т.д. Относительная же значимость семных конкретизаторов определяется в пределах всей парадигмы слова по данному семантическому признаку, включающей слова всех тематических групп, для единиц которых характерен данный семантический признак. Например, относительная значимость семного конкретизатора «дорогостоящий» в значении слова «Жигули» будет включать характеристику дороговизны «Жигулей» как но отношению к другим личным транспортным средствам («дешевле «Волги», дороже "мотоцикла, «Запорожца» и др.»), так и относительно других.предметов потребления («дороже пальто, книг, обуви, радиоприемника, дешевле бриллиантов, дома и др.»). Пр,и наличии в семе полного семного конкретизатора возможна актуализация его абсолютного содержания и значимости по отдельности. В следующем примере актуализова-но абсолютное содержание семы «дорогостоящий»:

Материально живем неплохо. Купили «Запорожец». Дочкой в школе довольны (Известия, 1981, 7 июля); Мать с отцом, всю жизнь проработавшие в поле, на ферме, в состоянии не только прокормить дитё, но и купить ему «Жигули» (Коммуна, 1981, 26 дек.).

Если же в коммуникативном акте возникает необходимость противопоставить значения по значимостям в рамках одного и того же семантического признака, то возможна актуализация только значимости:

Тут ни одной не было «Волги», но и ни одного «Москвича» или «Запорожца», тут царили только «Жигули». ...Деньги были, да, деньги у них были, но положение обязывало их не прыгать выше «Жигулей». Это все были торговые боссы из небольших магазинов, умный все народ, не вылезавший и не бахвалившийся тем, что имел (Л. Карелин. Змеелов). В данном примере в наименованиях автомобилей актуализованы значимости семы «дорогостоящий», а абсолютное содержание семного конкретизатора не актуализовано.

При актуализации сем с неполным семным конкретизатором обязательно необходим дифференцирующий контекст, как правило – вербальное противопоставление слов, обеспечивающих актуализацию конкретной значимости семы. Например: Тут не то что технике – бойцу не укрыться. В значении слова боец семный конкретизатор семантического признака «габариты» является неполным: абсолютная значимость отсутствует (боец – и не крупный, и не маленький, но значимость есть: «больше автомата, вещмешка и т.д., меньше пушки, танка, дзота и т.д.»). Конкретный дифференцирующий контекст обеспечил актуализацию именно данного компонента значимости – «меньше военной техники».

Наличие в семных ко.нкретизаторах сем относительной значимости ка.к реального семантического явления и возможность актуализации этой значимости в коммуникативном акте позволяют адекватно понимать многочисленные выражения типа Карась величиной с лопату (т.е. большой), Карась величиной с полтинник (т.е. маленький): в этих случаях актуализируется значимость семы с семантическим признаком «размер»; аналогично: кулаки с пудовые гири, кулаки как чайники, снежинка с ладонь, собака размером с кошку и др.

Значимости сем отражают реальные отношения предметом внешнего мира по определенным признакам и входят в языковую компетенцию носителей языка, отражаясь в семантике слов. Значимость несет дифференциальную информацию, но она содержательна, представляет собой реальный семантический компонент, хотя и выделяющийся в структуре значения только в пределах той или иной семы.

Дифференцирующий контекст, где эксплицитно выражены единицы, оппозиция которых создает ту или иную значимость, является обязательным условием актуализации данной значимости в коммуникативном акте и может служить формальным показателем актуализации значимости в том или ином контексте. При этом дифференцирующий контекст является необходимым независимо от того, актуализируется значимость неполного или полного семного конкретизатора. Разграничение модификации сем и актуализации значимости семы должно проводиться с учетом того, есть ли в данной семе абсолютное содержание у конкретизатора или только значимость. Модификации могут подвергаться только семы с полным семным конкретизатором, так как модифицируется всегда некоторое конкретное абсолютное содержание; если же абсолютное содержание у семного конкретизатора отсутствует, то о его модификации не может быть и речи – возможна только актуализация значимости. Если же актуализируется сема с полным семным конкретизатором, то абсолютное содержание может быть актуализовано в двух вариантах – с модификацией и без модификации.

При модификации конкретное содержание модифицированной семы описывается или допускает описание при помощи таких единиц метаязыка, как: «слишком, достаточно, недостаточно, очень, не очень, сравнительно, относительно и т.д. ... в данной ситуации» (в других ситуациях будет возможна другая оценка, другое осмысление данного признака).

Выше речь шла о смысловой модификации сем, заключающейся в изменении ее содержания. Второй тип модификации – модальная модификация, которая заключается в том, что в коммуникативном акте определенные семы приобретают модальную окраску, передаваемую в описании такими единицами метаязыка, как: должен, может, обязан, возможно и др. Например:

Как ты можешь так равнодушно относиться к сыну? Ты же отец! Сема «проявление заботы» модифицируется в «должен, обязан заботиться».

Маша заболела. – Ну, это не страшно, она ведь живет с матерью. Сема «забота о детях» модифицируется в «может позаботиться».

Модальной модификации подвергаются преимущественно диспозициональные, вероятностные семы.

Следующий рассматриваемый семантический процесс – конкрети за ц и я семы. Сема всегда представляет собой определенную абстракцию. Семы достаточно высокой степени абстракции представлены в коммуникативных актах в виде семных вариаций. По аналогии с фонетикой семные вариации можно назвать аллосемами. Аллосемы – это конкретные вариации семы, обусловленные коммуникативным намерением говорящего и воплощенные в конкретном лексическом значении. Они представлены в коммуникативном акте в семантике конкретных лексических единиц, и выбор той или иной единицы, содержащей аллосему, относится к сфере конкретизации коммуникативного намерения говорящего. Одна и та же сема может "быть представлена в речевом акте разными аллосемами. Так, сема «препятствие для деятельности людей» в разных коммуникативных ситуациях может выявиться в аллосемах «препятствует жизни, работе» (ремонт), «препятствует полетам самолетов» (туман), «препятствует обработке почвы» (ямы, кусты, овраги), «препятствует перемещению» (болота, джунгли) и т.д.

Сема «способность к перенесению трудностей» реализуется в виде аллосем «перенесение тяжелого физического труда», «способность к длительной изнурительной работе», «приспособленность к тяжелым климатическим условиям», «физическая сила», «способность нести большой груз» и др. Сема «наличие технических знаний» может выступать в виде аллосем «способность починить технику», «умение завести мотор», «умение обращаться с бытовыми приборами» и т.д. Семы низкой степени абстракции выступают, как правило, только в виде одной вариации (ср.: «одноместность», «четы-рехколесность», «наличие спинки» и др.).

Описание сем, имеющих единственную аллосему, не вызывает трудности, так как не содержит альтернативы. При наличии у семы нескольких аллосем встает вопрос о том, описывать ли непосредственно аллосему или ту сему, вариацией которой данная сема выступает. Описание значения как факта языковой компетенции диктует выбор в пользу семы, лотому что этим достигается более высокий уровень обобщения, что необходимо для описания системного значения слова.

Конкретизация семы в коммуникативном акте, таким образом, заключается в обусловленном коммуникативной задачей говорящего переходе от абстрактной семы к конкретной аллосеме в составе значения слова, т.е. в коммуникативном воплощении абстрактной семы в конкретной аллосеме. Конкретизация семы – процесс, сопровождающий ее актуализацию, но происходит он только с теми семами, которые имеют достаточно высокий уровень абстрактности, так как конкретные семы в конкретизации не нуждаются.

Поддержание семы – процесс, выражающийся в вербальной экспликации актуализируемой семы в коммуникативном акте. Эта экспликация выступает как средство контекстуального усиления семы и заключается в использовании в коммуникативном акте слова или словосочетания, эквивалентного отдельной актуализируемой семе или всему актуальному смыслу слова в целом. Экспликация может осуществляться как в микроконтексте (предложении), так и в макроконтексте (тексте в целом). В структурном отношении экспликация может быть как препозитивной, так и постпозитивной, в содержательном отношении – буквально эквивалентной актуальному смыслу слова или требовать перифраза. Например:

Хотелось мне быть храбрым, хладнокровным, одним словом, мужчиной (А. Генатулин. Атака). Поддерживаются семы «храбрый», «хладнокровный», экспликация носит буквальный характер.

– Мама всегда говорила, что ты трудный мальчишка. – Мальчишка! Я мужик теперь! Понимаешь, мужик! Я видел столько за эти месяцы, чего за сто лет не увидишь! (В. Кондратьев. Отпуск по ранению). Поддерживается сема «зрелый», «опытный», экспликация требует перифраза.

Взяли-таки с собой и «дегтярева», и автоматы. У меня и даже у всех ездовых новенькие ППШ и ППС. В случае чего море огня (А. Щербань. Варшавское шоссе). Поддерживается сема «большая огневая мощь», экспликация требует перифраза.

[Начальник охраны заповедника не пропускает с ружьем через территорию заповедника] – Так соболь же, валюта, – тянул начальник охраны. – С нас тоже требуют... (В. Чивилихин. Серебряные рельсы). Поддерживает семы «высокая ценность», экспликация "буквальна («валюта»).

Предлагаемая нами трактовка экспликации отличается от трактовки этого термина М.В. Никитиным, который под экспликацией понимает в широком смысле слова отражение в языке отношений вещи и признака – тигр-хищник, Москва есть Москва, гром гремит, снег белый, дом пустой и др. (1974, с. 209). В нашей интерпретации экспликация представляет собой вербальное дублирование актуализованных сем в акте речи. По мнению Е.И. Шейгал, придерживающейся близкой нам точки зрения, экспликация семантического компонента может осуществляться в целях подчеркивания, уточнения и квалификации компонента в речевой ситуации, а также для обеспечения связности текста (1981, с. 37). Особенно необходима поддержка экспликацией слабым периферийным семам, так как без нее эти семы зачастую требуют очень громоздкого контекста или вообще не могут актуализироваться и не будут понятны в акте речи. Например: Лошади – не коровы. Сена клок бросил, напоил и все (Ф. Абрамов. Дом). Поддерживается актуализация периферийной семы «нетребовательность к пище». Обязательность экспликации семы при ее актуализации свидетельствует о ее слабости и периферийном характере.

Категоризация значения заключается в коммуникативно обусловленном выборе архисемы для актуализованного значения. В коммуникативном акте осуществляется категоризация предмета, которая отражается в выборе лексической единицы как средства номинации, а также в выборе архисемы в ее значении. Архисема выделяется как результат мыслительной операции категоризации, в результате чего значение относится,к определенному классу. Архисема выбирается из открытого ряда архисем, отложившихся в значении в результате прошлого опыта категоризации. Эти семы отражают различные уровни абстракций, на которых может осуществляться категоризация и выбор уровня (а, соответственно, и архисемы для значения) обусловлен коммуникативной ситуацией. Архисема выбирается в акте речи, но это не значит, что она наводится контекстом: архисема является внутренне присущим семантическим компонентом слова, выводимым из других компонентов в результате мыслительной операции, а не привносимым в значение со стороны.

Наведение семы – процесс коммуникативного внесения семы в значение. Наводятся семы, отсутствующие в системном значении слова. Наведенные семы относятся к разряду окказиональных. На возможность контекстуального наведения семантических компонентов указывал еще Г. Пауль, выделявший два типа окказионального употребления слова (1960, с. 101): когда окказиональное значение представляет собой часть узуального и когда оно содержит в себе и «нечто большее». И.В. Сентенберг (1975) подразделяет наводимые контекстом семы на два типа – «смысловые» и «эмоционально-экапресоивные коннотации». Подобное разделение весьма существенно, хотя во многих случаях отделить наведенные денотативные семы от коннота-тив:ных довольно трудно.

Денотативные семы наводятся в следующих примерах:

Наконец, к ночи определили в поездку по обмену опытом животноводов Кукушкина Л.Д. и Кулешова А.В. При Кукушкине и Кулешове послали непьющего агронома Василькову (В. Орлов. Альтист Данилов). Наводится сема «пьющие».

– Как же так? От воспаления легких [умерла]? – Скрытое было. На рентгене не видно. – Да, я знаю. Как же ее не просветили? Есть же техника! Алена стукнула кулачком по парте (Э. Пашнев. Белая ворона). Наводится сема «совершенная, эффективная».

А у твоего Салтыкова самое красное слово – дело. Он работник (В. Еременко. Слепой дождь). Наводится сема «надежный, ответственный».

Я научу вас мыслить, лентяи! – кричала она. Лицо ее становилось малиновым. – Я сделаю из вас математиков! (О. Астахова. Испанец Иванов). Наводится сема «знающий, квалифицированный».

Примеры наведения коннотативных сем:

– Быстрей, мужики! – Забегали! – обернулся Руцких. – У него кто хошь забегает, – отозвался Родион. – Агитатор! Старшой из него получится (В. Чивилихин. Елки-моталки). Наводится положительно-оценочная сема.

Сильва. ...Сердечно поздравляю, мы опоздали на электричку. Брр! Джентльмены! Провожание устроили! Обормоты! (А. Вампилов. Старший сын). Наведены презрительно-эмоциональная и неодобрительно-оценочная семы.

Наведение коннотативных «сем происходит в тех случаях, когда в структуре значения присутствуют автономные семантические признаки «эмоция» и «оценка»; поскольку данные признаки присутствуют в семантике всех неоценочных полнозначных слов (в оценочных словах есть соответствующие оценочные семы), то коннотативные семы могут быть факультативно наведены в значении любого такого слова – река, стол, дерево, шофер и т.д.

Существует разряд слов, в которых автономный признак «оценка» и «эмоция» предполагает обязательную контекстуальную конкретизацию, т.е. наведение того или иного кон-кретизатора в обязательном порядке. Л.И. Климова выделяет несколько семантических разрядов таких слов: слова, обозначающие степень признака с компонентом «чрезмерность» – гордый, дерзкий, хладнокровный и т.д.; слова с компонентом «действующий в неблагоприятных условиях» – хитрый, хитро, ловкий, ловко, изворотливый и др.; слова с компонентом «рассчитанный на внешний" эффект, показной» – красивый, нарядный, умник; существительные – названия животных или мифологических существ с актуализацией отдельных признаков – бес, черт, дьявол, собака, зубр; слова с суффиксами субъективной оценки – чистенький, глупенький, дурачок, жалконький, слабенький, добренький, улыбочка и др. Л. И. Климова (1975) подчеркивает, что ситуация и контекст полностью определяют ту или иную оце-но"чность таких единиц и эмоциональный заряд их (см. также Смоленская, Давыдов, 1972). В ряде примеров такого типа можно, видимо, говорить о наличии вероятностных коннотативных сем, например у слов с субъективно-оценочными суффиксами: в таких словах коммуникативный акт выявляет ту или иную вероятностную коннотативную сему, в остальных случаях коннотация наводится.

Денотативные и коннотативные семы могут наводиться в значении одновременно. Например:

[Речь идет о мертвом немецком генерале] Чего он приволокся, этот чужеземный генерал, в заснеженную Россию? Почему не принял капитуляцию? Стратег! (В. Астафьев. Где-то гремит война). Наводится денотативная сема «негодный, неумелый» и коннотативные неодобрительные семы.

[Прокурор осматривает место побега уголовников] Прокурор... осмотрел колючую проволоку на заборе, оставшуюся почти не тронутой, произнес в заключение только одно слово: «Специалисты!» – и пошел со двора (П. Нилин. Жестокость). Наведена денотативная сема «квалифицированные, умелые» и неодобрительная оценочная сема.

Наведению тех или иных сем могут способствовать определенные синтаксические конструкции. Так, положительно- оценочные семы наводятся в конструкциях типа она хозяйка! он мастер!; неодобрительные – в конструкциях типа тоже мне муж! тоже мне жизнь! В конструкциях же типа Вот это арбуз! Вот это специалист! могут наводиться как положительно-оценочные, так и неодобрительные семы. В конструкциях идут и идут, платят и платят, просят и просят наводится сема интенсивности. Синонимы в однородном синтаксическом ряду, если в этот ряд включено тематически инородное слово, часто наводят свою интегральную сему в значении этого слова:

Объявление. Фирма добрых услуг принимает заказы на организацию театрализованных представлений. Вы можете вызвать домой мифические персонажи: Деда Мороза, Снегурочку, Хозяйку Медной горы, мастера по ремонту холодильников (Лит. газ., 1983, 1 янв.). Наводится сема «мифический персонаж», которая поддерживается препозитивной вербальной экспликацией.

Наведение семы может быть неоднозначным: – Капитально! – крякнул Грек, не разобрать одобрительно, или нет (Ю. Мушкетик. Позиция). В таких случаях возможны две интерпретации: неясность актуального смысла может быть обусловлена неадекватностью контекста, либо может входить в коммуникативное намерение говорящего.

Укажем, что иногда нельзя провести четкой грани между наведением семы и актуализацией слабых периферийных сем значения. Возможно, что в области слабых периферийных сем мы имеем дело с пограничными между наведением и актуализацией сем случаями.

ЛЕКЦИЯ 3

Учебная презентация

Вопросы:

1) Информационно-поисковые языки (ИПЯ): понятие и структура.

2) Упорядочения лексических единиц ИПЯ.

3) Требования к ИПЯ

Вопрос 1. Информационно-поисковые языки: структура и требования . Наряду с многочисленными естественными языками в человеческом обществе получили большое распространение и различные искусственные языки. Они создаются людьми для решения каких-либо задач в области науки и техники (машинные языки), для общения между людьми (эсперанто, профессиональные диалекты). Среди искусственных языков особое значение занимают информационные языки.

Необходимость создания и использования информационных языков для обработки информации возникла и продолжает углубляться по мере совершенствования информационной технологии в обществе. Машинный язык - это искусственный, формальный язык, предназначенный для записи информации, хранящейся в запоминающем устройстве вычислительных машин, для описания программ (алгоритмов), указывающих очередность и последовательность выполнения команд по вводу данных из запоминающего устройства, переработке и преобразованию поступающей в машину информации.

Для поиска информации разрабатываются и широко применяются такие искусственные языки, как информационно-поисковые. Информационно -поисковый язык (ИПЯ) - искусственная знаковая система, предназначенная для описания (путём индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации.

Структура ИПЯ однотипна с формальной структурой информации и предполагает выделение следующих уровней:

Фонетического;

Лексического;

Синтаксического;

Текстового.

Элементы каждого уровня объединяются в синтагмы и парадигмы.

Фонетический уровень - это алфавит (списка элементарных символов). В ИПЯ для этого применяют символы естественного языка: кириллица, латинский алфавит, арабские и римские цифры, знаки пунктуации.

Лексический уровень или словарный запас - совокупность всех употребляемых в ИПЯ лексических единиц. Лексическая единица - наименьшая осмысленная последовательность знаков, задаваемая при конструировании отдельных слов языка. Лексические единицы и образуют лексику языка.

Вопрос 2. Упорядочение лексических единиц ИПЯ . Для упорядочения лексических единиц ИПЯ служат парадигматические отношения, которые фактически определяют и задают структуру языка.

Парадигматические отношения (аналитические) - это внетекстовые, объективно существующие смысловые отношения между лексическими единицами, которые устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска. Парадигматические отношения учитывают сходство или различие в объеме и содержании лексических единиц (понятий). Отношения делятся на: сильные (логические) и слабые (ассоциативные).



Объем понятия - множество предметов, отображенных в данном понятии. Например, "периодические издания" включает газеты, журналы. Количество предметов, входящих в объем, может быть конечным (части света), бесконечным (число), существуют единичные понятия (Луна).

К сильным (логическим) парадигматическим отношениям относятся:

· Эквивалентности (равнозначности) - отношения между понятиями, объемы которых совпадают, но в содержании имеются различия. Например, документ печатный - документ опубликованный; документ рукописный - документ неопубликованный.

· Подчинения - отношения между понятиями, когда объем одного или нескольких понятий входит в объем другого. Например, вторичные документы (род) включают аннотации, рефераты (виды).

· Соподчинения - между видовыми понятиями, в равной степени подчиненными одному родовому. Например, книга, брошюра, листовка - виды непериодических изданий.

· Перекрещивания - между понятиями, содержание которых различно, но объемы частично совпадают. Например, студенты и туристы, писатели и ученые.

· Противоположности - между соподчиненными понятиями, которые в своем содержании имеют несовместимые признаки, обуславливающие несовпадение объемов. Например, документы текстовые и документы машиночитаемые.

· Противоречия (контрадикторности) - между двумя соподчиненными понятиями, видовые признаки которых несовместимы, что обуславливает несовпадение объемов этих понятий. Эти понятия исключают друг друга. Например, документы первичные и документы вторичные.

Слабые (ассоциативные) парадигматические отношения выражают связи не между понятиями, а между самими предметами (технологические, причинно-следственные, системно-элементные). При создании ИПЯ целесообразно фиксировать следующие ассоциативные отношения:

· Целое - часть (Справочно-поисковый аппарат и каталоги, картотеки).

· Система - элемент (Архивная отрасль Беларуси и Национальный исторический архив).

· Отношения детерминации: причина - следствие (Старение публикаций и снижение спроса).

· Процесс - оборудование (Ксерокопирование и ксерокс).

· Процесс - материал (Ксерокопирование и бумага).

· Материал - изделие (Древесина и бумага).

· Изделие - процесс изготовления (Документ и документирование).

· Предмет - назначение (Магнитные диски и запись информации).

· Наука - объекты изучения (Информатика и информация).

· Наука - представители (Философия и Сократ).

Парадигматические отношения позволяют объединять лексические единицы ИПЯ в семантические группы - парадигмы , элементы которых обладают свойством взаимозаменяемости.

Кроме парадигматических отношений существуют синтагматические (синтаксические, грамматические, текстуальные) отношения , служащие для установления семантических связей между лексическими единицами. Речь идет о правилах образования и правилах интерпретации ИПЯ. Правила образования устанавливают, какие комбинации элементарных символов допускаются при построении слов и выражений, а правила интерпретации - как надлежит понимать эти слова и выражения.

Средства выражения синтагматических отношений называют грамматикой ИПЯ. ИПЯ должен располагать лексико-грамматическими средствами, необходимыми для выражения основного смыслового содержания любого текста и смысла любого информационного запроса по данной отрасли или предмету, быть недвусмысленным (допускать одно истолкование каждой записи), удобным для алгоритмического сопоставления и отождествления (полного или частичного) записей основного смыслового содержания текстов и смыслового содержания информационных запросов.

Одной из основных характеристик ИПЯ является семантическая сила - возможность передавать полно и точно содержание сообщений.

Вопрос 3. Требования к ИПЯ . При разработке конкретного ИПЯ учитываются:

Специфика отрасли или предмета, для которой этот язык создаётся,

Особенности текстов, образующих поисковый массив,

Характер информационных потребностей, для удовлетворения которых создается язык.

В большинстве ИПЯ основной словарный состав (лексика) задаётся его перечислением и представляет собой фрагмент лексики того или иного естественного языка. Отобранные из естественного языка слова и словосочетания, в совокупности образующие основной словарный состав, служат как бы алфавитом данного ИПЯ. Правила образования в таких языках выполняют функцию синтаксиса. В некоторых ИПЯ основной словарный состав задаётся (полностью или частично) методом порождения, который заключается в том, что для таких ИПЯ правила образования устанавливают, как из данного алфавита строить слова ИПЯ, а из этих слов - выражения (фразы) и какие из них будут правильно построенными. ИПЯ отличается от информационного языка и от машинного. В середине 20 в. в качестве ИПЯ широко применялись библиотечно-библиографические классификации и классификации дескрипторного типа).

Главная отличительная особенность ИПЯ - простота лексики и грамматики по сравнению с теми же элементами естественного языка. Требования, предъявляемые к ИПЯ : однозначность, точность и недвусмысленность семантики (каждая запись ИПЯ должна иметь точно определенное и одно-единственное значение); большая семантическая сила (словарь должен включать все термины, необходимые для индексирования документов и запросов); удобство для пользования; простота и немногочисленность грамматических средств.

КЛАССИФИКАЦИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ЯЗЫКОВ

Учебная презентация

Вопросы:

1) Типы и виды ИПЯ.

2) ИПЯ дескрипторного типа.

3) Методика построения и грамматика ИПЯ дескрипторного типа.

Вопрос 1. Типы и виды ИПЯ. В настоящее время существует множество типов и видов ИПЯ. Наиболее распространенными подходами к классификации ИПЯ являются: классификация Ф.Ланкастера, классификация ВИНИТИ, классификация ЛГИК им. Н.К.Крупской. Последняя классификация представляется наиболее логичной. В ее основу положены три видообразующих признака, учитывающих основные структурные элементы языка: лексику, парадигматику и синтагматику. К этим признакам относятся способ задания лексических единиц, способ кодирования (сочетания) лексических единиц и способ учета парадигматических отношений. Принимается во внимание и возможность автоматизированного поиска.

1) По способу задания лексических единиц: контролируемые и неконтролируемые. Контролируемые ИПЯ - языки, лексика которых задается заранее с помощью словарей и таблиц (УДК, ББК). Неконтролируемые ИПЯ - языки, лексика которых не задается словарем, а строится на основе выбора неограниченного множества терминов естественного языка из индексируемых сообщений.

2) По координации лексических единиц (способу записи): некоординируемые и координируемые. Некоординируемые ИПЯ - языки, не допускающие координации своих лексических единиц ни в процессе индексирования, ни в процессе поиска. Координируемые ИПЯ - языки, в которых лексические единицы координируются между собой или в процессе индексирования, или в процессе поиска. Различают Предкоординируемые и посткоординируемые ИПЯ. Предкоординируемые языки устанавливают порядок записи лексических единиц в процессе индексирования по заранее определенным правилам и предусматривается их жесткая последовательность. Как правило, используются в ручном поиске. Посткоординируемые ИПЯ - языки, в которых лексические единицы задаются в процессе индексирования и сочетаются между собой только в процессе поиска.

3) С учетом и без учета парадигматических отношений: иерархические, фасетные и неиерархические. Языки иерархической структуры представляют собой иерархическую классификацию - систему классов, по которым распределяются понятия на основании наиболее существенных признаков, присущих этим понятиям и отличающих их друг от друга. Класс - совокупность объектов, имеющих один или несколько общих содержательных признаков. Недостаток - невозможность организации внеиерархических связей (иерархическая модель данных - невозможность перекрестных запросов).

Пример иерархической классификации:

1. Документы

1.1 Иконические

1.2 Идеографические

1.3 Текстовые

1.3.2 Вторичные

Языки фасетной структуры представляют собой фасетную классификацию - совокупность фасетов, следующих друг за другом в определенной последовательности. В основе построения такой классификации лежит индуктивный метод, который предполагает исследование отдельных предметов множества, нахождение в них общих существенных признаков и группировку на основе последних терминов, обозначающих эти понятия.

Пример фасетной классификации:

1 Документы по знаковой форме представления информации

1.1 Идеографические

1.2 Иконические

1.3 Текстовые

2 Документы по способу распространения

3 Документы по периодичности изданий

3.1 Непериодические

3.2 Периодические

3.3 Продолжающиеся

Языки неиерархической структуры являются продуктом эмпирического подхода к построению ИПЯ. Такой подход предполагает создание языка на основе индексирования реальных текстов. Из содержания документа выбираются ключевые слова, которые преобразуются в лексические единицы ИПЯ (ТАСТ, алфавитно-предметная классификация).

К специальным неиерархическим ИПЯ с учетом сильных и слабых прардигматических отношений относится дескрипторный язык.

Вопрос 2. ИПЯ дескрипторного типа. Дескрипторные ИПЯ - искусственные информационные языки, появившиеся 1950-ых годах. Возможность и необходимость их создания были вызваны рядом объективных причин. В эти годы были разработаны первые механизированные системы поиска информации и предпринята попытка использования ЭВМ для решения разнообразных информационно-поисковых задач. Традиционные языки предкоординатного тиап не соответствовали требованиям механизированного, а в дальнейшем автоматизированного поиска информации. Интенсивный поиск новых семантических средств привел к созданию принципиально новых ИПЯ посткоординатного типа. Основы индексирования данных языков были заложены в работах М.Тауба и К.Муерса за рубежом и В.П.Черенина в СССР.

М.Тауб в 1951 году разработал ИПЯ унитермов, т.е. неформализованных единичных терминов, перечнем которых можно достаточно полно и точно передать содержание документа и запроса. Координация унитермов происходит в момент поиска сообщения после получения запроса. Однако этот язык не отвечал требованию однозначности. И нуждался в совершенствовании. В своем первоначальном виде ИПЯ унитермов не применяются. Зато широко распространился ИПЯ унитермов с искусственной грамматикой, который принято называть дескрипторным.

Понятие о дескрипторе ввел в информатику К.Муерс. (Дескриптор - позднелат. descriptor, от лат. describо - описываю). Он предложил уитывать синонимию в языке унитермов и применять лексикографический контроль за используемыми ключевыми словами, который заключался в их нормализации и полном устранении неоднозначности и многозначности. К.Муерс считал, что для контроля лексики должен составляться специальный дескрипторный словарь

Таким образом, дескрипторный язык - искусственный язык посткоординатного типа, построенный на безе формализованной лексики естественного языка. Для контроля лексики создается информационно-поисковый тезаурус (ИПТ) - контролируемый словарь лексических единиц дескрипторного языка, основанный на лексике одного естественного языка, отображающий семантические отношения между лексическими единицами и предназначенный для организации поиска информации путем индексирования документов и/или запросов. Каждый конкретный ИПЯ отражает систему понятий предметной области знания в виде структурированной совокупности терминов и является результатом серьезной и трудоемкой работы.

Вопрос 3. Методика построения и грамматика ИПЯ дескрипторного типа. Разработка ИПТ осуществляется на основе следующих этапов:

1) Определение тематического профиля ИПТ. Тематический профиль определяется путем анализа информационных потребностей специалистов отрасли.

2) Сбор лексики и формирование словника ключевых слов. Словник - исходный массив терминов, который потом подвергается семантической обработке в процессе дескрипторизации. Массив формируется путем извлечения первичных, а чаще вторичных документов и ключевых слов. Иногда используются справочная литература, опрос специалистов. Основная проблема на этом этапе формулировка ключевых слов. Служебные слова (предлоги, союзы, частицы) следует считать неключевыми; общие термины (метод, способ и т.п.) необходимо употреблять только в сочетании с другими словами, конкретизирующими их значение. Ключевыми словами могут быть словосочетания.

3) Построение словарных статей и формирование лексико-семантического указателя. Осуществляется дескрипторизация ключевых слов (для составления дескрипторного словаря) и установление прадигматических отношений между дескрипторами (для увеличения семантической силы языка). Устраняется неоднозначность ключевых слов путем снабжения соответствующими пояснениями - реляторами (ЗАПИСЬ – процесс, ЗАПИСЬ – предмет) Все слова группируются в классы эквивалентности: Безусловноэквивалентные (ОПУБЛИКОВАННЫЕ ДОКУМЕНТЫ = ПЕЧАТНАЯ ПРОДУКЦИЯ) и условно-эквивалентные (ТЕХНИЧЕСКИЕ СРЕДСТВА=АППАРАТУРА)

После этого производится выбор одного из слов в качестве дескриптора. Таким образом, дескриптор - лексическая единица ИПТ, под которой принято понимать нормализованное слово или словосочетание, выбранное из множества условно-эквивалентных ключевых слов для его обозначения. Свойства дескриптора:

§ Полнота выражения смыслового значения данного класса.

§ Краткость и понятность.

§ Частота встречаемости термина в текстах документов и запросов.

Аскриптор - лексическая единица ИПТ, входящая в класс эквивалентности данного дескриптора, которая при индексировании документов и запросов подлежит замене на дескриптор. Результат дескрипторизации: дескрипторный словарь – алфавитный перечень дескрипторов и аскрипторов. Например:

Архивные службы

Архивные учреждения

Архивные центры

Статьи аскрипторов снабжаются отсылками на заменяющие их дескрипторы. Стандарт предлагает три типа отсылок:

1. Аскриптор – синоним дескриптора:

Первичные издания

см ПЕРВИЧНЫЕ ДОКУМЕНТЫ

2. Аскриптор, заменяемый комбинацией дескрипторов (используй комбинацию):

Русские тексты

исп к РУССКИЙ ЯЗЫК

3. Аскрипторы, заменяемые несовместимыми дескрипторами (используй альтернативу):

Текущая информация

исп а СВЕДЕНИЯ

§ Логический анализ.

§ Ассоциативный анализ.

§ Прагматический анализ.

Логический анализ – сопоставление объемов понятий, представленных дескрипторами:

вр ОРГАНИЗАЦИОННО_РАСПОРЯДИТЕЛЬНАЯ ДОКУМЕНТАЦИЯ (выше род)

нв ПРИКАЗЫ ПО ЛИЧНОМУ СОСТАВУ (ниже вид)

Ассоциативный анализ – сопоставление признаков предметов, входящих в определенные понятия, представленные дескрипторами.

вц НАУНО-СПРАВОЧНЫЙ АППАРАТ (выше целое)

нч ОТДЕЛ (ниже часть)

Прагматический анализ – упорядочение структуры и состава словарной статьи дескриптора. Учитывает: область ИПТ, терминологические особенности отрасли знания

Структура дескрипторной статьи имеет вид:

Д {Мс; Мв; Мн; Ма}

Д – заглавный дескриптор;

Мс – множество аскрипторов, входящих в класс эквивалентности дескриптора;

Мв – множество вышестоящих дескрпиторов;

Мн – множество нижестоящих аскрипторов;

Ма – множество ассоциативных дескрпиторов.

Например для дескриптора:

с АРХИВНЫЕ СЛУЖБЫ

АРХИВНЫЕ УЧРЕЖДЕНИЯ

в ИНФОРМАЦИОННЫЕ СЛУЖБЫ

н НАЦИОНАЛЬНЫЙ АРХИВ

РЕГИОНАЛЬНЫЙ АРХИВ

а СИСТЕМА АРХИВНОГО ОБСЛУЖИВАНИЯ

Для аскриптора:

АРХИВНЫЕ СЛУЖБЫ

см АРХИВЫ

4) Разработка вспомогательных указателей. Наиболее распространены три типа указателей: систематический указатель дескрипторов тезауруса, указатель иерархических отношений и пермутационный указатель дескрипторов. Систематический указатель – алфавитный список дескрипторов (тематический, категориальный, смешанный). Указатель иерархических отношений - свод классификационных деревьев. Каждый дескриптор может входить при этом более чем в одно дерево. Пермутационный указатель - перечень списков, каждый их которых соответствует одному из знаменательных слов в составе лексической единицы. Предназначен для поиска лексической единицы по отдельным словам.

5) Оформление ИПТ.

6) Экспертиза и регистрация ИПТ.

Основным способом уменьшения информационного шума является введение в ИПЯ грамматических средств, которые позволяют точно и полно выражать синтагматические отношения. Грамматические средства делятся на:

Фрагментирующие. Для разделения поискового образа на части. К ним относятся указатели связи (буквы, цифры, знаки);

Смыслоразличительные. Для указания смысловой роли различительных слов внутри фрагмента поискового образа. К ним относятся указатели роли.

Информационно-поисковые языки

Искусственный язык, предназначенный для формализованного описания смыслового содержания документов, данных, отдельных понятий или терминов и обеспечения последующего их поиска в информационно-поисковых массивах. Формализация лексики и создание различных ИПЯ вызвано необходимостью устранения "избыточности" и "недостаточности" естественного языка для целей информационного поиска, а также ликвидации присутствующий в нем синонимии и омонимии, для реализации "однозначности" информационного поиска .

Информационно-поисковый язык (ИПЯ) - искусственный язык , представляющий совокупность средств для описания формальной и содержательной структуры для поиска (путем индексирования) по запросу пользователя .

Структура

  • Алфавит - совокупность определенных символов для записи слов и выражений. Во многих языках для этого используются символы естественного языка.
  • Лексика - совокупность всех использующихся в языке слов - лексических единиц.

В качестве лексических единиц ИПЯ могут быть использованы:

1. слова, фрагменты слов, словосочетания и выражения любого естественного языка; 2. коды и шифры (цифровые, буквенные, буквенно-цифровые) словосочетаний, слов и выражений, выступающие в роли имён соответствующих классов; 3. шифры и коды в сочетании со словами, словосочетаниями и выражениями.

  • Грамматика - совокупность средств и способов построения, изменения и сочетания лексических единиц. Грамматика это:
1. Морфология – совокупность средств и способов построения и изменения слов. 2. Синтаксис – совокупность средств и способов соединения слов в выражения и фразы.

Для упорядочения лексических единиц при построении лексики служат парадигматические отношения, то есть смысловые отношения между лексическими единицами. Эти отношения устанавливаются и фиксируются в словаре языка, исходя из потребностей информационного поиска.

Типы и виды ИПЯ

Способы задания лексических единиц

I классификация

  1. Контролируемые - языки, словарный состав которых задается и контролируется с помощью словарей и таблиц. К ним относят различные классификации. (Универсальная десятичная классификация , Библиотечно-библиографическая классификация , Классификация Дьюи ).
    1. Язык предметных заголовков (рубрик) . На основе иерархической классификации строят систематические каталоги. На основе языка предметных рубрик строят предметные каталоги. Алфавитные каталоги - ручной поиск.
    2. Дескрипторные ИПЯ , а также язык ключевых слов - автоматический поиск.
  2. Неконтролируемые - лексика не задается словарем, а строится на основе выбора терминов естественного языка. Такие ИПЯ широко начали применяться в последне время.
  1. Перечисление всех лексических единиц ИПЯ. Способ не требует больших интеллектуальных усилий, а процесс построения лексики нельзя автоматизировать. Лексика ИПЯ оказывается жёстко фиксированной и в ряде случаев не позволяет достаточно точно выразить смысловое содержание текстов.
  2. Перечисление части лексических единиц и задание правил формирования из них других лексических единиц. Занимает промежуточное положение и в отношении интеллектуальных усилий, и в отношении автоматизации процессов.
  3. Задание правил построения лексических единиц, слов и выражений естественного языка. Поддаётся полной автоматизации, хотя и требует больших интеллектуальных затрат на определение правил формирования лексики. Однако научный подход к формированию словарного состава делает его более совершенным, обеспечивает единообразие и уменьшает субъективизм при построении лексики.

III Фасетная классификация (классификация двоеточием или классификация Ранганатана)

Это совокупность нескольких независимых классификаций, осуществляемых одновременно по различным основаниям, в которой:

  1. понятия представлены в виде пересечения ряда признаков (фасетной, см. фасет структуры);
  2. классификационные индексы синтезируются посредством комбинирования фасетных признаков в соответствии с фасетной формулой.

Этот способ построения разработан индийским учёным и библиотековедом Ш. Р. Ранганатаном («Классификация двоеточием», 1933). Основой классификации является привычное человеку отнесение объекта к разным категориям (задание множества и его элементов).

Порядок записи лексических единиц

  1. Некоординируемые языки - не допускающие координации своих лексических единиц (нет связи между ними) ни в процессе индексирования, ни в процессе поиска. (система расстановки книг в библиотечном фонде, по инвентарным номерам).
  2. Координируемые ИПЯ - языки, в которых лексические единицы связывается, координируются между собой или в процессе индексирования или в процессе использования.
    1. Предкоординируемые - связи между лексическими единицами устанавливаются перед поиском.
    2. Посткоординируемые - когда связи между лексическими единицами устанавливаются только при поиске.

Типы ИПЯ по сфере (области) применения

  1. Коммуникативные (общесистемные), предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в том числе распределенными по государственной, ведомственной или территориальной принадлежности).
  2. Локальные (внутренние), предназначенные для использования в рамках отдельной системы.
  3. Внешние, используемые в других системах и предназначенные для взаимодействия только с ними.

Виды отношений в ИПЯ

Синтагматические отношения в ИПЯ - линейные отношения между лексическими единицами ИПЯ, устанавливаемые непосредственно при их использовании. Способом выражения синтагматических отношений являются грамматические средства, в качестве которых выступают: мешочная, позиционная грамматика, указатели роли, указатели связи, грамматика логических операторов. Формальным средством выражения синтагматических отношений являются опознавательные, разделительные знаки, а также знаки присоединения.

  1. Мешочная грамматика - один из способов выражения синтагматических отношений в ИПЯ, заключающийся в простом перечислении лексических единиц, входящих в один поисковый образ или поисковое предписание. Порядок следования лексических единиц при этом значения не имеет. Мешочная грамматика используется в словарных ИПЯ.
  2. Позиционная грамматика - один из способов выражения синтагматических отношений в ИПЯ, заключающийся установлении жесткого порядка следования лексических единиц, входящих в один поисковый образ. В классификационных ИПЯ проявляется в использовании классификационной формулы при систематизации и формулы предметных рубрик при предметизации, в ИПЯ координатного типа - в использовании метода стандартных фраз, аспектного метода представления информации.
  3. Указатели роли - один из способов выражения синтагматических отношений в ИПЯ, характеризующий логические связи между лексическими единицами и уточняющий смысловую функцию (роль) каждой лексической единицы в поисковом образе. Указатели роли используются преимущественно в словарных ИПЯ и создаются применительно к конкретным отраслям знания. В классификационных ИПЯ функцию указателей роли выполняют, например, общие определители точки зрения в (УДК). Указатели роли позволяют уменьшать объем понятия, обозначаемого лексической единицей, что дает возможность обеспечить большую точность информационного поиска. Выражаются с помощью букв и цифр.
  4. Указатели связи - один из способов выражения синтагматических отношений в ИПЯ, указывающий на наличие логической связи между лексическими единицами и устраняющий их ложное сочетание в поисковом образе. Указатели связи широко используются в словарных ИПЯ и выражаются с помощью символов, букв или цифр. В классификационных ИПЯ функцию указателей связи выполняет знак квадратные скобки. Указатели связи позволяют исключить информационный шум и обеспечить точность информационного поиска.
  5. Грамматика логических операторов - один из способов выражения синтагматических отношений в ИПЯ, позволяющий осуществлять логическое умножение, сложение и вычитание лексических единиц ИПЯ при построении поискового предписания. Грамматика логических операторов используется в словарных ИПЯ. Служит для уточнения объемов понятий, выражаемых лексическими единицами, с целью обеспечения большей точности информационного поиска.

Семантические отношения - отношения между понятиями в т.н. "семантических сетях". Различают:

  • Лингвистические (соответствующие и взаимоотношению слов в предложении) отношение
  • Теоретико-множественные отношения.
  • Логические отношения.

Парадигматические отношения в ИПЯ - смысловые логические отношения между лексическими единицами ИПЯ, не зависящие от контекста, в котором употребляются. Различают сильные и слабые парадигматические отношения.

Сфера информационно-поисковых систем в филологии. Информационно-исследовательская база данных "Русский Шекспир"

"Информационные проекты в области филологии должны быть направлены на создание инновационного продукта, научных информационно-телекоммуникационных систем и сетей, унифицированной системы научных знаний и технологий, на создание некоторых элементов искусственного интеллекта при построении экспертных систем и баз знаний, информационных сетей коллективного пользования с уникальными научными ресурсами" .

Научные задачи: «Информационно-исследовательской базы данных «Русский Шекспир»

  • создание наиболее обширной библиографии по теме «Русский Шекспир», которая будет в себя включать целый ряд разделов («Переводы произведений Шекспира на русский язык: собрания сочинений и сборники, отдельные произведения», «Критические работы, посвященные творчеству и жизни Шекспира» (проблема авторства, критика отдельных произведений, Шекспир и театр, история шекспироведения, Шекспир и зарубежная литература, Шекспир в России, Пушкин и Шекспир, пародии на произведения и т. д.); исследование и разработка проблем, связанных с вхождением Шекспира в русскую культуру, формированием русской теорией перевода (написание статей и монографий;
  • использование Интернет-ресурсов в преподавании филологических дисциплин, методики перевода, истории театра, кинематографа, мировой художественной культуры, разработка оригинальнспользование Интернет-ресурсов в преподавании филологических дисциплин, методики перевода, истории театра, кинематографа, мировой художественной культуры, разработка оригинального спецкурса «Русский Шекспир».

"Мир Шекспира" имеет 3 основных направления

  • подготовка и сдача в эксплуатацию информационной системы и web-сайта,
  • формирование полнотекстового содержания информационно-исследовательской базы данных «Русский Шекспир»,
  • разработка разнообразных способов просмотра информации, атрибутного информационного поиска, полнотекстового поиска по свободной лексике как на русском языке, так и на английском языке.

Основное значение базы данных

Апробация информационно-исследовательской базы данных "Русский Шекспир"

Информационно-исследовательская база "Русский Шекспир" представляет собой своеобразный информационный центр об Уильяме Шекспире, его произведениях, проблемах изучения его творчества. С одной стороны, база предоставляет посетителю возможность просмотреть собранные в одном месте произведения, пожалуй, самого известного английского писателя, а с другой, предлагает относительно широкий охват работ разных направлений, так или иначе связанных с творчеством У. Шекспира. На ресурсе представлены, в основном, тексты отечественных исследователей и авторов (что, в принципе, логично соотносится с названием базы).

Произведения У. Шекспира расположены здесь в различной форме (раздел: «В русских переводах») в зависимости от размера часть из них расположена непосредственно на сайте (например, сонеты, перевод которых представлен в сопровождении оригинала. Таким образом, оба текста располагаются в максимальной доступности), часть (некоторые пьесы) представлена в формате pdf. Представленные переводы принадлежат разным авторам и времени. Самые ранние переводные тексты произведений на ресурсе датируются 1899 годом (например, «Гамлет» в пер. А. Кронеберга, «Ромео и Джульетта» в пер. Д. Михаловского, «Ричард III» в пер. А. Дружинина и др.), и в них сохранен оригинальный дореволюционный стиль.

В другом разделе – «В научной и театральной критике», представлены перечни научных монографий исследователей творчества У. Шекспира, научных сборников, предисловия и вступительных статей к изданиям разного времени, рецензий на книги о писателе и его произведениях, спектакли (причем как центральных театров России, так и малых, провинциальных), аннотации на выходящие издания.

На ресурсе можно найти творческие работы на темы шекспировских произведений, а также отражающие восприятие личности самого автора (Раздел: «В оригинальном творчестве»). Это различные работы вдохновленных читателей, поклонников и просто неравнодушных: стихотворения, рисунки, фото, произведения прикладного искусства. Здесь также представлено творчество современников У. Шекспира и цитаты его/из него/о нем.

Одним из самых полезных для научных исследователей творчества У. Шекспира является раздел «Bibliographia», в котором представлен перечень работ и произведений по следующим направлениям: переводы и переделки произведений на русский язык с 1748 года, история шекспироведения (в том числе переводы и оценка драматурга в разные периоды (Просвещение) и в разных странах (США, Западная Европа, Германия), русская критика У. Шекспира XVIII-XIX вв., проблема авторства, влияние У. Шекспира на литературу других стран, У. Шекспир и А. Пушкин, а также художественная литература и публицистика (пародии, фельетоны, юморески по мотивам произведений, рецензии на художественные произведения о писателе). Еще одним полезными разделами окажутся: «Personalia», который не даст запутаться в многочисленных фамилиях современников У. Шекспира и тех, кто изучал и изучает его творчество задолго после его жизни. И «Шекспир в Интернете», где представлены ссылки на русскоязычные, украиноязычные и англоязычные ресурсы.

Необходимо отметить, что все перечни литературы снабжены выходными данными, что значительно облегчает поиск нужной информации.Стоит также упомянуть, что, не смотря на значительный объем информации, интерфейс ресурса сделан достаточно удобным и логичным, что также облегчает работу с данными, содержащимися в базе.

Разработчики ставили перед собой задачи создания обширной библиографии по теме «Русский Шекспир» и внедрение базы в преподавание в различных сферах. Конечно, ресурс получился так или иначе в большей степени направлен на филологов и литературоведов. Однако, если информация, скажем об оценке выходящих спектакля и фильмах, будет пополняться, то ресурс (как источник информации) станет более полезен и другим направлениям, в данном случае театроведам и представителям творческих специальностей: режиссерам, сценаристам и актерам.