Моделирование рассуждений. Опыт анализа мыслительных актов - Дмитрий Поспелов
Шрифт:
Интервал:
Закладка:
8. Продукции типа ARBR. Это внутренние продукции рассуждающей системы. Они описывают промежуточные шаги процесса вывода и не влияют непосредственно на содержимое базы знаний и состояния внешнего мира. Эти продукции описывают единичные шаги многошаговых процессов рассуждений.
9. Продукции типа АКВК. Они описывают процедуры преобразования знаний в базе знаний: обобщение знаний, получение новых знаний из ранее известных с помощью логического вывода, установление закономерностей между знаниями на основании обработки сведений о единичных фактах, хранящихся в базе знаний, и т.п. Рассуждающая система в этом случае используется лишь в качестве инструмента, с помощью которого происходит изменение состояния базы знаний.
Сказанное наводит на мысль, что продукции могут иметь весьма различное значение. В качестве их левых и правых частей могут выступать и некоторые утверждения, и действия. Возможны не только те интерпретации, которые мы привели выше, но и ряд других. Например, продукции типа AWBK можно трактовать как способ описания шагов общения между пользователем и системой в диалоговом режиме. Тогда AW будет интерпретироваться как вопрос пользователя, а ВK – как ответ системы. При смене спрашивающего и отвечающего надо использовать для описания шага диалога продукции типа AKBW.
Продукционной системой будем называть любую совокупность продукций, в которую могут входить продукции любого из перечисленных выше типов.
Часто вместо продукций типа ?? рассматривают более сложные конструкции. В общей форме продукции имеют вид
i, П, P, A B, Q.
Здесь АВ – обычная продукция «Если …, то …», которая носит название ядра продукции. Элемент Р характеризует внешние условия или условия применимости продукции, определяемые факторами, не входящими непосредственно в А, например целями, которые стоят перед рассуждающей системой. Условия Р позволяют из всех продукций, у которых в левой части ядра стоит А, отбирать нужную часть продукций.
Элемент П характеризует сферу проблемной области базы знаний или предусловия применимости продукции. Эти предусловия ничем не отличаются от Р, но выделяют подсистемы продукций на ранг выше тех, которые выделяют условия. Предусловия задают формальную систему, в рамках которой будут проводиться логические рассуждения. Поясним эту мысль на примере. В обычном мире лошади не летают. Поэтому продукция «Если х лошадь, то она летать не может» в обычном мире всегда имеет место. Но если мы от обычного мира перейдем к миру греческих мифов, то продукция «Если лошадь есть Пегас, то она летает» станет верной. В мире же русской сказки продукция «Если лошадь есть Конек-Горбунок, то она летает» принимается без всякой критики. В приведенном примере предусловия П должны развести между собой обычный мир, мир греческих мифов и мир русской сказки.
Наконец, Q характеризует постусловия продукции, указывающие на те изменения, которые необходимо внести в базу знаний и в систему продукций после реализации данной продукции. Операторы A(q) и E(q), рассмотренные при описании химических реакций, являются примером таких постусловий.
Однако в общем виде продукции встречаются весьма редко. Предусловия характерны лишь для больших по объему и разнородных по составу баз данных и знаний, а постусловия – для планирующих систем роботов, когда используются продукции типа ARBW.
Если продукционная система такова, что на некотором шаге процесса может быть реализована не одна продукция, а несколько, то возникает ситуация, в которой необходимо уметь управлять ходом процесса. Эта ситуация настолько важна и принципиальна, что мы посвятим ее анализу специальный раздел. Именно в этом анализе раскрываются особенности использования продукций для моделирования рассуждений.
Управление выводом
Несколько изменим предшествующий рисунок. Будем считать, что информация из внешнего мира W поступает в базу знаний К, минуя рассуждающую систему R. Это позволит нам рассматривать лишь продукции типа АКВК. Не будем пока учитывать предусловия и условия. Все условия применимости продукций сосредоточим в А, а В будем трактовать как внесение некоторых изменений в базу знаний. Таким образом, как условия активизации продукции, так и результат ее выполнения связаны с информацией, хранящейся в базе знаний. Будем считать также, что интеллектуальная система функционирует в некоторые дискретные моменты времени t. В эти моменты времени в базу знаний из внешнего мира может поступать некоторая информация. В эти же такты времени происходит проверка выполнения условий срабатывания продукций.
Последнее допущение позволяет ввести понятие состояния базы знаний в момент времени t, которое будем обозначать dt. Одно состояние может смениться другим по двум причинам. В момент t+1 из внешнего мира в базу знаний может прийти новая информация. Или в этот момент времени в базу знаний будет занесена новая информация, возникающая в результате срабатывания некоторой продукции.
Если в некоторый момент t состояние dt таково, что в нем удовлетворяются условия для некоторого множества продукций, то все они образуют фронт готовых продукций. Основная задача управления состоит в выборе из этого фронта очередной продукции для исполнения.
Для выбора важен вопрос о влиянии порядка выбора на окончательный результат рассуждений. Если имеются две продукции и ситуация такова, что изменение состояния базы знаний, которое может возникнуть при срабатывании одной из них, сказывается на выполнимости условий срабатывания для другой, то такие продукции естественно назвать зависимыми. Если две продукции независимы, то порядок их выбора из фронта не может сказаться на результате рассуждения. Поэтому интерес представляют лишь зависимые продукции.
Как осуществлять выбор в этом случае? Для пояснения складывающейся ситуации рассмотрим следующий пример. Только что кончилась лекция, наступил двухчасовой перерыв и группа студентов обсуждает проблему: куда сейчас пойти? В имеющихся условиях есть две альтернативы: пойти в кино (но никто не знает, какая там идет картина) или пойти в кафе-мороженое (но ни у кого нет уверенности, что кафе работает). Ясно лишь одно, что выбор одного варианта исключает выбор другого, так как кино и кафе-мороженое находятся в разных концах города. Убедившись, что кафе не работает, нет надежды успеть в кино, а обнаружив, что в кино ничего интересного не идет, нет надежды поесть мороженое. В условиях, когда никто из студентов не имеет никакой информации о кино и кафе, единственным разумным способом выбора является известное бросание монетки, т.е. случайный выбор. Но если в момент обсуждения появляется их сокурсник, который говорит, что только что был в кино и ушел, не досмотрев скучную картину (тем самым он меняет состояние «баз знаний» остальных студентов), то выбор активизируемой «продукции», соответствующей программе достижения кафе-мороженого, станет однозначным.
Описанная ситуация является в некотором смысле экстремальной. Один выбор исключает другой. Чаще это не так – после неудачного выбора можно вернуться к альтернативному выбору и попробовать другой вариант. Чтобы так можно было делать в процессах рассуждений, необходимо сохранять состояние базы знаний в момент выбора. Для реализации этого при принятии решения об альтернативном выборе можно, например, запоминать не всю информацию, имеющуюся в данный момент в базе знаний, а только ту ее часть, которая меняется в результате применения продукций из выбранного варианта. Если вариант окажется удачным, то новое состояние базы знаний будет сформировано на основе полученной в ходе проверки варианта информации. Если попытка окажется безрезультатной, то произойдет возвращение к состоянию базы знаний в момент выбора, а информация, полученная в ходе плохого варианта, сотрется из памяти. Практически все системы моделирования рассуждений в интеллектуальных системах используют этот прием, который называется «бэктрекинг».
Но в любом случае остается проблема выбора продукции из готового фронта. Психологов весьма интересует вопрос, как это делают люди. К сожалению, однозначного ответа на этот вопрос пока нет. При экспериментах с программой «Логик-теоретик» ее авторы проводили сравнение работы программы с тем, как ведут себя в многочисленных возникающих по ходу доказательства случаях альтернативного выбора люди. В частности, последовательность, в которой перечислены различия в формулах, используемая для выбора преобразований в программе «Логик-теоретик», отражает экспериментально наблюдаемые приоритеты, демонстрируемые людьми.